Установка зависимостей 1. Клонируем репозиторий (bash) git clone https://gitea.de-infra.servehttp.com/gsavelev/pyspark.git cd pyspark 2. Создаем и активируем виртуальное окружение (Python 3.10+) python -m venv pyspark_env source pyspark_env/bin/activate # Linux / WSL # Windows CMD: pyspark_env\Scripts\activate.bat # Windows PowerShell: pyspark_env\Scripts\Activate.ps1 3. Устанавливаем зависимости pip install -r requirements.txt 4. Требования Python 3.10+ Java JDK 11+ PySpark 4.0.1 (requirements.txt) 5. Проверка версий python --version pip show pyspark java -version 6. Запуск python main.py