Files
pyspark/README.md
2026-02-24 07:33:21 +03:00

785 B

Установка зависимостей

  1. Клонируем репозиторий (bash) git clone https://gitea.de-infra.servehttp.com/gsavelev/pyspark.git cd pyspark
  2. Создаем и активируем виртуальное окружение (Python 3.10+) python -m venv pyspark_env source pyspark_env/bin/activate # Linux / WSL Windows CMD: pyspark_env\Scripts\activate.bat Windows PowerShell: pyspark_env\Scripts\Activate.ps1
  3. Устанавливаем зависимости pip install -r requirements.txt
  4. Требования Python 3.10+ Java JDK 11+ PySpark 4.0.1 (requirements.txt)
  5. Проверка версий python --version pip show pyspark java -version
  6. Запуск python main.py