Files
pyspark/README.md
2026-02-24 07:09:37 +03:00

21 lines
789 B
Markdown

Установка зависимостей
1. Клонируем репозиторий (bash)
git clone https://gitea.de-infra.servehttp.com/gsavelev/pyspark.git
cd pyspark
2. Создаем и активируем виртуальное окружение (Python 3.10+)
python -m venv pyspark_env
source pyspark_env/bin/activate # Linux / WSL
# Windows CMD: pyspark_env\Scripts\activate.bat
# Windows PowerShell: pyspark_env\Scripts\Activate.ps1
3. Устанавливаем зависимости
pip install -r requirements.txt
4. Требования
Python 3.10+
Java JDK 11+
PySpark 4.0.1 (requirements.txt)
5. Проверка версий
python --version
pip show pyspark
java -version
6. Запуск
python main.py