21 lines
785 B
Markdown
21 lines
785 B
Markdown
Установка зависимостей
|
|
1. Клонируем репозиторий (bash)
|
|
git clone https://gitea.de-infra.servehttp.com/gsavelev/pyspark.git
|
|
cd pyspark
|
|
2. Создаем и активируем виртуальное окружение (Python 3.10+)
|
|
python -m venv pyspark_env
|
|
source pyspark_env/bin/activate # Linux / WSL
|
|
Windows CMD: pyspark_env\Scripts\activate.bat
|
|
Windows PowerShell: pyspark_env\Scripts\Activate.ps1
|
|
3. Устанавливаем зависимости
|
|
pip install -r requirements.txt
|
|
4. Требования
|
|
Python 3.10+
|
|
Java JDK 11+
|
|
PySpark 4.0.1 (requirements.txt)
|
|
5. Проверка версий
|
|
python --version
|
|
pip show pyspark
|
|
java -version
|
|
6. Запуск
|
|
python main.py |