Zakładając, że masz już zainstalowany Apache Spark, a teraz chcesz zacząć na nim własne eksperymenty, to pewnie przydałoby się jakieś „lekkie” środowisko – miminum z działającym Jupyter Notebook. Oto moja propozycja
W wybranym katalogu utwórz środowisko wirtualne
python -m venv venv
Aktywuj je
.\venv\scripts\activate
Zainstaluj moduły
pip install findspark
pip install pyspark
pip install jupyter
Uruchom Jupyter Notebook
jupyter notebook