Apache Spark 3.3.0,Apache Hadoop 3.0.0 のインストール(Windows 上)
Apache Maven のインストール手順は, https://maven.apache.org/install.html の記載による.
ソフトウェアの利用条件等は,利用者で確認すること.
前準備
Python 3.10,Git のインストール(Windows 上)
Pythonは,プログラミング言語の1つ. Gitは,分散型のバージョン管理システム.
【手順】
- Windows で,コマンドプロンプトを管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択)
- 次のコマンドを実行
次のコマンドは,Python ランチャーとPython 3.10とGitをインストールし,Gitにパスを通すものである.
次のコマンドでインストールされるGitは 「git for Windows」と呼ばれるものであり, Git,MinGW などから構成されている.
winget install --scope machine Python.Launcher winget install --scope machine Python.Python.3.10 winget install --scope machine Git.Git powershell -command "$oldpath = [System.Environment]::GetEnvironmentVariable(\"Path\", \"Machine\"); $oldpath += \";c:\Program Files\Git\cmd\"; [System.Environment]::SetEnvironmentVariable(\"Path\", $oldpath, \"Machine\")"
【関連する外部ページ】
- Python の公式ページ: https://www.python.org/
- Git の公式ページ: https://git-scm.com/
【サイト内の関連ページ】
【関連項目】 Python, Git バージョン管理システム, Git の利用
numpy のインストール(Windows 上)
- Windows では,コマンドプロンプトを管理者として実行する.
- numpy のインストール
python -m pip install -U numpy
JDK (Java Development Kit) 21 のインストール(Windows 上)
JDK (Java Development Kit)
JDK (Java Development Kit) の主な機能:コンパイラ,仮想マシン,ツール,ライブラリ
JDK 22, 21, 17, 11, 8u がリリースされている(2024年8月時点)(https://www.oracle.com/jp/java/technologies/javase/jdk-faqs.html)
winget を用いたインストールコマンド,Oracke JDK 21 のインストール: winget install --scope machine Oracle.JDK.21
【関連する外部ページ】
- JDK の公式ダウンロードページ: https://www.oracle.com/java/technologies/downloads/
【サイト内のJava 関連ページ】
- Java プログラミング: 別ページ »にまとめ
【関連項目】 JDK (Java Development Kit) 21 のインストール(Windows 上), Java のバージョンの確認,コンパイル,実行
- Windows で,コマンドプロンプトを管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択)
- 次のコマンドを実行
次のコマンドは,JDK (Java Development Kit) 21をインストールするものである.
winget install --scope machine Oracle.JDK.21
* OpenJDK のライセンスは,利用者自身で確認すること.
Apache Maven のインストール
Windows での Apache Maven のインストール: 別ページ »で説明
winutils のインストール
winutils のページ: https://github.com/steveloughran/winutils
- Windows で,コマンドプロンプトを管理者権限で起動する(例:Windowsキーを押し,「cmd」と入力し,「管理者として実行」を選択).
コマンドプロンプトを管理者として実行: 別ページ »で説明
- 次のコマンドを実行する.
cd C:\ rmdir /s /q winutils git clone --recursive https://github.com/steveloughran/winutils cd winutils\hadoop-3.0.0\bin
- 環境変数 HADOOP_HOME に「c:\winutils\hadoop-3.0.0」を設定する
- 環境変数 PATH に,「c:\winutils\hadoop-3.0.0\bin」を追加する.
Apache Spark のインストールとテスト実行(Windows 上)
- 次のページからダウンロードして展開.
- 環境変数 SPARK_HOME を設定する.
- 環境変数 PATH に,「%SPARK_HOME\bin」を追加する.
- 確認のため,Apache Spark の Python シェルを起動し,簡単なプログラムを動かしてみる.
.\bin\pyspark spark.range(1000 * 1000 * 1000).count()