ディープラーニング応用ライブラリの導入
【概要】顔認識、姿勢推定、文字認識など、特定のタスクに特化したライブラリのインストール手順を示す。Dlibによる顔検出、OpenPoseによる人体姿勢推定、Tesseract OCRによる文字認識など、実用的なアプリケーション開発に直結するツール群を必要に応じて導入できる。すべてをインストールする必要はなく、目的に応じて必要なものを選択する。
【目次】
- AIプログラミング開発環境クイックスタートガイド
- ニューラルネットワークの基礎知識
- Windowsの基本操作ガイド
- Windows環境の最適化と開発支援ツール
- CMakeのインストール(ソースコードからのビルド用)
- GPU環境の構築(NVIDIAドライバ・CUDA・cuDNN)
- Python開発環境の拡張とライブラリ導入
- TensorFlowのインストールとGPU設定
- ディープラーニング応用ライブラリの導入
注意事項
- このページで紹介するソフトウェア等の利用条件は各自で確認すること
- ダウンロード時には、ダウンロード元のURLを確認する
- マルウェア(コンピュータウイルス)の感染防止のため、ダウンロードしたファイルはウイルスチェックする
【サイト内の関連ページ】
まとめページ
- 種々のまとめページ: [人工知能、データサイエンス、データベース、3次元]、[Windows]、[Ubuntu]、[Python(Google Colaboratoryを含む)]、[C/C++言語プログラミング用語説明]、[Rシステムの機能]、[Octave]
Windows関連
1. AIプログラミング開発環境クイックスタートガイド
目標
本章の目標は、自身のパソコンでAIプログラミングの実行と実験が可能な環境を構築することである。本章を完了すると、さまざまなAIプログラムを動作させたり、ソースコードの確認や修正ができる環境が整う。
1.1 Pythonの役割
PythonはAIプログラミングにおいて広く利用されているプログラミング言語である。機械学習やディープラーニングのライブラリが豊富であり、初学者にも扱いやすいという特徴がある。
1.2 AIプログラミングにおける開発環境の全体像
- Python本体:プログラミング言語
- 7-Zip:ファイルの圧縮・展開を行うツール
- Git:GitHubなどのサイトからAIプログラムのファイルを取得するためのバージョン管理ツール。多くのAIプロジェクトがGitHub上で公開されており、Gitを使用してこれらのプロジェクトを取得できる
- Visual Studio 2022 Build Tools とランタイム:C++コンパイラと関連ライブラリ
- NVIDIA CUDA:NVIDIA GPU上で並列計算を実行するためのプラットフォーム。GPU(Graphics Processing Unit)は並列計算能力を持つプロセッサであり、ディープラーニングの高速化に活用される
- PyTorch:研究分野で広く使用される深層学習フレームワーク
- 開発エディタ:コードの作成と編集を行うツール(例:Windsurf、Cursor、Visual Studio Code)
1.3 実行前の確認事項
- ディスク空き容量が20GB以上あることを確認する
- すでにPythonがインストール済みの場合は、基本的にそのまま使用する
1.4 ソフトウェアのインストール(Windows)
Windowsでは、wingetというWindowsの公式パッケージ管理ツールを用いて多くのソフトウェアをインストールできる。管理者権限で実行し、システム全体にインストールすることを推奨する。
管理者権限でコマンドプロンプトを起動(手順:Windowsキーまたはスタートメニュー → cmdと入力 → 右クリック → 「管理者として実行」)し、以下を実行する。管理者権限は、wingetの--scope machineオプションでシステム全体にソフトウェアをインストールするために必要である。
REM Python をシステム領域にインストール
winget install --scope machine --id Python.Python.3.12 -e --silent --accept-source-agreements --accept-package-agreements
REM パス長制限の解除
reg add "HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem" /v LongPathsEnabled /t REG_DWORD /d 1 /f
reg query "HKLM\SYSTEM\CurrentControlSet\Control\FileSystem" /v LongPathsEnabled
REM Python のパス設定
set "PYTHON_PATH=C:\Program Files\Python312"
set "PYTHON_SCRIPTS_PATH=C:\Program Files\Python312\Scripts"
echo "%PATH%" | find /i "%PYTHON_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%PYTHON_PATH%" /M >nul
echo "%PATH%" | find /i "%PYTHON_SCRIPTS_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%PYTHON_SCRIPTS_PATH%" /M >nul
REM 7-Zip をシステム領域にインストール
winget install --scope machine --id 7zip.7zip -e --silent --accept-source-agreements --accept-package-agreements
REM 7-Zip のパス設定
set "SEVENZIP_PATH=C:\Program Files\7-Zip"
if exist "%SEVENZIP_PATH%" echo "%PATH%" | find /i "%SEVENZIP_PATH%" >nul
if exist "%SEVENZIP_PATH%" if errorlevel 1 setx PATH "%PATH%;%SEVENZIP_PATH%" /M >nul
REM Git をシステム領域にインストール
winget install --scope machine --id Git.Git -e --silent --accept-source-agreements --accept-package-agreements
REM Git のパス設定
set "GIT_PATH=C:\Program Files\Git\cmd"
if exist "%GIT_PATH%" echo "%PATH%" | find /i "%GIT_PATH%" >nul
if exist "%GIT_PATH%" if errorlevel 1 setx PATH "%PATH%;%GIT_PATH%" /M >nul
REM Visual Studio 2022 Build Toolsとランタイムのインストール
winget install --scope machine --wait --accept-source-agreements --accept-package-agreements Microsoft.VisualStudio.2022.BuildTools Microsoft.VCRedist.2015+.x64
REM インストーラーとインストールパスの設定
set VS_INSTALLER="C:\Program Files (x86)\Microsoft Visual Studio\Installer\vs_installer.exe"
set VS_PATH="C:\Program Files\Microsoft Visual Studio\2022\BuildTools"
REM C++開発ワークロードのインストール(次のコマンドは1行で入力する)
%VS_INSTALLER% modify --installPath %VS_PATH% --add Microsoft.VisualStudio.Workload.VCTools --add Microsoft.VisualStudio.Component.VC.Tools.x86.x64 --add Microsoft.VisualStudio.Component.Windows11SDK.22621 --includeRecommended --quiet --norestart
REM CUDAをシステム領域にインストール
winget install --scope machine --accept-package-agreements --accept-source-agreements -e Nvidia.CUDA Microsoft.VCRedist.2015+.x64
REM CUDA のパス設定
set "CUDA_PATH=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6"
if exist "%CUDA_PATH%" setx CUDA_PATH "%CUDA_PATH%" /M >nul
if exist "%CUDA_PATH%" setx CUDNN_PATH "%CUDA_PATH%" /M >nul
REM PyTorch をインストール
pip install -U torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
REM Windsurf をシステム領域にインストール
winget install --scope machine --id Codeium.Windsurf -e --silent --accept-source-agreements --accept-package-agreements
REM Microsoft VS Code をシステム領域にインストール
winget install --scope machine --id Microsoft.VisualStudioCode -e --silent --accept-source-agreements --accept-package-agreements
if exist "C:\Program Files\Microsoft VS Code\bin" cd "C:\Program Files\Microsoft VS Code\bin"
if exist "C:\Program Files\Microsoft VS Code\bin" code --install-extension ms-python.python
if exist "C:\Program Files\Microsoft VS Code\bin" code --install-extension ms-python.vscode-pylance
if exist "C:\Program Files\Microsoft VS Code\bin" code --install-extension MS-CEINTL.vscode-language-pack-ja
if exist "C:\Program Files\Microsoft VS Code\bin" code --install-extension dongli.python-preview
if exist "C:\Program Files\Windsurf\bin" windsurf --install-extension MS-CEINTL.vscode-language-pack-ja
実行時のヒント
- コマンドの途中で止まったら、まずEnterキーを1回押す。そして、エラー内容をよく読む
- Pythonのインストールのときに「Modify Repair Uninstall」画面が出た場合は、Pythonがインストール済みなので「Cancel」をクリックする
1.5 確認
次のプログラムを実行し、Pythonのバージョン、Gitのバージョン、PyTorchのバージョン、GPUの動作を確認する。Python 3.12、NVIDIA CUDA、Git、PyTorchのインストールに問題がないかも確認できる。
import sys
import subprocess
import torch
print(sys.version)
print(subprocess.check_output(['git', '--version'], text=True).strip())
print(torch.__version__)
print(torch.cuda.is_available())
2. ニューラルネットワークの基礎知識
用語:ニューラルネットワーク、モデル、学習、過学習、ドロップアウト、CNN、転移学習、データ拡張
用語集:別ページ »にまとめ
説明資料: 別ページにまとめている
3. Windowsの基本操作ガイド
Windowsシステムの基本操作ガイドを、別ページ »で説明している
4. Windows環境の最適化と開発支援ツール
Windowsのセットアップ
便利なフリーソフトウェアのインストール
必要なフリーソフトウェアを選択して、インストールする。
- Firefoxとアドオン: Webブラウザ
- Windowsでのインストール手順: 別ページ »で説明
- Firefoxの公式ページ: https://www.mozilla.org/ja/firefox/new/
- アドオンの例: Superpower ChatGPT、uBlock、Falcon、Simple Translate
- Google Chromeとアドオン: Webブラウザ
- Google Chromeの公式ページ: https://www.google.com/intl/ja_jp/chrome/
- アドオンの例: Superpower ChatGPT、uBlock、Falcon、DeepL翻訳
- Search Everything: ファイル名検索ツール
- Windowsでのインストール: 別ページ »で説明
- 公式ページ: http://www.voidtools.com/
- Visual Studio Code: テキストエディタ
- Windowsでのインストール: 別ページ »で説明
- 公式ページ: https://azure.microsoft.com/ja-jp/products/visual-studio-code
- Emacs: テキストエディタ
- Windowsでのインストール: 別ページ »で説明
- 公式ダウンロードページ: https://www.gnu.org/software/emacs/download.html
- FileZilla: ファイル転送
- Windowsでのインストール: 別ページ »で説明
- 公式ページ: https://filezilla-project.org/index.php
- MobaXterm: リモート接続やファイル転送
- Windowsでのインストール: 別ページ »で説明
- 公式ページ: https://mobaxterm.mobatek.net/
- GreenShot: スクリーンショットツール
- 公式ダウンロードページ: https://getgreenshot.org/
理工学分野のフリーソフトウェア
理工学分野のフリーソフトウェア: 別ページ »で説明
その他、便利な機能をもったフリーソフトウェアの紹介
その他、便利な機能をもったフリーソフトウェアの紹介: 別ページ »で説明
5. CMakeのインストール(ソースコードからのビルド用)
CMakeは、クロスプラットフォームのビルドシステム生成ツールである。ソースコードからのビルドが必要なライブラリ(Dlib、zlib等)のインストールに使用する。
管理者権限でコマンドプロンプトを起動し、以下を実行する。
REM CMakeをシステム領域にインストール
winget install --scope machine --id Kitware.CMake -e --silent
REM CMakeのパス設定
set "CMAKE_PATH=C:\Program Files\CMake\bin"
if exist "%CMAKE_PATH%" (
echo "%PATH%" | find /i "%CMAKE_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%CMAKE_PATH%" /M >nul
)
6. GPU環境の構築(NVIDIAドライバ・CUDA・cuDNN)
GPUとは
GPU(Graphics Processing Unit)は並列計算能力を持つプロセッサであり、ディープラーニングの高速化に活用される。
NVIDIAドライバのインストール(Windows上)
NVIDIAドライバとは
NVIDIAドライバは、NVIDIA製GPUをWindowsシステム上で適切に動作させるための基盤となるソフトウェアである。このドライバをインストールすることで、GPUの性能を引き出し、グラフィックス処理やCUDAを利用したAI関連アプリケーションなどの計算速度を向上させることができる。
公式サイト: https://www.nvidia.co.jp/Download/index.aspx?lang=jp
【サイト内の関連ページ】
- NVIDIAグラフィックス・ボードの確認
Windowsのコマンドプロンプトで次のコマンドを実行する。
wmic path win32_VideoController get name
- NVIDIAドライバのダウンロード
確認したグラフィックス・ボードのモデル名と、使用しているWindowsのバージョンに対応するドライバを、以下のNVIDIA公式サイトからダウンロードする。
- ドライバのインストール
ダウンロードしたインストーラー(.exeファイル)を実行し、画面の指示に従ってインストールを進める。
NVIDIA CUDAツールキット12.6のインストール(Windows上)
CUDAツールキットの基本的なインストールは、第1章で説明している。ここでは補足事項を説明する。
NVIDIA CUDAツールキットの概要と注意点
NVIDIAのGPUを使用して並列計算を行うための開発・実行環境である。
【NVIDIA CUDAツールキットの動作に必要なもの】
- CUDA対応のNVIDIA GPU
- 対応するNVIDIAドライバ
- サポートされているバージョンのC++コンパイラ(Visual StudioまたはBuild Toolsをインストール済み)
【Windowsでインストールするときの注意点】
- Windowsでは、NVIDIA CUDAツールキットのインストール中は、他のアプリケーションを終了しておくことが推奨される
【関連する外部ページ】
ユーザ環境変数TEMPの設定(日本語ユーザ名の場合)
Windowsのユーザ名に日本語が含まれている場合、CUDAコンパイラnvccが一時ファイルの作成に失敗することがある。この問題を回避するために、ユーザ環境変数TEMPおよびTMPを、ASCII文字のみのパス(例: C:\TEMP)に変更する。
mkdir C:\TEMP
powershell -command "[System.Environment]::SetEnvironmentVariable(\"TEMP\", \"C:\TEMP\", \"User\")"
powershell -command "[System.Environment]::SetEnvironmentVariable(\"TMP\", \"C:\TEMP\", \"User\")"
NVIDIA cuDNN 9のインストール(Windows上)
NVIDIA cuDNN
NVIDIA cuDNNは、NVIDIA CUDAツールキット上で動作する、ディープラーニング用ライブラリである。畳み込みニューラルネットワーク(CNN)やリカレントニューラルネットワーク(RNN)など、さまざまなディープラーニングモデルのトレーニングと推論を高速化する。
【cuDNN利用時の注意点: zlibwapi.dllエラー】
Windows環境でcuDNNを利用するアプリケーションを実行した際に、「Could not locate zlibwapi.dll. Please make sure it is in your library path!」というエラーが表示されることがある。このエラーが発生した場合は、後述する手順でZLIB DLLをインストールする必要がある。
【関連する外部ページ】
- NVIDIA cuDNNの公式ページ(ダウンロードにはDeveloper Programへの登録が必要): https://developer.nvidia.com/cudnn
NVIDIA cuDNNのインストール(Windows上)の概要
- NVIDIA Developer Programメンバーシップへの加入: cuDNNをダウンロードするには、無料のメンバーシップ登録が必要である
- 互換バージョンの選択とダウンロード: インストール済みのCUDAツールキットのバージョン(今回は12.x)に適合するcuDNNのバージョンを選択し、Windows用のzipファイルをダウンロードする
- ファイルの展開と配置: ダウンロードしたzipファイルを展開し、中のファイル(
bin、include、libフォルダ内)を、CUDAツールキットのインストールディレクトリにコピーする - (オプション) 環境変数の設定: 必要に応じてシステム環境変数
CUDNN_PATHを設定する - (必要に応じて) ZLIB DLLのインストール:
zlibwapi.dllが見つからないエラーが発生する場合にインストールする - 動作確認: cuDNNライブラリ(
cudnn64_*.dll)にパスが通っているか確認する
zlibのインストール(Windows上)
zlibは、cuDNNが内部で使用する圧縮ライブラリである。cuDNN利用時に「zlibwapi.dll」が見つからないエラーが発生した場合、以下の手順でインストールする。
- Windowsで、管理者権限でコマンドプロンプトを起動
- 次のコマンドを実行
cd /d c:%HOMEPATH% rmdir /s /q zlib git clone https://github.com/madler/zlib cd zlib del CMakeCache.txt rmdir /s /q CMakeFiles\ cmake . -G "Visual Studio 17 2022" -A x64 -T host=x64 -DCMAKE_INSTALL_PREFIX=c:/zlib cmake --build . --config RELEASE --target INSTALL powershell -command "$oldpath = [System.Environment]::GetEnvironmentVariable(\"Path\", \"Machine\"); $oldpath += \";c:\zlib\bin\"; [System.Environment]::SetEnvironmentVariable(\"Path\", $oldpath, \"Machine\")" powershell -command "[System.Environment]::SetEnvironmentVariable(\"ZLIB_HOME\", \"C:\zlib\", \"Machine\")"
【関連する外部ページ】
- zlibの公式ページ: https://www.zlib.net/
NVIDIA cuDNN 9のインストール手順(Windows上)
- NVIDIA cuDNNのウェブページを開く
- cuDNNのところにある「Download cuDNN」をクリック
- NVIDIA Developer Programメンバーシップに入る
「Join now」をクリックし、画面の指示に従う。
- ログインする
- 調査の画面が出たときは、調査に応じる
- ライセンス条項の確認
- CUDA 12.x対応のcuDNN 9をダウンロードする
「cuDNN 9.x for CUDA 12.x」のWindows版を選択する。
- ダウンロードした.zipファイルを展開する
- NVIDIA CUDAツールキットをインストールしたディレクトリを確認する
通常は
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6である。 - 展開してできたすべてのファイルとディレクトリを、NVIDIA CUDAツールキットをインストールしたディレクトリにコピーする
- パスが通っていることを確認
Windowsのコマンドプロンプトを開き、次のコマンドを実行する。
where cudnn64_9.dll
- Windowsのシステム環境変数 CUDNN_PATHの設定を行う
コマンドプロンプトを管理者として開き、次のコマンドを実行する。
powershell -command "[System.Environment]::SetEnvironmentVariable(\"CUDNN_PATH\", \"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\", \"Machine\")"
7. Python開発環境の拡張とライブラリ導入
Pythonのインストール
Pythonのインストールは、第1章で説明している。
【Pythonのインストールでの注意点】
- Python 64-bit版を使用すること
- Pythonをシステム領域にインストールすることを推奨する
- Windowsでは、Pythonの3.10.x、3.11.x、3.12.xのように、複数のバージョンのPythonを同時にインストールできる
【インストール手順の詳細(別ページ)】WindowsでのPythonのインストール: 別ページ »で説明
【Pythonの公式ページ】https://www.python.org/
pipの概要と基本コマンド
pipは、Pythonパッケージマネージャー(Pythonの追加機能を管理するためのツール)であり、ライブラリ(プログラムで使用できる機能の集合)のインストールや管理を行う。
使用例: pip install numpy
このガイドではpip installコマンドは、管理者権限で実行することを推奨する。Windowsのユーザー名に日本語が含まれる場合に発生しうるトラブルを防止するためである。
pip基本コマンド
pip install [パッケージ名]: 指定したパッケージ(機能をまとめたソフトウェア部品)をインストールするpip install --upgrade [パッケージ名](--upgrade:既存パッケージを最新版に更新するためのオプション): 指定したパッケージを更新するpip uninstall [パッケージ名]: 指定したパッケージを削除するpip list: インストール済みパッケージを一覧表示するpip show [パッケージ名]: 指定したパッケージの詳細情報を表示する
主要なPythonライブラリの一括インストール
以下のコマンドで、AI開発に必要なライブラリを一括でインストールする。以下は本ガイド執筆時点(2025年12月)のコマンドである。管理者権限でコマンドプロンプトを起動し、次のコマンドを1つずつ実行する。
PyTorchは第1章でインストール済みのため、ここでは追加のライブラリのみをインストールする。
REM pipを最新版に更新
python -m pip install -U pip
REM AIライブラリを一括インストール
pip install jupyter ipykernel numpy pandas scikit-learn matplotlib japanize-matplotlib seaborn scipy opencv-python pillow timm pygame streamlit
PyTorchについて: PyTorchのインストールコマンドは、PyTorch公式サイト(https://pytorch.org/get-started/locally/)で、自身の環境(Windows、Pip、Python、CUDA)に合った最新のコマンドを確認すること。特にGPUを利用する場合は、適切なCUDAバージョンの選択が重要である。本ガイド執筆時点(2025年12月)では、PyTorch 2.6.0および2.7系でCUDA 12.6が正式サポートされている。
インストールされるPythonライブラリの説明
- jupyter: 対話的な開発環境のJupyter Notebookである
- NumPy、Pandas、Scikit-learn: 数値計算(NumPy)、表形式データの操作・分析(Pandas)、古典的な機械学習(Scikit-learn)のためのライブラリである
- Matplotlib/Seaborn: データの分布や学習結果などをグラフで可視化するためのライブラリである
- japanize-matplotlib: Matplotlibで日本語を表示するためのライブラリである
- scipy: 科学計算ライブラリ(SciPy:高度な科学計算機能を提供)である
- opencv-python: 画像処理・コンピュータビジョン用ライブラリである
- pillow: 画像処理ライブラリ(Pillow:画像の読み込み、編集、保存機能を提供)である
- timm: PyTorch Image Models(事前学習済みモデル集)である
- pygame: ゲーム開発・インタラクティブアプリケーション用ライブラリである
- streamlit: Webベースの対話アプリ開発ツールである
インストール後の確認
コマンドプロンプトでpythonと入力し、対話モードに入って以下のコードを実行する。
# PyTorchのバージョン確認とGPU利用可能性の確認
import torch
print("PyTorch Version:", torch.__version__)
print("CUDA Available:", torch.cuda.is_available())
if torch.cuda.is_available():
print("CUDA Version:", torch.version.cuda)
# 主要ライブラリのバージョン確認
import numpy as np
import pandas as pd
import matplotlib
print("NumPy Version:", np.__version__)
print("Pandas Version:", pd.__version__)
print("Matplotlib Version:", matplotlib.__version__)
エラーが出ずにバージョン情報が表示されれば成功である。特にCUDA Available: Trueと表示されていれば、PyTorchがGPUを認識しており、GPUを使った計算が可能である。Falseと表示された場合は、GPUが搭載されていないか、CUDAドライバやPyTorchのインストールに問題がある可能性がある。確認後、exit()と入力して対話モードを終了する。
PyCharmのインストール(Windows上)
WindowsでのPyCharmのインストール: 別ページ »で説明
Pythonの種々のパッケージ
その他、Pythonパッケージは、必要なものをインストールする。
- pipでインストールするもの
コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
python -m pip install -U h5py scikit-learn-intelex scikit-image bokeh statsmodels plotly sympy csvkit docopt pyproj flake8 protobuf bs4 html5lib rope wrapt cffi wheel six sphinx bottleneck pygments numexpr xlrd xlsxwriter lxml graphviz pydot flask django redis pylint bz2file PyOpenGL PyOpenGL-accelerate msgpack mecab ggplot matplotlib-venn pyglet cocos2d bottle rtree shapely fiona gdal geopandas geopy geographiclib requests moviepy av gdown yt-dlp ruamel.yaml einops transformers pandasql pyyaml pymc3 mkl mkl-include holoviews pandas-bokeh ggplot prettyplotlib pybrain3 firebase-admin googletrans google-cloud-vision gpyocr azure-cognitiveservices-vision-computervision gensim gloo scikit-video scikits.datasmooth scikits.example scikits.fitting scikits.optimization scikits.vectorplot zodb gdata pycaret pywin32 python -m pip install --extra-index-url https://archive.panda3d.org/ panda3d cd C:\ curl -O https://www.panda3d.org/download/panda3d-1.10.9/panda3d-1.10.9-samples.zip powershell Expand-Archive -DestinationPath . panda3d-1.10.9-samples.zip
- Pythonパッケージで、ソースコードからインストールするもの
コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
python -m pip install git+https://github.com/jrosebr1/imutils.git python -c "import imutils; print(imutils.__version__)" python -m pip install git+https://github.com/DinoTools/python-overpy.git python -c "import overpy; print(overpy.__version__)" python -m pip install git+https://github.com/ianare/exif-py.git python -c "import exifread; print(exifread.__version__)" python -m pip install git+https://github.com/mapado/haversine.git python -m pip install git+https://github.com/Turbo87/utm.git # cd /d c:%HOMEPATH% rmdir /s /q head-pose-estimation git clone https://github.com/lincolnhard/head-pose-estimation cd head-pose-estimation curl -O http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2 "c:\Program Files\7-Zip\7z.exe" x shape_predictor_68_face_landmarks.dat.bz2 # cd /d c:%HOMEPATH% rmdir /s /q PupilTracker git clone https://github.com/TobiasRoeddiger/PupilTracker
- pipのキャッシュの消去
管理者権限でコマンドプロンプトを起動し、次のコマンドを実行する。
python -m pip cache purge cd %LOCALAPPDATA% cd pip rmdir /s /q Cache
8. TensorFlowのインストールとGPU設定
TensorFlow GPU版
TensorFlowは、Googleが開発した機械学習フレームワークである。Python、C/C++言語から利用可能で、CPU、GPU、TPU上で動作する。TensorFlowを使用することで、音声、画像、テキスト、ビデオなど多様なデータを扱う機械学習アプリケーションの開発が可能になる。
TensorFlow GPU版の動作に必要なもの
【関連する外部ページ】
TensorFlow GPU版、Keras、関連パッケージのインストール
設定の要点
システム環境変数 TF_FORCE_GPU_ALLOW_GROWTHの設定: true
- 管理者権限でコマンドプロンプトを起動
- 使用するPythonのバージョンの確認
python --version
- TensorFlow関係のパッケージのアンインストール操作
python -m pip uninstall -y protobuf tensorflow tensorflow-cpu tensorflow-gpu tensorflow-intel tensorflow-text tensorflow-estimator tf-models-official tf_slim tensorflow_datasets tensorflow-hub keras keras-tuner keras-visualizer
- TensorFlowおよび関連パッケージのインストール
python -m pip install -U protobuf tensorflow tf_slim tensorflow_datasets tensorflow-hub tf-keras keras keras_cv keras-tuner keras-visualizer python -m pip install git+https://github.com/tensorflow/docs python -m pip install git+https://github.com/tensorflow/examples.git python -m pip install git+https://www.github.com/keras-team/keras-contrib.git
(以下省略) - TensorFlowのバージョン確認
python -c "import tensorflow as tf; print(tf.__version__)"
- TensorFlowパッケージの情報の表示
pip show tensorflow
- (GPUを使うとき) TensorFlowからGPUが認識できているかの確認
python -c "from tensorflow.python.client import device_lib; print(device_lib.list_local_devices())"
実行結果の中に、「device_type: "GPU"」があれば、GPUが認識できている。
- システム環境変数 TF_FORCE_GPU_ALLOW_GROWTHに、trueを設定
管理者権限でコマンドプロンプトを起動し、次のコマンドを実行する。
powershell -command "[System.Environment]::SetEnvironmentVariable(\"TF_FORCE_GPU_ALLOW_GROWTH\", \"true\", \"Machine\")"
GPU利用時のPyTorchとCUDAのバージョン互換性
GPUを利用する場合、PyTorchとCUDAのバージョンの組み合わせが重要である。以下の手順で互換性を確認する。
- 使用したいPyTorchのバージョンを決める: 最新安定版が推奨される
- PyTorch公式サイトのインストールページを確認する:
- PyTorch公式サイト(https://pytorch.org/get-started/locally/)にアクセスする
- 「PyTorch Build」(Stable)、「Your OS」(Windows)、「Package」(Pipを選択)、「Language」(Python)、「Compute Platform」を選択する
- 「Compute Platform」で、利用したいCUDAのバージョン(例: CUDA 11.8、CUDA 12.6)を選択する
- 選択すると、下にインストールコマンドが表示される(例:
pip install torch ... --index-url .../cu126)。このコマンドの末尾(cu126など)が、PyTorchが対応するCUDAバージョンを示す
- インストール済みCUDAバージョンを確認する: コマンドプロンプトで
nvidia-smiを実行する - インストール後にGPU認識を確認する:
python -c "import torch; print(torch.cuda.is_available())"を実行する
最新の互換性情報はhttps://docs.nvidia.com/cuda/cuda-toolkit-release-notes/で確認すること。
9. ディープラーニング応用ライブラリの導入
dlib、face_recognition(顔検出、顔のアラインメント、顔のランドマーク、顔認識その他)
【関連する外部ページ】
- Dlibの公式ページ: http://dlib.net/
【インストール手順の詳細(別ページ)】
【Dlibのインストール操作】コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
「12.6」のところは、実際にインストールしているNVIDIA CUDAツールキットのバージョンにあわせること。
cd C:\
rmdir /s /q dlib
git clone https://github.com/davisking/dlib
cd dlib
rmdir /s /q build
mkdir build
cd build
del CMakeCache.txt
rmdir /s /q CMakeFiles\
cmake .. -G "Visual Studio 17 2022" -A x64 -T host=x64 ^
-DCUDA_SDK_ROOT_DIR="c:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.6" ^
-DCUDA_TOOLKIT_ROOT_DIR="c:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.6" ^
-D CUDA_NVCC_FLAGS="-allow-unsupported-compiler" ^
-DCUDA_NVCC_FLAGS_DEBUG="-allow-unsupported-compiler" ^
-DCMAKE_INSTALL_PREFIX=c:/dlib ^
-DUSE_AVX_INSTRUCTIONS=1
cmake --build . --config RELEASE --target INSTALL -- /m:4
python -m pip uninstall -y dlib
cd C:\
cd dlib
python setup.py build
python setup.py install
python -c "import dlib; print(dlib.__version__)"
powershell -command "$oldpath = [System.Environment]::GetEnvironmentVariable(\"Path\", \"Machine\"); $oldpath += \";c:\dlib\bin\"; [System.Environment]::SetEnvironmentVariable(\"Path\", $oldpath, \"Machine\")"
cd C:\dlib
cd python_examples
curl -O http://dlib.net/files/mmod_human_face_detector.dat.bz2
curl -O http://dlib.net/files/dlib_face_recognition_resnet_model_v1.dat.bz2
curl -O http://dlib.net/files/shape_predictor_5_face_landmarks.dat.bz2
curl -O http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x mmod_human_face_detector.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x dlib_face_recognition_resnet_model_v1.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x shape_predictor_5_face_landmarks.dat.bz2
"c:\Program Files\7-Zip\7z.exe" x shape_predictor_68_face_landmarks.dat.bz2
del mmod_human_face_detector.dat.bz2
del dlib_face_recognition_resnet_model_v1.dat.bz2
del shape_predictor_5_face_landmarks.dat.bz2
del shape_predictor_68_face_landmarks.dat.bz2
Dlibの動作確認のため、次のコマンドを実行する。
cd C:\dlib
cd python_examples
python cnn_face_detector.py mmod_human_face_detector.dat ..\examples\faces\2007_007763.jpg
【face_recognitionのインストール操作】コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
cd /d c:%HOMEPATH%
rmdir /s /q face_recognition
git clone https://github.com/ageitgey/face_recognition
cd face_recognition
copy C:\dlib\python_examples\shape_predictor_68_face_landmarks.dat .
python setup.py build
python setup.py install
face_recognitionの動作確認のため、次のコマンドを実行する。
mkdir %HOMEPATH%\face_recognition\known_people
mkdir %HOMEPATH%\face_recognition\unknown_pictures
copy %HOMEPATH%\face_recognition\examples\biden.jpg %HOMEPATH%\face_recognition\known_people
copy %HOMEPATH%\face_recognition\examples\obama.jpg %HOMEPATH%\face_recognition\known_people
copy %HOMEPATH%\face_recognition\examples\two_people.jpg %HOMEPATH%\face_recognition\unknown_pictures
cd /d c:%HOMEPATH%\face_recognition
face_recognition --show-distance true known_people unknown_pictures
ipazc/mtcnn
【関連する外部ページ】
- ipazc / mtcnnの公式ページ: https://github.com/ipazc/mtcnn
【ipazc/mtcnnのインストール手順(Windows上)】
- インストール
コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
python -m pip install git+https://github.com/ipazc/mtcnn.git python -c "import mtcnn; print(mtcnn.__version__)"
- 動作確認
コマンドプロンプトを実行し、次のコマンドを実行する。
cd C:\dlib python
次のPythonプログラムを実行する。
from mtcnn import MTCNN import cv2 img = cv2.cvtColor(cv2.imread("./examples/faces/2007_007763.jpg"), cv2.COLOR_BGR2RGB) detector = MTCNN() detector.detect_faces(img)
OpenPose(人体の姿勢推定、指のポーズ推定)
【関連する外部ページ】
- OpenPoseのURL: https://github.com/CMU-Perceptual-Computing-Lab/openpose
- OpenPoseダウンロードのURL: https://github.com/CMU-Perceptual-Computing-Lab/openpose/releases
【インストール手順の詳細(別ページ)】
OpenPoseの動作確認のため、次のコマンドを実行する。
cd C:\openpose-1.7.0-binaries-win64-gpu-python3.7-flir-3d_recommended
cd openpose
bin\OpenPoseDemo.exe --video examples\media\video.avi
Tesseract OCR 5(文字認識)
【関連する外部ページ】
- Tesseract OCRの公式ドキュメント: https://github.com/tesseract-ocr/tessdoc
【インストール手順の詳細(別ページ)】
matterplot/masked_rcnn(画像のセグメンテーション)
matterplot/masked_rcnnのURL: https://github.com/matterport/Mask_RCNN
コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
python -m pip install scikit-image cython
python -m pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI
cd /d c:%HOMEPATH%
rmdir /s /q Mask_RCNN
git clone --recursive https://github.com/matterport/Mask_RCNN
cd Mask_RCNN
python -m pip install -r requirements.txt
python setup.py build
python setup.py install
cd samples/coco
Meshroom(写真測量、フォトグラメトリ)
【関連する外部ページ】
- Meshroomの公式ページ: https://alicevision.org/
【Meshroomのインストール操作(Windows上)】
- Meshroomの公式ページ: https://alicevision.org/からダウンロードしてインストールする
muZero
コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
rmdir /s /q c:\muzero-general
cd c:\
git clone https://github.com/werner-duvaud/muzero-general.git
cd muzero-general
python -m pip install -r requirements.txt
確認のため実行する。
python muzero.py
tensorboard --logdir ./results
OpenAI Gym
コマンドプロンプトを管理者として実行し、次のコマンドを実行する。
rmdir /s /q c:\gym
cd c:\
git clone https://github.com/openai/gym.git
cd gym
python -m pip install -e .