NVIDIA ドライバ，NVIDIA CUDA ツールキット 11.0, NVIDIA cuDNN v8.2.1 のインストールについて

Windows での，NVIDIA ドライバ，NVIDIA CUDA ツールキット 11.0，NVIDIA cuDNN v8.2.1 のインストール，nvcc の使用例をスクリーンショット等で説明する．

TensorFlow 2.4 の運用を想定している．

【目次】

Build Tools for Visual Studio 2019 （ビルドツール for Visual Studio 2019）のインストール
NVIDIA ドライバのインストール（Windows 上）
NVIDIA CUDA ツールキット 11.0 のインストール（Windows 上）
NVIDIA cuDNN v8.2.1 のインストール
nvcc を動かしてみる（x64 Native Tools コマンドプロンプトを利用）
NVIDIA CUDA 11.0 の動作確認のため，TensorFlow 2.4.4 を実行してみる

【サイト内の関連ページ】

Windows での主要なソフトウエアのインストールと設定: 別ページ »で説明

GPUとは

GPUは，グラフィックス・プロセッシング・ユニット（Graphics Processing Unit）の略です．その高い並列計算能力から，３次元コンピュータグラフィックス，３次元ゲーム，動画編集，科学計算，ディープラーニングなど，並列処理が必要な幅広い分野で活用されています．

TensorFlowとNVIDIAソフトウェアの関連

TensorFlowは，Googleが開発した機械学習フレームワークであり，ディープラーニング開発で広く使われています．Python，C/C++言語から利用可能で，CPUだけでなく，NVIDIA GPUやGoogle TPU上で計算を高速化できます．TensorFlowでGPUの計算能力を活用するには、NVIDIAが提供するドライバ、CUDAツールキット、cuDNNライブラリが必要になります．

TensorFlowの特徴として「データフローグラフ」があります．これは，「データの流れ」を表現するもので，グラフの節点は演算（オペレーション）を，エッジはデータ（テンソル）の流れを表します．TensorFlowを使用することで，音声，画像，テキスト，ビデオなど多様なデータを扱う機械学習アプリケーションの開発が容易になります．2015年11月に初版がリリースされて以来，継続的にバージョンアップが続いています．

TensorFlow GPU版などのGPU対応フレームワークを利用するための主な動作要件（2024年7月現在参考）：

NVIDIA グラフィックス・ボード: CUDAに対応したNVIDIA製GPUが必要です．
Windows で，NVIDIA グラフィックス・ボードの種類を確認するには，次のコマンドをコマンドプロンプトで実行します．
wmic path win32_VideoController get name
NVIDIA ドライバ: GPUをOSに認識させ、性能を引き出すためのソフトウェアです．
NVIDIA CUDA ツールキット: GPU上でプログラムを開発・実行するためのプラットフォームです．コンパイラ（nvcc）、ライブラリ、APIなどが含まれます．
TensorFlow バージョン 2.10.1の動作には，CUDA 11.2が必要です（公式ドキュメントより．対応するDLL: cudart64_110.dll, cusolver64_11.dllなど）。TensorFlowのバージョンによって要求されるCUDAバージョンは異なります。 Windows環境のTensorFlow 2.10ではCUDA 11が必要であり、そして、CUDA 11.8や12.xとの公式な互換性は保証されていないようです。本記事ではCUDA 11.8のインストールを解説しますが、TensorFlow 2.10を使用する場合はCUDA 11.2のインストールを検討してください。

また，NVIDIA CUDA ツールキットのバージョンを選ぶときは，NVIDIA cuDNNに対応したバージョンを選択することも重要です．互換性の詳細はcuDNNの公式アーカイブページなどで確認できます．
NVIDIA cuDNN: ディープニューラルネットワークのためのGPUアクセラレーションライブラリです．畳み込み演算などを高速化します．
TensorFlow GPU版の動作のためにNVIDIA cuDNNが必要です．これもTensorFlowやCUDAのバージョンとの互換性を確認する必要があります．（例: TensorFlow 2.10はcuDNN 8.1を要求）

TensorFlowの古いバージョンを使用する場合や特定のバージョン組み合わせについては、対応バージョン情報（別ページ »）も参照してください．

Build Tools for Visual Studio 2019 （ビルドツール for Visual Studio 2019）のインストール

【手順】

Windows で，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。
次のコマンドを実行
次のコマンドは，Build Tools for Visual Studio 2019と VC2015 再配布可能パッケージをインストールするものである．
winget install --scope machine Microsoft.VisualStudio.2019.BuildTools winget install --scope machine Microsoft.VCRedist.2015+.x64
Visual Studio Installer の起動
起動方法: スタートメニューの「Visual Studio Installer」を選ぶ．
Visual Studio Build Tools 2019 で「変更」を選ぶ．
「C++ によるデスクトップ開発」をクリック．そして，画面右側の「インストール」の詳細で「v142 ビルドツール用 C++/CLI サポート（最新）」，「ATL」，「MFC」をチェックする．その後，「インストール」をクリック．
ダウンロードとインストールが始まる
インストール終了の確認
コンパイラの動作確認
1. Visual Studio の x64 Native Tools コマンドプロンプトを起動．
  起動方法: Windows のスタートメニューで「Visual Studio 2019」の下の「x64 Native Tools Command Prompt for VS 2019」で起動する.（あるいは類似のものを探す）．「x64」は，64ビット版の意味である．
2. エディタを起動．ここではメモ帳 (notepad) を使っている．
  x64 Native Tools コマンドプロンプトで，次のコマンドを実行する．ファイル名は hello.c としている．
  C: cd /d %USERPROFILE% notepad hello.c
3. いまメモ帳で開いたファイルを，次のように編集する（コピー＆ペーストしてください）．そして保存する．
  #include<stdio.h> int main() { printf("Hello,World!\n"); printf("sizeof(size_t)=%ld\n", sizeof(size_t)); return 0; }
4. x64 Native Tools コマンドプロンプトを新しく開き，次のコマンドを実行
  結果として，「Hello,World!」「sizeof(size_t)=8」と表示されればOK．
  del hello.exe cl hello.c .\hello.exe
  実行結果例

【サイト内の関連ページ】 Windows でのビルドツール for Visual Studio 2019 （Build Tools for Visual Studio 2019）のインストール（winget を使用しないインストール）: 別ページ »で説明

NVIDIA ドライバのインストール（Windows 上）

NVIDIA ドライバ

NVIDIA ドライバは，NVIDIA製GPUを動作させるための重要なソフトウェアである．このドライバをインストールすることにより，GPUの性能を引き出すことができ，グラフィックス関連のアプリ，AI関連のアプリの高速化が期待できる．

ドライバはNVIDIA公式サイトである https://www.nvidia.co.jp/Download/index.aspx?lang=jp からダウンロードできる．このサイトからダウンロードするときには，グラフィックスカードとオペレーティングシステムを選択する．なお，NVIDIA GeForce Experiance を用いてインストールすることも可能である．

【サイト内の関連ページ】

NVIDIA ドライバのインストール（Windows 上）

NVIDIA グラフィックス・ボードの確認
Windows で，NVIDIA グラフィックス・ボードの種類を調べたいときは，次のコマンドを実行することにより調べることができる．
wmic path win32_VideoController get name
NVIDIA ドライバのダウンロード
NVIDIA ドライバは，以下の NVIDIA 公式サイトからダウンロードできる．
https://www.nvidia.co.jp/Download/index.aspx?lang=jp
ダウンロードの際には，使用しているグラフィックス・ボードの型番とオペレーティングシステムを選択する．

NVIDIA CUDA ツールキット 11.0 のインストール（Windows 上）

NVIDIA CUDA ツールキットのインストール時の注意点

NVIDIAのGPUを使用して並列計算を行うためのツールセット

主な機能: GPU を利用した並列処理，GPU のメモリ管理，C++をベースとした拡張言語とAPIとライブラリ

【NVIDIA CUDA ツールキットの動作に必要なもの】

CUDA対応のNVIDIA GPUが必要．
そのために，NVIDIA グラフィックス・ボードを確認する． Windows で，NVIDIA グラフィックス・ボードの種類を調べたいときは，次のコマンドを実行することにより調べることができる．
wmic path win32_VideoController get name
NVIDIA ドライバのダウンロードとインストール
NVIDIA ドライバは，以下の NVIDIA 公式サイトからダウンロードできる．ダウンロードの際には，使用しているグラフィックス・ボードの型番とオペレーティングシステムを選択する．
https://www.nvidia.co.jp/Download/index.aspx?lang=jp
Windows では，インストール前に，Build Tools for Visual Studio もしくは Visual Studio をインストールしておくことが必要である．

【Windows でインストールするときの注意点】

Windows では， NVIDIA CUDA ツールキットのインストール中は，なるべく他のウインドウはすべて閉じておくこと．
NVIDIA CUDA ツールキットのインストールが終わったら，ユーザ環境変数 TEMP の設定を行う．
Windows のユーザ名が日本語のとき，nvcc がうまく動作しないエラーを回避するためである．
ユーザ環境変数 TEMP に「C:\TEMP」を設定するために，コマンドプロンプトで，次のコマンドを実行する．
mkdir C:\TEMP powershell -command "[System.Environment]::SetEnvironmentVariable(\"TEMP\", \"C:\TEMP\", \"User\")"

【関連する外部ページ】

NVIDIA CUDA ツールキットのアーカイブの公式ページ: https://developer.nvidia.com/cuda-toolkit-archive
NVIDIA CUDA ツールキットの公式のドキュメント: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html
NVIDIA CUDA ツールキットのインストールに関する，NVIDIA CUDA クイックスタートガイドの公式ページ: https://docs.nvidia.com/cuda/cuda-quick-start-guide/index.html

NVIDIA CUDA ツールキットのアーカイブのページを開く
https://developer.nvidia.com/cuda-toolkit-archive
NVIDIA CUDA ツールキットのバージョンを選ぶ
ここでは，「11.0.3」を選んでいる
「Windows」，「10」，「exe [local]」を選ぶ．
Windows 11 のときは，「11」を選んでください．
「Base Installer」の右横の「Download」をクリックして，.exe ファイルをダウンロード
exe ファイルのダウンロードが始まる
ダウンロードした .exe ファイルを実行する．
展開（解凍）先ディレクトリ（フォルダ）の指定．
既定（デフォルト）のままでよい．「OK」をクリック．
展開（解凍）が自動で行われるので，しばらく待つ．
ライセンス条項の確認．
インストールオプションは，「カスタム（詳細）」を選び，「次へ」をクリック．
コンポーネントを確認する．
「CUDA」にチェックする．その他は，必要なものがあればチェックする．「次へ」をクリック．
このとき，NVIDIA ドライバを選択することもできる（NVIDIA ドライバが未インストールであれば，インストールする）．

* 但し，複数の版の NVIDIA CUDA ツールキットをインストールする場合には，古い版のNVIDIA CUDA ツールキットをインストールするときに「CUDA」だけを選ぶようにする．
インストール場所の選択は，既定（デフォルト）のままでよい．「次へ」をクリック．
Visual Studio Integration について表示された場合
表示されなくても問題はない．
表示された場合には，次のように判断する．
- Visual Studio をインストールする予定があるとき
  ここで，NVIDIA CUDA ツールキットのインストールを中止．先に， Visual Studio 2019 のインストールを行う．
- Visual Studio をインストールする予定がないとき
  NVIDIA CUDA ツールキットのインストールを中止する必要はない．
  あとで構わないので，Build Tools for Visual Studio 2019 （ビルドツール for Visual Studio 2019）のインストールを行っておく（Build Tools for Visual Studio 2019 （ビルドツール for Visual Studio 2019）のインストールが終わっていても，Visual Studio Community のインストールを行っていない場合には，この表示は出る）．
このとき，Windows セキュリティの画面が開くことがある．開いた場合には，「インストール」をクリック．
インストールが始まるので，確認する．
このとき，グラフィックス・カードのドライバのインストールについての画面が表示される場合がある．「インストール」をクリックして，インストールを続行する．
Visual Studio がインストール済みのときは，Nsight Visual Studio がインストールされたことが確認できる．確認したら「次へ」をクリック．

Visual Studio をインストールしていないときは，Nsight for Visual Studio はインストールされない．表示は次のようになる．確認したら「次へ」をクリック．
インストール終了の確認．「閉じる」をクリック．

* 「コンピュータを再起動してください」と表示される場合がある．そのときは，再起動する．
GeForce Experience が自動で開く場合がある
- 利用条件について表示されたときは、よく確認し、納得できる場合のみ同意・続行する
- リリースハイライトが表示される場合がある．
  リリースハイライトを確認したら，「x」をクリックして閉じる．
- このとき，最新版への更新が始まり，起動に時間がかかることがある．
  そして「お使いのGPU向けの新しいドライバーが入手可能です」と表示されることがある．そのときは，新しいドライバをインストールする．
NVIDIA CUDA ツールキットのインストールが終わったら，ユーザ環境変数 TEMP の設定を行う．
Windows のユーザ名が日本語のとき，nvcc がうまく動作しないエラーを回避するためである．
ユーザ環境変数 TEMP に「C:\TEMP」を設定するために，コマンドプロンプトで，次のコマンドを実行する．
mkdir C:\TEMP powershell -command "[System.Environment]::SetEnvironmentVariable(\"TEMP\", \"C:\TEMP\", \"User\")"

インストール後の環境変数の確認

Windows のシステム環境変数が自動で設定される

システム環境変数 PATH
バージョン 11.0 の場合
次のように自動設定される．
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\libnvpp
* 複数の版の CUDA ツールキットをインストールする場合には，複数のパスが設定されるこのとき・古い版の方が先に来ている場合には、後になるように調整する
システム環境変数 CUDA_PATH
バージョン 11.0 の場合
次のように自動設定される．
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0
* 複数の版の CUDA ツールキットをインストールしている場合には，最後にインストールしたものが設定される
その他
バージョン 11.0 の場合
システム環境変数 CUDA_PATH_V11_0
次のように自動設定される．
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0

nvcc の動作確認 (パスの確認)

CUDAコンパイラ nvcc にパスが通っている（コマンドプロンプトから直接実行できる状態になっている）ことを確認します。

新しいコマンドプロンプトを開き（環境変数の変更を反映させるため）、次のコマンドを実行します。 nvcc.exe のフルパスが表示されれば、パスが正しく設定されています。エラーメッセージが出る場合は、環境変数 PATH の設定を確認してください。

where nvcc

NVIDIA cuDNN v8.2.1 のインストール

NVIDIA cuDNN

NVIDIA cuDNN は，NVIDIA CUDA ツールキット上で動作する、高性能なディープラーニング用ライブラリです．畳み込みニューラルネットワーク (CNN) やリカレントニューラルネットワーク (RNN) など，さまざまなディープラーニングモデルのトレーニングと推論を高速化します．

【cuDNN利用時の注意点: zlibwapi.dll エラー】

Windows環境でcuDNNを利用するアプリケーションを実行した際に、「Could not locate zlibwapi.dll. Please make sure it is in your library path!」というエラーが表示されることがあります。これは、cuDNNの一部の機能が圧縮ライブラリである zlib に依存しているためです。このエラーが発生した場合は、後述する手順で ZLIB DLL をインストールする必要があります。

【関連する外部ページ】

NVIDIA cuDNN の公式ページ（ダウンロードにはDeveloper Programへの登録が必要）: https://developer.nvidia.com/cudnn

NVIDIA cuDNN のインストール（Windows 上）の概要

NVIDIA Developer Program メンバーシップへの加入: cuDNNのダウンロードには無料のメンバーシップ登録が必要です。
NVIDIA Developer Program の公式ページ: https://developer.nvidia.com/developer-program
互換バージョンの選択とダウンロード: インストール済みのCUDAツールキットのバージョン (今回は11.x) に適合するcuDNNのバージョン (今回はv8.9.7) を選択し、Windows用のzipファイルをダウンロードします。
ファイルの展開と配置: ダウンロードしたzipファイルを展開（解凍）し、中のファイル（bin, include, lib フォルダ内）を、CUDAツールキットのインストールディレクトリにコピーします。
(オプション) 環境変数の設定: 必要に応じてシステム環境変数 CUDNN_PATH を設定します。
(必要に応じて) ZLIB DLL のインストール: zlibwapi.dll が見つからないエラーが発生する場合にインストールします。
動作確認: cuDNNライブラリ (cudnn64_*.dll) にパスが通っているか確認します。

ダウンロードとインストールの手順

NVIDIA cuDNN のウェブページを開く
https://developer.nvidia.com/cuDNN
ダウンロードしたいので，cuDNNのところにある「Download cuDNN」をクリック．
メンバーシップに入る
ログインする
調査の画面が出たときは，調査に応じる
ライセンス条項の確認
「Archived cuDNN Releases」をクリック
ダウンロードしたいバージョンを選ぶ
ここでは「cuDNN v 8.2.1, for CUDA 11.X」を選んでいる．
このとき，画面の「for CUDA ...」のところを確認し，使用するNVIDIA CUDA のバージョンに合うものを選ぶこと．
Windows にインストールするので Windows 版を選ぶ
ダウンロードが始まる．
ダウンロードした .zip ファイルを展開（解凍）する．展開の結果 cuda という名前のディレクトリができる．その中のサブディレクトリを確認しておく．

Windows での展開（解凍）に便利な 7-Zip: 別ページ »で説明
NVIDIA CUDA ツールキットをインストールしたディレクトリは，「C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0」のようになっている．確認する．
確認したら，さきほど展開してできたディレクトリcuda の下にあるすべてのファイルとディレクトリを，NVIDIA CUDA ツールキットをインストールしたディレクトリにコピーする

インストール後に行う環境変数の設定

「NVIDIA cuDNN をインストールしたディレクトリ」をもとに環境変数を設定する．

「NVIDIA cuDNN をインストールしたディレクトリ」が C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0 の場合には，次のように設定する．

すでに，c:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin には，パスが通っている．
Windows のシステム環境変数 CUDNN_PATH に，c:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0 を設定
Windows で，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。
次のコマンドを実行
powershell -command "[System.Environment]::SetEnvironmentVariable(\"CUDNN_PATH\", \"c:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\", \"Machine\")"
Windows では，次の操作により，cudnn64_8.dll にパスが通っていることを確認する．
Windows のコマンドプロンプトを開き，次のコマンドを実行する．エラーメッセージが出ないことを確認．
where cudnn64_8.dll

Visual Studio の x64 Native Tools コマンドプロンプトを起動します。をコマンドで使いたいので，Visual Studio の x64 Native Tools コマンドプロンプトを起動．

起動は，Windows のメニューで「Visual Studio 2019」の下の「x64 Native Tools コマンドプロンプト (x64 Native Tools Command Prompt)」を選ぶ．「x64」は，64ビット版の意味である．

* 32ビット版のNative Tools コマンドプロンプト（例: x86 Native Tools）では、64ビット用CUDAツールキットの nvcc が正しく動作しない場合があります。

以下の操作は，この x64 Native Tools コマンドプロンプトで行います。

C++コンパイラ(cl.exe)へのパスが通っているか確認します。

コマンドプロンプトで「where cl」を実行し、cl.exe のパスが表示されることを確認します。エラーメッセージが出る場合は、Visual Studio または Build Tools のインストールに問題がある可能性があります。

where cl

nvccの動作確認用のサンプルコードを作成します。

ここでは、NVIDIAのブログ記事 Easy Introduction to CUDA C and C++ に記載されている簡単なベクトル加算のコードを使用します。このコードは、CPUとGPUそれぞれでベクトル加算を行い、結果が一致するかを確認するものです。

まず、作業ディレクトリに移動し、エディタ（ここではメモ帳 notepad）でソースファイル hello.cu を作成します。

cd /d c:%HOMEPATH%
notepad hello.cu

その後，ファイルを編集し，ファイルを保存．

エディタで hello.cuのようなファイル名で保存．

ビルドと実行．

「nvcc hello.cu」で a.exe というファイルができる．「Max error: 0.000000」と表示されればＯＫ．

うまく動かないときは，まず，マイクロソフト C++ ビルドツールの動作を，別ページの手順により確認し，異常があれば，マイクロソフト C++ ビルドツールのインストールなどで対処．それでも動かないときは，NVIDIA CUDA ツールキット 11.0 のインストールしたときの作業に間違いがなかったかを再確認．

del a.exe
nvcc hello.cu

.\a.exe

NVIDIA CUDA 11.0 の動作確認のため，TensorFlow 2.4.4 を実行してみる

Python 3.8 をインストールの後，次のコマンドを実行することにより， TensorFlow 2.4.4 のインストール，インストール済みの TensorFlow のバージョンの確認，TensorFlow から GPU が認識できているかの確認を行う．エラーメッセージが出なければ OK．

Windows で，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。

次のコマンドを実行

python -m pip install tensorflow==2.4.4
python -c "import tensorflow as tf; print(tf.__version__)"
python -c "from tensorflow.python.client import device_lib; print(device_lib.list_local_devices())"