トップページ -> インストール,設定,利用 -> Ubuntu, Debian ソフトウエア -> NVIDIA ドライバ,NVIDIA CUDA ツールキット 10.1,NVIDIA cuDNN 7,NCCL,TensorRT のインストール(Ubuntu 上)
[サイトマップへ], [サイト内検索へ]

NVIDIA ドライバ,NVIDIA CUDA ツールキット 10.1,NVIDIA cuDNN 7,NCCL,TensorRT のインストール(Ubuntu 上)

Ubuntu での,NVIDIA ドライバ,NVIDIA CUDA ツールキット 10.1,NVIDIA cuDNN 7,NCCL,TensorRT のインストール手順をスクリーンショット等で説明する.

GPU とは,グラフィックス・プロセッシング・ユニットの略で、コンピュータグラフィックス関連の機能,乗算や加算の並列処理の機能などがある. CUDA とは,NVIDIA社が提供している GPU 用のプラットフォームである. NVIDIA 社のグラフィックスボードが持つ GPU の機能を使うとき,CUDA を利用することができる. cuDNN は,NVIDIA CUDA Deep Neural Network libraryである.

TensorFlow が,2020年1月時点では,10.1 対応10.2 に未対応).

根拠は https://www.tensorflow.org/install/gpu). そこで,CUDA 10.1 をインストールする.

目次

  1. 前準備
  2. NVIDIA CUDA ツールキットのインストール
  3. NVIDIA cuDNN, NCCL のインストール

参考Webページ


前準備

OS のシステム更新

Ubuntu, Debian で OS のシステム更新を行うときは, 端末で,次のコマンドを実行.

sudo apt update
sudo apt -yV upgrade
sudo /sbin/shutdown -r now

NVIDIA グラフィックスボードの確認とドライバのインストール

参考Webページ https://docs.nvidia.com/deploy/cuda-compatibility/index.html

グラフィックスボードの確認

CUDA 対応の GPU であるかを確認のため, 端末で,次のコマンドを実行.

lspci | grep -i nvidia | grep VGA

実行結果の例.(表示が空になるときは,NVIDIAのグラフィックスボードが無い可能性がある).

X.org の設定の確認

glxinfo | grep direct

[image]

xdriinfo

[image]

NVIDIA ドライバのインストール

NVIDIA グラフィックスボードがある場合に限り,ドライバのインストールを行う

  1. 端末で,次のコマンドを実行.
    sudo ubuntu-drivers autoinstall
    

  2. ドライバのインストール後は,システムの再起動
    sudo shutdown -r now
    
  3. 確認

    システムの再起動後,端末で,次のコマンドを実行し,ドライバ等を確認する

    先頭の「Driver Version」のところに,ドライバのバージョンが表示される.NVIDIA CUDA がインストール済みのときは,CUDA のバージョンも表示される.

    nvidia-smi
    


NVIDIA CUDA ツールキットのインストール

参考Webページ: https://www.tensorflow.org/install/gpu

旧バージョンの CUDA ツールキットをアンインストールする操作

cd /tmp
sudo apt --purge remove cuda*
sudo apt autoremove

※ deb パッケージ以外で CUDA をインストールしていた場合には,上の操作ではアンインストールできないことに注意.

カーネルヘッダーと,カーネル開発用パッケージのインストール

sudo apt -yV install linux-headers-$(uname -r)

[image]

Wget のインストール

端末で,次のコマンドを実行.

sudo apt -yV install wget

Linux のバージョンを確認

uname -m
lsb_release -sc
cat /etc/*release

NVIDIA CUDA のパッケージレポジトリの確認

Linux の種類やバージョンごとに, NVIDIA CUDA のパッケージレポジトリの場所が違うので確認する.

Ubuntu 18.04 の場合は, https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ で確認.

スクロールして「cuda-repo・・・」を探す

※ 他の Linux も種々選ぶことができる : https://developer.download.nvidia.com/compute/cuda/repos/

NVIDIA CUDA のパッケージレポジトリの追加

TensorFlow が,2020年1月時点では,10.1 対応10.2 に未対応). (根拠は https://www.tensorflow.org/install/gpu)なので,次のコマンドを実行.

端末で,次のコマンドを実行.

cd /tmp
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update

NVIDIA CUDA のインストールと確認

  1. インストール

    端末で,次のコマンドを実行.

    sudo apt -yV install cuda-10.1
    

    [image]
  2. 動作確認

    TensorFlow GPU 版を動作させてみることで, CUDA ツールキットの動作確認を行う.

    1. TensorFlow GPU 版をインストール

      sudo pip3 uninstall tensorflow tensorflow-gpu
      sudo pip3 install -U tensorflow-gpu
      

      [image]
      (以下省略)
    2. TensorFlow からGPU が認識できているかの確認

      python3 -c "from tensorflow.python.client import device_lib; print(device_lib.list_local_devices())"
      

      次のように「device_type: "GPU"」があれば,GPUが認識できている.

      [image]
  3. NVIDIA CUDA ツールキットにパスを通す設定

    端末で,次のコマンドを実行.

    export CUDA_PATH=/usr/local/cuda-10.1
    echo 'export CUDA_PATH=/usr/local/cuda-10.1' >> ${HOME}/.bashrc
    export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:${LD_LIBRARY_PATH}
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:${LD_LIBRARY_PATH}' >> ${HOME}/.bashrc
    export PATH=/usr/local/cuda-10.1/bin:${PATH}
    echo 'export PATH=/usr/local/cuda-10.1/bin:${PATH}' >> ${HOME}/.bashrc
    


NVIDIA cuDNN, NCCL, TensorRT のインストール

  1. NVIDIA cuDNN, NCCL のパッケージレポジトリの確認

    ※ 他にも,REHL7, Ubuntu 14.04, Ubuntu 16.04 のレポジトリがある.

  2. パッケージ名の確認

    端末で,次のコマンドを実行.

    apt-cache search cudnn
    apt-cache search nccl 
    apt-cache search tensorrt
    

  3. NVIDIA cuDNN, NCCL, TensorRT のインストール

    端末で,次のコマンドを実行.

    sudo apt -yV install cudnn7 cudnn7-dev
    sudo apt -yV install libnccl2 libnccl-dev
    sudo apt -yV install libnvinfer7 python3-libnvinfer
    
  4. インストールされたパッケージの確認
    dpkg -l | grep cuda 
    

  5. 確認

    システムの再起動後,端末で,次のコマンドを実行し,CUDA のバージョン等を確認する

    nvidia-smi
    

本サイトは金子邦彦研究室のWebページです.サイトマップは,サイトマップのページをご覧下さい. 本サイト内の検索は,サイト内検索のページをご利用下さい.

問い合わせ先: 金子邦彦(かねこ くにひこ) [image]