MMCV 2 のインストールと動作確認(画像表示など)(PyTorch,Python を使用)(Windows 上)

概要MMCV は OpenMMLab が提供する基礎的な機能を持つライブラリです。Windows 環境で MMCV を使用する前準備として、Git、Python、Build Tools for Visual Studio 2022、NVIDIA ドライバ、CUDA ツールキット、cuDNN、PyTorch をインストールします。MMCV のインストールはソースコードからビルドする方法が説明しています。インストール後は Python プログラムを用いて画像表示や図形描画ができます。画像ファイルの表示、ランダムな色の画像生成、四角形の表示を行うサンプルプログラムが示しています。MMCV を活用することで、コンピュータビジョンに関連する様々な処理を効率的に実装できます。

目次

  1. 前準備
  2. MMCV のインストール(Windows 上)
  3. MMCV を用いた画像表示(Windows 上)

MMCV

MMCV は, OpenMMLab の構成物で,基礎的な機能を提供する.

文献

MMCV Contributors, MMCV: OpenMMLab Computer Vision Foundation, https://github.com/open-mmlab/mmcv, 2018.

関連する外部ページ

前準備

Build Tools for Visual Studio 2022 のインストール(Windows 上)

Build Tools for Visual Studio は,Visual Studio の IDE を含まない C/C++ コンパイラ,ライブラリ,ビルドツール等のコマンドライン向け開発ツールセットである。

以下のコマンドを管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。

REM VC++ ランタイム
winget install --scope machine --accept-source-agreements --accept-package-agreements --silent --id Microsoft.VCRedist.2015+.x64

REM Build Tools + Desktop development with C++(VCTools)+ 追加コンポーネント(一括)
winget install --id Microsoft.VisualStudio.2022.BuildTools --accept-source-agreements --accept-package-agreements ^
    --override "--passive --wait --norestart --add Microsoft.VisualStudio.Workload.VCTools --includeRecommended --add Microsoft.VisualStudio.Component.VC.Llvm.Clang --add Microsoft.VisualStudio.ComponentGroup.ClangCL --add Microsoft.VisualStudio.Component.VC.CMake.Project --add Microsoft.VisualStudio.Component.Windows11SDK.26100"

--add で追加されるコンポーネント

上記のコマンドでは,まず Build Tools 本体と Visual C++ 再頒布可能パッケージをインストールし,次に setup.exe を用いて以下のコンポーネントを追加している。

インストール完了の確認

winget list Microsoft.VisualStudio.2022.BuildTools

上記以外の追加のコンポーネントが必要になった場合は Visual Studio Installer で個別にインストールできる。

Visual Studio の機能を必要とする場合は、追加インストールできる。

Python 3.12 のインストール(Windows 上) [クリックして展開]

以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。

方法1:winget によるインストール

管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

winget install -e --id Python.Python.3.12 --scope machine --silent --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 AssociateFiles=1 InstallLauncherAllUsers=1"

--scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

方法2:インストーラーによるインストール

  1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
  2. ダウンロードしたインストーラーを実行する。
  3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
  4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

インストールの確認

コマンドプロンプトで以下を実行する。

python --version

バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

Git のインストール

以下のコマンドを管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。管理者権限は、wingetの--scope machineオプションでシステム全体にソフトウェアをインストールするために必要となる。

REM Git をシステム領域にインストール
winget install --scope machine --id Git.Git -e --silent --accept-source-agreements --accept-package-agreements
REM Git のパス設定
set "GIT_PATH=C:\Program Files\Git\cmd"
for /f "skip=2 tokens=2*" %a in ('reg query "HKLM\SYSTEM\CurrentControlSet\Control\Session Manager\Environment" /v Path') do set "SYSTEM_PATH=%b"
if exist "%GIT_PATH%" (
    echo "%SYSTEM_PATH%" | find /i "%GIT_PATH%" >nul
    if errorlevel 1 setx PATH "%GIT_PATH%;%SYSTEM_PATH%" /M >nul
)

関連する外部ページ

Build Tools for Visual Studio 2022,NVIDIA ドライバ,NVIDIA CUDA ツールキット 11.8,NVIDIA cuDNN 8.9.7 のインストール(Windows 上)

サイト内の関連ページNVIDIA グラフィックスボードを搭載しているパソコンの場合には, NVIDIA ドライバNVIDIA CUDA ツールキットNVIDIA cuDNN のインストールを行う.

関連する外部ページ

PyTorch のインストール(Windows 上)

  1. 以下の手順を管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。
  2. PyTorch のページを確認

    PyTorch の公式ページ: https://pytorch.org/index.html

  3. 次のようなコマンドを実行(実行するコマンドは,PyTorch のページの表示されるコマンドを使う).

    次のコマンドを実行することにより, PyTorch 2.3 (NVIDIA CUDA 11.8 用)がインストールされる. 但し,Anaconda3を使いたい場合には別手順になる.

    事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).

    PyTorch で,GPU が動作している場合には,「torch.cuda.is_available()」により,True が表示される.

    python -m pip install -U --ignore-installed pip
    python -m pip uninstall -y torch torchvision torchaudio torchtext xformers
    python -m pip install -U torch torchvision torchaudio numpy --index-url https://download.pytorch.org/whl/cu118
    
    python -c "import torch; print(torch.__version__, torch.cuda.is_available())" 
    
    Anaconda3を使いたい場合には, Anaconda プロンプト (Anaconda Prompt)管理者として実行し, 次のコマンドを実行する. (PyTorch と NVIDIA CUDA との連携がうまくいかない可能性があるため,Anaconda3を使わないことも検討して欲しい).
    conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 cudnn -c pytorch -c nvidia
    py -c "import torch; print(torch.__version__, torch.cuda.is_available())" 
    

    サイト内の関連ページ

    関連する外部ページ

MMCV のインストール(Windows 上)

インストールの方法は複数ある. ここでは, NVIDIA CUDA ツールキットを使うことも考え, インストールしやすい方法として,ソースコードからビルドしてインストールする方法を案内している.

  1. 以下の手順を管理者権限コマンドプロンプトで実行する (手順:Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」)。
  2. PyTorch がインストールできていることを確認するために,PyTorch のバージョンを表示
    python -c "import torch; TORCH_VERSION = '.'.join(torch.__version__.split('.')[:2]); print(TORCH_VERSION)"
    
  3. PyTorch が NVIDIA CUDA ツールキットを認識できていることを確認するために, PyTorch が認識しているNVIDIA CUDA ツールキット のバージョンを表示

    このとき,実際には 11.8 をインストールしているのに,「cu117」のように古いバージョンが表示されることがある.このような場合は,気にせずに続行する.

    python -c "import torch; CUDA_VERSION = torch.__version__.split('+')[-1]; print(CUDA_VERSION)"
    
  4. MIM,MMCV 2 のインストール

    インストール手順は, https://mmcv.readthedocs.io/en/latest/get_started/installation.html に記載の手順による

    python -m pip install -U --ignore-installed pip
    python -m pip uninstall -y openmim mmcv mmcv-full opencv-python opencv-python-headless
    python -m pip install -U openmim opencv-python
    cd /d c:%HOMEPATH%
    rmdir /s /q mmcv
    git clone -b main https://github.com/open-mmlab/mmcv.git
    cd mmcv
    pip install -r requirements.txt
    mim uninstall -y mmcv
    mim install -e .
    mim list
    python -c "import mmcv; print(mmcv.__version__)"
    

    (途中省略)
  5. mim list の実行により確認
    mim list
    
  6. MMCV をインストールできたことの確認

    エラーメッセージが出ないこと.

    python -c "from mmcv.ops import get_compiling_cuda_version, get_compiler_version; print(get_compiling_cuda_version()); print(get_compiler_version())"
    

MMCV を用いた画像表示(Windows 上)

Python プログラムは,公式ページ https://mmcv.readthedocs.io/en/latest/understand_mmcv/visualization.html のものを使用.

  1. 画像ファイルを表示する Python プログラム

    次の Python プログラムを実行する.

    mmcv を用いた表示を行うので,Jupyter QtConsoleJupyter ノートブック (Jupyter Notebook) の利用が便利である.下図では,Python プログラムの実行のため,jupyter qtconsole を使用している.

    このプログラムは、ユーザーのホームディレクトリ内の "mmcv" フォルダに移動し、"tests/data/color.jpg" という画像ファイルを表示します。画像の表示には、mmcv ライブラリの imshow 関数を使用しています。
    import os
    import mmcv
    
    def main():
        home_path = os.path.expanduser("~")
        mmcv_path = os.path.join(home_path, "mmcv")
        os.chdir(mmcv_path)
    
        image_path = "tests/data/color.jpg"
        mmcv.imshow(image_path)
    
    if __name__ == "__main__":
        main()
    
  2. データを画像として表示する Python プログラム

    次の Python プログラムを実行する.

    mmcv を用いた表示を行うので,Jupyter QtConsoleJupyter ノートブック (Jupyter Notebook) の利用が便利である.下図では,Python プログラムの実行のため,jupyter qtconsole を使用している.

    このプログラムは、ユーザーのホームディレクトリ内の "mmcv" フォルダに移動し、高さ100ピクセル、幅100ピクセルのランダムな色の画像を生成します。生成された画像は、mmcv ライブラリの imshow 関数を使用して表示されます。
    import os
    import numpy as np
    import mmcv
    
    def main():
        home_path = os.path.expanduser("~")
        mmcv_path = os.path.join(home_path, "mmcv")
        os.chdir(mmcv_path)
    
        img_height, img_width = 100, 100
        img = generate_random_image(img_height, img_width)
        mmcv.imshow(img)
    
    def generate_random_image(height, width):
        return np.random.rand(height, width, 3)
    
    if __name__ == "__main__":
        main()
    
  3. 四角形を表示する Python プログラム

    次の Python プログラムを実行する.

    mmcv を用いた表示を行うので,Jupyter QtConsoleJupyter ノートブック (Jupyter Notebook) の利用が便利である.下図では,Python プログラムの実行のため,jupyter qtconsole を使用している.

    このプログラムは、ユーザーのホームディレクトリ内の "mmcv" フォルダに移動し、高さ100ピクセル、幅100ピクセルのランダムな色の画像を生成します。その画像上に、2つのバウンディングボックス(矩形領域)を描画し、mmcv ライブラリの imshow_bboxes 関数を使用して表示します。
    import os
    import numpy as np
    import mmcv
    
    def main():
        home_path = os.path.expanduser("~")
        mmcv_path = os.path.join(home_path, "mmcv")
        os.chdir(mmcv_path)
    
        img_height, img_width = 100, 100
        img = generate_random_image(img_height, img_width)
    
        bbox1 = [0, 0, 50, 50]
        bbox2 = [20, 20, 60, 60]
        bboxes = np.array([bbox1, bbox2])
    
        mmcv.imshow_bboxes(img, bboxes)
    
    def generate_random_image(height, width):
        return np.random.rand(height, width, 3)
    
    if __name__ == "__main__":
        main()