物体検出，物体検出のための学習の実行（YOLOv5，PyTorch，Python を使用）（Windows 上）

Windowsで，YOLOv5をインストールし，物体検出，セグメンテーション，画像分類の実行が可能である．インストールは公式のGitHubページの説明に従って行い，コマンドプロンプトで操作する．YOLOv5 に付属の物体検出の学習済みモデルは，COCOデータセットで学習され，yolov5n.ptなどから選ぶことができる．学習のために必要となる画像データとアノテーションは，YOLO形式のオープンデータを用いることができる．そのとき，クラス番号を 80 やそれより大きい値に振り直す．そのためのPythonプログラムはこのページで提供している．学習は，オプションを指定して実行する．

【目次】

前準備
YOLOv5 のインストール（Windows 上）
物体検出を実行する Python プログラム（YOLOv5 を使用）（Windows 上）
YOLO形式のオープンデータを用いて，新しいクラスの物体検出ができるように学習（書きかけ）

前準備

Build Tools for Visual Studio 2022 （ビルドツール for Visual Studio 2022）または Visual Studio 2022 のインストール（Windows 上）

CUDAツールキットは、GPU上でコードをコンパイルするためにC++コンパイラを必要とします。そのため、事前にMicrosoft C++ Build Tools または Visual Studio (C++開発ワークロードを含む) をインストールしておく必要があります。

【インストールの判断】 Build Tools for Visual Studio は，C++コンパイラなどを含む開発ツールセットです． Visual Studio は統合開発環境であり，いくつかのエディションがあり，Build Tools for Visual Studioの機能を含むか連携して使用します．インストールは以下の基準で判断してください：

コマンドラインからのビルドなど、C++コンパイラ機能のみが必要な場合:
Build Tools for Visual Studio のインストールを行います．
Visual Studioのエディタやデバッガなどの統合開発環境機能が必要な場合、あるいは、どちらをインストールすべきかよく分からない場合:
Visual Studio Community (または他のエディション) をインストールします．

Visual Studio 2022 をインストールする際に，「C++ によるデスクトップ開発」ワークロードを選択することで，必要なBuild Toolsの機能も一緒にインストールされます．

不明な点がある場合は，Visual Studio 全体をインストールする方が、後で機能を追加する手間が省ける場合があります．

Build Tools for Visual Studio 2022 のインストール（Windows 上）

Windows で，コマンドプロンプトを管理者権限で起動します（例：Windowsキーを押し，「cmd」と入力し，「管理者として実行」を選択）。
以下のwingetコマンドを実行します。wingetはWindows標準のパッケージマネージャーです。

--scope machine オプションはシステム全体にインストールすることを意味します。

次のコマンドは，Build Tools for Visual Studio 2022と、多くのプログラムで必要とされるVC++ 2015以降の再頒布可能パッケージをインストールします．
winget install --scope machine Microsoft.VisualStudio.2022.BuildTools winget install --scope machine Microsoft.VCRedist.2015+.x64
Build Tools for Visual Studio 2022 で C++ によるデスクトップ開発関連コンポーネントのインストール
CUDA開発には、標準のC++開発ツールに加えて、特定のコンポーネントが必要になる場合があります。
1. Visual Studio Installer を起動します。
  起動方法: スタートメニューから「Visual Studio Installer」を探して実行します．
2. Visual Studio Build Tools 2022 の項目で「変更」ボタンをクリックします．
3. 「ワークロード」タブで「C++ によるデスクトップ開発」をクリックして選択します。画面右側の「インストールの詳細」で、必要に応じて「v143 ビルドツール用 C++/CLI サポート（最新）」、「ATL」、「MFC」などをチェックします（これらは一般的なC++開発や特定のプロジェクトタイプで必要になる場合があります）。その後、「変更」をクリックしてインストールまたは変更を適用します．

Visual Studio Community 2022 のインストール（Windows 上）

Windows で，コマンドプロンプトを管理者権限で起動します。
インストールコマンドの実行
以下のwingetコマンドを実行します。--override "--add ..." 部分で、インストールするワークロードやコンポーネントを指定しています。
winget install Microsoft.VisualStudio.2022.Community --scope machine --override "--add Microsoft.VisualStudio.Workload.NativeDesktop Microsoft.VisualStudio.ComponentGroup.NativeDesktop.Core Microsoft.VisualStudio.Component.VC.CLI.Support Microsoft.VisualStudio.Component.CoreEditor Microsoft.VisualStudio.Component.NuGet Microsoft.VisualStudio.Component.Roslyn.Compiler Microsoft.VisualStudio.Component.TextTemplating Microsoft.VisualStudio.Component.Windows.SDK.Latest Microsoft.VisualStudio.Component.VC.Tools.x86.x64 Microsoft.VisualStudio.Component.VC.ATL Microsoft.VisualStudio.Component.VC.ATLMFC" winget install Microsoft.VisualStudio.2022.Community --scope machine Microsoft.VCRedist.2015+.x64
インストールされる主要なコンポーネントの説明：
- NativeDesktop (C++によるデスクトップ開発): CUDA開発に必要なC++コンパイラ(VC.Tools.x86.x64)やWindows SDK (Windows.SDK.Latest)など、基本的な開発ツール一式を含みます。
- CoreEditor: Visual Studioの基本的なコードエディタ機能を提供します。
- VC.CLI.Support: C++/CLIを用いた開発サポート（通常、純粋なCUDA C++開発では不要な場合もあります）。
- NuGet: .NETライブラリ管理用（C++プロジェクトでも利用されることがあります）。
- VC.ATL / VC.ATLMFC: 特定のWindowsアプリケーション開発フレームワーク（通常、CUDA開発自体には直接必要ありません）。
システム要件と注意事項：
- 管理者権限でのインストールが必須です。
- 必要ディスク容量：10GB以上（選択するコンポーネントにより変動）。
- 推奨メモリ：8GB以上のRAM。
- インストール過程でシステムの再起動が要求される可能性があります。
- 安定したインターネット接続環境が必要です。
後から追加のコンポーネントが必要になった場合は，Visual Studio Installerを使用して個別にインストールすることが可能です．
インストール完了の確認
インストールが成功したか確認するには、管理者権限のコマンドプロンプトで以下のコマンドを実行します。
winget list Microsoft.VisualStudio.2022.Community
リストに表示されればインストールされています。

トラブルシューティング：

インストール失敗時は，以下のログファイルを確認すると原因究明の手がかりになります：
%TEMP%\dd_setup_.log %TEMP%\dd_bootstrapper_.log
( は実行日時に対応する文字列)
(オプション) Visual Studio Installer での確認と変更
wingetでのインストール後も、Visual Studio Installerを使ってインストール内容を確認・変更できます。
1. Visual Studio Installer を起動します。
2. Visual Studio Community 2022 の項目で「変更」をクリックします。
3. 「ワークロード」タブで「C++ によるデスクトップ開発」がチェックされていることを確認します。必要であれば、「個別のコンポーネント」タブで特定のツール（例: 特定バージョンのMSVCコンパイラ、CMakeツールなど）を追加・削除できます。「インストールの詳細」で「v143 ビルドツール用 C++/CLI サポート（最新）」などが選択されているかも確認できます。変更後、「変更」または「インストール」をクリックします。

Python 3.12，Git のインストール（Windows 上）

Pythonは，プログラミング言語の１つ． Gitは，分散型のバージョン管理システム．

【手順】

Windows で，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。

次のコマンドを実行

次のコマンドは，Python ランチャーとPython 3.12とGitをインストールし，Gitにパスを通すものである．

次のコマンドでインストールされるGitは「git for Windows」と呼ばれるものであり， Git，MinGW などから構成されている．

reg add "HKLM\SYSTEM\CurrentControlSet\Control\FileSystem" /v LongPathsEnabled /t REG_DWORD /d 1 /f
REM Python, Git をシステム領域にインストール
winget install --scope machine --id Python.Python.3.12 --id Python.Launcher --id Git.Git -e --silent
REM Python のパス
set "INSTALL_PATH=C:\Program Files\Python312"
echo %PATH% | find /i "%INSTALL_PATH%" >nul
if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%" /M >nul
echo %PATH% | find /i "%INSTALL_PATH%\Scripts" >nul
if errorlevel 1 setx PATH "%PATH%;%INSTALL_PATH%\Scripts" /M >nul
REM Git のパス
set "NEW_PATH=C:\Program Files\Git\cmd"
if exist "%NEW_PATH%" echo %PATH% | find /i "%NEW_PATH%" >nul
if exist "%NEW_PATH%" if errorlevel 1 setx PATH "%PATH%;%NEW_PATH%" /M >nul

【関連する外部ページ】

Python の公式ページ: https://www.python.org/
Git の公式ページ: https://git-scm.com/

【サイト内の関連ページ】

Python詳細ガイド：別ページ »

【関連項目】 Python, Git バージョン管理システム, Git の利用

Build Tools for Visual Studio 2022，NVIDIA ドライバ，NVIDIA CUDA ツールキット 11.8，NVIDIA cuDNN 8.6 のインストール（Windows 上）

【サイト内の関連ページ】 NVIDIA グラフィックスボードを搭載しているパソコンの場合には， NVIDIA ドライバ， NVIDIA CUDA ツールキット， NVIDIA cuDNN のインストールを行う．

Windows での Build Tools for Visual Studio 2022，NVIDIA ドライバ，NVIDIA CUDA ツールキット 11.8，NVIDIA cuDNN v5.6 のインストールと動作確認: 別ページ »で説明

【関連する外部ページ】

Build Tools for Visual Studio 2022 （ビルドツール for Visual Studio 2022）の公式ダウンロードページ: https://visualstudio.microsoft.com/ja/visual-cpp-build-tools/
NVIDIA ドライバのダウンロードの公式ページ: https://www.nvidia.co.jp/Download/index.aspx?lang=jp
NVIDIA CUDA ツールキットのアーカイブの公式ページ: https://developer.nvidia.com/cuda-toolkit-archive
NVIDIA cuDNN のダウンロードの公式ページ: https://developer.nvidia.com/cudnn

PyTorch のインストール（Windows 上）

Windows 環境に PyTorch をインストールする手順を解説します．主に pip を使用する方法と Miniconda (conda) を使用する方法を紹介します．

1. 実行前の準備

インストール作業を行う前に，以下の準備と確認を行ってください．

管理者権限でのコマンドプロンプト/Miniconda Prompt 起動:
インストールコマンドは管理者権限で実行することを推奨します．Windows キーを押し「cmd」または「Miniconda Prompt」と入力し，「管理者として実行」を選択して起動してください．
Python 環境:
システムに Python がインストールされ，pip または Miniconda (conda) が利用可能な状態であることを確認してください．
NVIDIA CUDA Toolkit (GPU版を利用する場合):
PyTorch で NVIDIA GPU を利用する場合は，対応する GPU と，適切なバージョンの NVIDIA CUDA Toolkit が事前にインストールされている必要があります．
- CUDA バージョンの確認: コマンドプロンプト等で nvcc --version を実行し，バージョンを確認します．この例では CUDA 11.8 がインストール済みであると仮定します．
- 互換性の確認: インストールする PyTorch と互換性のある CUDA バージョンを PyTorch 公式サイトで確認してください．

2. PyTorch 公式サイトでのコマンド確認

【重要】 PyTorch のインストールコマンドは，OS，パッケージ管理ツール (pip/conda)，Python バージョン，CUDA バージョンによって異なります．必ず以下の PyTorch 公式サイトで，ご自身の環境に合った最新のインストールコマンドを確認・実行してください．

PyTorch 公式サイト (インストールページ): https://pytorch.org/get-started/locally/

以下の手順で示すコマンドは，特定の環境（例: CUDA 11.8）における一例です．

3. pip を使用したインストール

Python 標準のパッケージ管理ツール pip を使用する方法です．

(1) pip の更新 (任意)

python -m pip install --upgrade pip

(2) 既存の PyTorch 関連パッケージのアンインストール (推奨)
古いバージョン等がインストールされている場合に実行します．

python -m pip uninstall torch torchvision torchaudio
# 必要に応じて torchtext, xformers などもアンインストール
# python -m pip uninstall torchtext xformers

(3) PyTorch のインストール
【注意】 必ず公式サイトで生成したコマンドを使用してください．以下は CUDA 11.8 環境向けの一例です．

# 公式サイトで取得した pip install コマンドを実行
# 例 (CUDA 11.8):
python -m pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

(4) インストールの確認

python -c "import torch; print(f'PyTorch Version: {torch.__version__}'); print(f'CUDA Available: {torch.cuda.is_available()}')"

CUDA Available: True と表示されれば，GPU が正しく認識されています (GPU 環境の場合)．

4. Miniconda (conda) を使用したインストール

データサイエンス環境構築によく使われる Miniconda (または Anaconda) を使用している場合は，conda コマンドでもインストールできます．

注意点:
conda 環境では，PyTorch のような複雑な依存関係を持つライブラリの場合，pip よりも依存関係の問題が発生することがあります．問題が発生した場合は，pip を使用したインストール（セクション3）を試すことを検討してください．

(1) Miniconda Prompt (または Anaconda Prompt) の起動
管理者として実行で Miniconda Prompt を起動します．

(2) PyTorch のインストール
【注意】 必ず公式サイトで Package に Conda を選択し，生成されたコマンドを使用してください．以下は CUDA 11.8 環境向けの一例です．

# 公式サイトで取得した conda install コマンドを実行
# 例 (CUDA 11.8):
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

-c pytorch -c nvidia は，PyTorch と NVIDIA の公式 conda チャネルを指定しています．

(3) インストールの確認

python -c "import torch; print(f'PyTorch Version: {torch.__version__}'); print(f'CUDA Available: {torch.cuda.is_available()}')"

YOLOv5 のインストールと実行手順（Windows環境）

YOLOv5 の公式リポジトリ https://github.com/ultralytics/yolov5 の手順に従ってインストールを実施する．

Windows で，管理者権限でコマンドプロンプトを起動（手順：Windowsキーまたはスタートメニュー > cmd と入力 > 右クリック > 「管理者として実行」）。

必要なパッケージのインストールとソースコードの取得

python -m pip install -U pillow wandb clearml comet_ml
cd /d c:%HOMEPATH%
rmdir /s /q yolov5
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
icacls . /grant Everyone:F /T

Windows で，コマンドプロンプトを実行
物体検出の実行プロセス
YOLOv5 の公式リポジトリ https://github.com/ultralytics/yolov5 の手順に従って進める．
物体検出には，COCO データセットで学習済みの以下のモデルから選択が可能： yolov5n.pt， yolov5s.pt， yolov5m.pt， yolov5l.pt， yolov5x.pt．詳細は公式ドキュメント https://github.com/ultralytics/yolov5/tree/master/models を参照
cd /d c:%HOMEPATH% cd yolov5 python detect.py --weights yolov5s.pt --source=https://ultralytics.com/images/bus.jpg --exist-ok runs\detect\exp\bus.jpg
続いて「--visualize」オプションを追加して実行
cd /d c:%HOMEPATH% cd yolov5 python detect.py --weights yolov5s.pt --source=https://ultralytics.com/images/bus.jpg --visualize --exist-ok runs\detect\exp\bus.jpg
「--visualize」オプションにより，以下の可視化結果が生成される．

物体検出プログラムの実装（YOLOv5使用）（Windows環境）

以下のPythonプログラムで物体検出を実行できる．

Python環境の起動
Python実行環境の選択
- Windows では python （Python ランチャーは py）
- Ubuntu では python3
開発環境オプション: Jupyter Qt Console， Jupyter Notebook， Jupyter Lab， Nteract， Spyder， PyCharm， PyScripter
Python関連情報: 別ページ »
python

物体検出の実装例

yolov5s はCOCOデータセットで事前学習済みのモデル．

詳細は公式ドキュメント https://github.com/ultralytics/yolov5/blob/master/data/coco.yaml を参照

import torch
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
img = "https://ultralytics.com/images/zidane.jpg"  # or file, Path, PIL, OpenCV, numpy, list
results = model(img)
results.pandas()
results.show()  # or .print(), .save(), .crop(), .pandas(), etc.
exit()

より高性能な yolov5m モデルの使用例物体検出には，COCOデータセットで学習済みの以下のモデルから選択可能： yolov5n.pt， yolov5s.pt， yolov5m.pt， yolov5l.pt， yolov5x.pt．詳細は公式ドキュメント https://github.com/ultralytics/yolov5/blob/master/data/coco.yaml を参照
import torch model = torch.hub.load("ultralytics/yolov5", "yolov5m") img = "https://ultralytics.com/images/zidane.jpg" # or file, Path, PIL, OpenCV, numpy, list results = model(img) results.pandas() results.show() # or .print(), .save(), .crop(), .pandas(), etc. exit()

YOLO形式オープンデータを用いた新規クラスの物体検出学習（開発中）

画像データと物体検出アノテーション（クラス名とバウンディングボックス）を活用し， Traffic Signs Datasetを使用した学習を実施する．

Traffic Signs Datasetのダウンロードと前処理後，以下の手順で学習を進める：

クラス番号の調整：COCOデータセット使用の0-79を避け， Traffic Signs Datasetでは80-83を使用
データセットの分割：学習用（train）と検証用（validation）データの準備

以下のディレクトリ構造でファイルを配置

   ├── images/
      ├─train/
      └─val/
   ├── labels/
      ├─train/
      └─val/

画像サイズの標準化：横幅を640ピクセルに統一

Traffic Signs Dataset in YOLO format へアクセス
https://www.kaggle.com/datasets/valentynsichkar/traffic-signs-dataset-in-yolo-format?resource=downloa
「Download」ボタンをクリック
Kaggleアカウント登録またはGoogleアカウントでのサインインが必要な場合は指示に従い，再度「Download」をクリック
archive.zipのダウンロード完了
C:\archive ディレクトリを作成し，archive.zipを展開
下図のように配置：
Windows でコマンドプロンプトを起動
以下のコマンドでディレクトリを移動しPythonを起動
cd C:\archive python

クラス番号更新プログラムの実行

このプログラムは900個のアノテーションファイル（00000.txt～00899.txt）を処理し， 各ファイルの行頭のクラス番号（0-3）に対して，80未満の場合は80を加算して更新する．ファイルが存在しない場合はエラーを出力．

def update_class_number(filename):
    with open(filename, "r", encoding="utf-8") as file:
        lines = file.readlines()
    updated_lines = []
    for line in lines:
        parts = line.strip().split()
        if len(parts) >= 5:
            class_number = int(parts[0])
            # もともとのクラス番号 (class_number) は 0, 1, 2, 3 である。80を加えて，元のファイルのクラス番号を更新する
            if class_number < 80:
                updated_class_number = class_number + 80
                x1, y1, x2, y2 = map(float, parts[1:])
                updated_line = f"{updated_class_number} {x1} {y1} {x2} {y2}\n"
                updated_lines.append(updated_line)
            else:
                updated_lines.append(line)
        else:
            updated_lines.append(line)
    with open(filename, "w", encoding="utf-8") as file:
        file.writelines(updated_lines)

file_not_found = False
for i in range(0, 900):
    # 00000.txt から 00899.txt まで
    filename = f"ts/{i:05}.txt"
    try:
        update_class_number(filename)
        # 確認表示
        with open(filename, "r", encoding="utf-8") as file:
            first_line = file.readline().strip()
            print(f"filename: {filename} , {first_line}")
    except FileNotFoundError:
        print(f"{filename} が見つかりませんでした")
        file_not_found = True

exit()

処理完了の確認

このプログラムにより，クラス番号を80-83に変更．
クラス番号とクラス名の対応は c:\archive\classes.names に以下の通り定義：
```
80, prohibitory
81, danger
82, mandatory
83, other
```

画像サイズの標準化

以下のコマンドを実行：

cd c:\archive\ts\ts
python

次のPythonプログラムを実行

from PIL import Image
import os

# 新しい幅
new_width = 640

# カレントディレクトリ内のすべてのファイル
for filename in os.listdir('.'):
    # .jpgファイルのみを処理
    if filename.endswith('.jpg'):
        print(f"{filename} を変換")
        with Image.open(filename) as img:
            # アスペクト比を保持した高さを計算
            aspect_ratio = new_width / img.width
            new_height = int(img.height * aspect_ratio)
            # リサイズ
            resized_img = img.resize((new_width, new_height))
            # 元のファイルを上書き
            resized_img.save(filename)

exit()

validation 用のディレクトリを用意する．これらのディレクトリにいくつかのファイルを移動する．

mkdir c:\archive\ts\ts\images
mkdir c:\archive\ts\ts\images\train
mkdir c:\archive\ts\ts\images\val
mkdir c:\archive\ts\ts\labels
mkdir c:\archive\ts\ts\labels\train
mkdir c:\archive\ts\ts\labels\val
cd c:\archive\ts\ts
move *1.txt labels\val
move *1.jpg images\val
move *.txt labels\train
move *.jpg images\train
icacls c:\archive\ts /grant Everyone:F /T

ファイル ts.yaml を作成する

エディタを起動

cd /d c:%HOMEPATH%
cd yolov5
notepad ts.yaml

エディタで次のように作成し保存する．

names は 84 個の文字列のリストである．最初の 80 個は COCO データセットのクラス名．残りの 4 個は，いまから学習を行うデータセットのクラス名になる．

path: c:/archive/ts/ts
train: images/train
val: images/val
nc: 84
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush
  80: prohibitory
  81: danger
  82: mandatory
  83: other

学習の実行
実行にかかる時間の目安は10分から数十分である．
cd /d c:%HOMEPATH% python yolov5/train.py --data yolov5/ts.yaml --weights yolov5/yolov5s.pt --img 640 --epochs 30
GPU を使わないときは，次のように「--device cpu」を付ける．このときは，実行に１０時間ほどかかる．
```
cd /d c:%HOMEPATH%
cd yolov5
python train.py --data ts.yaml --weights yolov5s.pt --img 640 --epochs 30 --device cpu
```
学習が実質開始する前にエラーメッセージが出た場合，YOLOv5 のインストールを再度行うことで改善する可能性がある．
学習の終了の確認
このとき，結果が保存されているディレクトリを確認する．最後のところに「Results saved to runs\detect\...」のように表示されるので確認
dir コマンドでファイルを確認．
「runs\train\exp2」のところには，「結果が保存されているディレクトリ」を指定すること．
dir runs\train\exp2 dir runs\train\exp2\weights
学習したデータで物体検出してみる
「runs\train\exp2」のところには，「結果が保存されているディレクトリ」を指定すること．
python detect.py --weights ./runs/train/exp2/weights/best.pt --source=c:/archive/ts/ts/images/val/00001.jpg
このとき，結果が保存されているディレクトリを確認する．最後のところに「Results saved to runs\detect\...」のように表示されるので確認

結果が保存されているディレクトリに画像があるので表示してみる．