MNIST データセット（PyTorch を使用）

【概要】

MNIST データセットを，PyTorch（torchvision）を用いて読み込み，確認し，データフレームへ変換する手順を説明する．利用条件は利用者で確認すること．

* MNIST データセット

MNIST データセットは，公開されているデータセット（オープンデータ）である．

0 から 9 までの 10 種類の手書き文字についての， モノクロ画像と，各画像に付いた「0から9までの数値」のラベルから構成されるデータセットである．

画像の枚数：合計 70000枚．
（内訳）70000枚の内訳は次の通りである
60000枚：教師データ
10000枚：検証データ
画像のサイズ: 28x28 である．
画素はグレースケールであり，画素値は0～255である．0が白，255が黒．

【文献】

Y. Lecun, L. Bottou, Y. Bengio and P. Haffner, Gradient-based learning applied to document recognition, vol. 86, no. 11, pp. 2278-2324, 1998.

【目次】

Google Colab へのリンク
前準備
MNIST データセットのロード
MNIST データセットの確認
MNIST データセットのデータフレームへの変換

【関連する外部ページ】

MNIST データセットの詳細は， THE MNIST DATABASE of handwritten digits のページで説明されている．その URL は次の通り．
http://yann.lecun.com/exdb/mnist/
PyTorch の torchvision における MNIST データセット: https://docs.pytorch.org/vision/stable/generated/torchvision.datasets.MNIST.html

【サイト内の関連ページ】

MNIST データセットを扱う Python プログラム: 別ページで説明している．

1. Google Colab へのリンク

Google Colaboratory のページ:

次のリンクをクリックすると，Google Colaboratory のノートブックが開く．そして，Google アカウントでログインすると，Google Colaboratory のノートブック内のコードなどを編集したり再実行したりができる．編集しても，他の人に影響は出ない．そして，編集後のものを，各自の Google ドライブ内に保存することもできる．

https://colab.research.google.com/drive/1awZ1ex4KbAJ6hw4VfjKwE-kuiNVVHrfJ?usp=sharing

2. 前準備

Python 3.12 のインストール

Pythonのインストールを行い、Pythonのプログラムを実行する環境を整える。扱う環境は、Windows搭載パソコンである。金子研究室では、Python 3.12.10を推奨する。

[Windows での Python 3.12 のインストール手順を見るには、ここをクリック]

Windows での Python 3.12 のインストール

以下のいずれかの方法でPython 3.12をインストールする。Pythonがインストール済みの場合、この手順は不要である。

方法 1：winget によるインストール

【インストールコマンドの実行方法】

管理者権限でコマンドプロンプトを起動する（手順：Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」）。そして、コマンド全体をコマンドプロンプトにコピー＆ペーストする。

--scope machine を指定することで、システム全体（全ユーザー向け）にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動するとPATHが反映される。

REM Python 3.12 をシステム領域にインストール
winget install --id Python.Python.3.12 -e --scope machine --silent --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_test=0 Include_pip=1 Include_launcher=1 InstallLauncherAllUsers=1 TargetDir=\"C:\Program Files\Python312\""

REM Python と Scripts を PATH 先頭に追加
powershell -NoProfile -Command "$p='C:\Program Files\Python312'; $s=\"$p\Scripts\"; $c=[Environment]::GetEnvironmentVariable('Path','Machine'); if((Test-Path $p) -and (';'+$c+';' -notlike \"*;$p;*\") -and (';'+$c+';' -notlike \"*;$s;*\")){[Environment]::SetEnvironmentVariable('Path',\"$p;$s;$c\",'Machine')}"

方法 2：インストーラーによるインストール

Python公式サイト（https://www.python.org/downloads/）にアクセスし、「Download Python 3.x.x」ボタンからWindows用インストーラーをダウンロードする。
ダウンロードしたインストーラーを実行する。
初期画面の下部に表示される「Add python.exe to PATH」にチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

インストールの確認

コマンドプロンプトで以下を実行する。

python --version

バージョン番号（例：Python 3.12.x）が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

Python の開発環境 Visual Studio Code のインストールと Python 用の設定

Python の開発環境Visual Studio Code（プログラムを編集するソフトウェア。以下、VS Code）を整える。

[Windows での Visual Studio Code のインストールと Python 用の設定手順を見るには、ここをクリック]

Windows での Visual Studio Code のインストールと Python 用の設定手順

1. VS Code と拡張機能のインストール

以下のコマンドにより，既存の VS Code を削除し，全ユーザー共有の設定で再インストールしたうえで，拡張機能（VS Code に機能を追加するソフトウェア）をまとめて導入する．

【インストールコマンドの実行方法】

管理者権限でコマンドプロンプトを起動する（手順：Windows キーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」）。そして，コマンド全体をコマンドプロンプトにコピー＆ペーストする。

インストールコマンド


REM ============================================================
REM Microsoft Visual Studio Code
REM ============================================================
winget uninstall -e --id Microsoft.VisualStudioCode --silent --disable-interactivity --accept-source-agreements
rmdir /s /q C:\ProgramData\vscode-extensions 2>nul
rmdir /s /q "%APPDATA%\Code" 2>nul
rmdir /s /q "%USERPROFILE%\.vscode" 2>nul
rmdir /s /q "%LOCALAPPDATA%\Microsoft\vscode-update" 2>nul

REM VS Code をシステム領域に新規インストール
winget install --scope machine --id Microsoft.VisualStudioCode -e --silent --accept-source-agreements --accept-package-agreements

REM 全ユーザー共有の拡張機能フォルダ
mkdir C:\ProgramData\vscode-extensions 2>nul
icacls "C:\ProgramData\vscode-extensions" /grant "Everyone:(OI)(CI)M" /T

REM スタートメニューのショートカットを --extensions-dir 付きで再作成
rmdir /s /q "C:\ProgramData\Microsoft\Windows\Start Menu\Programs\Visual Studio Code" 2>nul
del "C:\ProgramData\Microsoft\Windows\Start Menu\Programs\Visual Studio Code.lnk" 2>nul
powershell -NoProfile -Command "$s=New-Object -ComObject WScript.Shell; $lnk=$s.CreateShortcut('C:\ProgramData\Microsoft\Windows\Start Menu\Programs\Visual Studio Code.lnk'); $lnk.TargetPath='C:\Program Files\Microsoft VS Code\Code.exe'; $lnk.Arguments='--extensions-dir \"C:\ProgramData\vscode-extensions\"'; $lnk.Save()"
REM ショートカットの検証
powershell -NoProfile -Command "$s=New-Object -ComObject WScript.Shell; $lnk=$s.CreateShortcut('C:\ProgramData\Microsoft\Windows\Start Menu\Programs\Visual Studio Code.lnk'); Write-Host 'TargetPath:' $lnk.TargetPath; Write-Host 'Arguments:' $lnk.Arguments"

REM ファイル / フォルダ右クリックの「Code で開く」を登録
reg add "HKLM\SOFTWARE\Classes\*\shell\VSCode\command" /ve /d "\"C:\Program Files\Microsoft VS Code\Code.exe\" --extensions-dir \"C:\ProgramData\vscode-extensions\" \"%1\"" /f
reg add "HKLM\SOFTWARE\Classes\Directory\shell\VSCode\command" /ve /d "\"C:\Program Files\Microsoft VS Code\Code.exe\" --extensions-dir \"C:\ProgramData\vscode-extensions\" \"%1\"" /f
reg add "HKLM\SOFTWARE\Classes\Directory\Background\shell\VSCode\command" /ve /d "\"C:\Program Files\Microsoft VS Code\Code.exe\" --extensions-dir \"C:\ProgramData\vscode-extensions\" \"%V\"" /f

REM --extensions-dir 付きで起動する code.cmd ラッパを作成
REM （%* を echo で書くと対話的 cmd で失われるため、PowerShell で [char]37+'*' を書き出す）
powershell -NoProfile -Command "$pct=[char]37; $q=[char]34; $c='@echo off'+[char]13+[char]10+$q+'C:\Program Files\Microsoft VS Code\bin\code.cmd'+$q+' --extensions-dir '+$q+'C:\ProgramData\vscode-extensions'+$q+' '+$pct+'*'+[char]13+[char]10; [IO.File]::WriteAllText('C:\ProgramData\vscode-extensions\vscode.cmd',$c,[Text.Encoding]::ASCII)"

REM 拡張機能のインストール
set "CODE=C:\Program Files\Microsoft VS Code\bin\code.cmd"
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --uninstall-extension GitHub.copilot
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --uninstall-extension GitHub.copilot-chat
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension ms-python.python
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension ms-python.vscode-pylance
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension ms-python.debugpy
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension MS-CEINTL.vscode-language-pack-ja
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension saoudrizwan.claude-dev
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension rust-lang.rust-analyzer
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension tamasfe.even-better-toml
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension anthropic.claude-code
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --install-extension almenon.arepl
"%CODE%" --extensions-dir "C:\ProgramData\vscode-extensions" --list-extensions --show-versions
echo === セットアップ完了 ===

2. Python インタプリタの選択

同一マシンに複数の Python がインストールされている場合，VS Code で使用する Python 本体（インタプリタ：Python プログラムを解釈・実行するソフトウェア）を選択する必要がある．

コマンドパレット（コマンド名で機能を呼び出す VS Code の入力欄）を開く（Ctrl+Shift+P）
Python: Select Interpreter と入力する
表示される一覧から，使用する Python（例：C:\Program Files\Python312\python.exe）を選択する．

PyTorch, torchvision, numpy, pandas, matplotlib のインストール

管理者権限でコマンドプロンプトを起動する（手順：Windowsキーまたはスタートメニュー → cmd と入力 → 右クリック → 「管理者として実行」）．そして，次のコマンドを実行する．

Windows で pip を実行するときは，管理者権限のコマンドプロンプトを使用し，システム領域へのインストールを行う．

python -m pip install -U --no-user torch torchvision numpy pandas matplotlib

GPU を利用する場合は，お使いの環境（CUDA のバージョンなど）に合わせたインストールコマンドを PyTorch 公式ページで確認すること: https://pytorch.org/get-started/locally/

3. MNIST データセットのロード

パッケージのインポート，PyTorch のバージョン確認，デバイスの選択

GPU が利用できる場合は GPU を，利用できない場合は CPU を使う．

import torch
import torchvision
import numpy as np
import pandas as pd

%matplotlib inline
import matplotlib.pyplot as plt

print(torch.__version__)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(device)

torchvision から MNIST データセットをロード
- train_dataset: 60000枚の濃淡画像と，各画像の種類番号（0 から 9 のどれか）
- test_dataset: 10000枚の濃淡画像と，各画像の種類番号（0 から 9 のどれか）
ToTensor により，画像は形状 (1, 28, 28)，画素値 0～1 の PyTorch のテンソルになる． download=True により，データセットがなければダウンロードする．
```
transform = torchvision.transforms.ToTensor()
train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
print(len(train_dataset))
print(len(test_dataset))
print(train_dataset.classes)
```

4. MNIST データセットの確認

データセットの中の画像を表示

matplotlib を用いて，0 番目の画像を表示する．

NUM = 0
image, label = train_dataset[NUM]
plt.figure()
plt.imshow(image[0], cmap='gray')
plt.colorbar()
plt.gca().grid(False)
plt.show()

データセットの情報を表示

print(len(train_dataset.classes))
print(train_dataset.classes)

データの確認表示

matplotlib を用いて，複数の画像を並べて表示する．

class_names = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
plt.style.use('default')
plt.figure(figsize=(10,10))
for i in range(25):
    image, label = train_dataset[i]
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(image[0], cmap=plt.cm.binary)
    plt.xlabel(class_names[label])

plt.show()

DataLoader によるミニバッチの取り出し
DataLoader を用いて，128 枚ずつのミニバッチを取り出す． shuffle=True により，取り出す順序をシャッフルする．
```
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=128, shuffle=True)
for image, label in train_loader:
    print(image.shape)
    print(label.shape)
    break
```

5. MNIST データセットのデータフレームへの変換

各画像は 28×28 である．これを 784 個の数値に平坦化し，各行が 1 枚の画像，各列が 1 画素のデータフレームに変換する．ラベルは label 列に入れる．

データセットをデータフレームに変換

def to_dataframe(dataset):
    images = dataset.data.reshape(len(dataset), -1).numpy()
    labels = dataset.targets.numpy()
    df = pd.DataFrame(images)
    df['label'] = labels
    return df

train = to_dataframe(train_dataset)
test = to_dataframe(test_dataset)
print(train)
print(test)

データフレームの行数と属性数
行数は len(＜データフレーム＞)，属性数は len(＜データフレーム＞.columns)．
```
print(len(train))
print(len(train.columns))
print(len(test))
print(len(test.columns))
```

データセットの先頭 10行をデータフレームに変換

def to_dataframe_head(dataset, n):
    images = dataset.data[:n].reshape(n, -1).numpy()
    labels = dataset.targets[:n].numpy()
    df = pd.DataFrame(images)
    df['label'] = labels
    return df

train = to_dataframe_head(train_dataset, 10)
test = to_dataframe_head(test_dataset, 10)
print(train)
print(test)

データフレームの行数と属性数
行数は len(＜データフレーム＞)，属性数は len(＜データフレーム＞.columns)．
```
print(len(train))
print(len(train.columns))
print(len(test))
print(len(test.columns))
```