Fashion MNIST データセット(Python を使用)

Fashion MNIST データセットを紹介する. 利用条件は利用者で確認すること.

目次

  1. 前準備
  2. Fashion MNIST データセットのロード
  3. Fashion MNIST データセットの確認

* Fashion MNIST データセット

Fashion MNIST データセットは,公開されているデータセット(オープンデータ)である.

Fashion MNIST データセットは,10 種類のモノクロ画像と,各画像に付いた ラベル(10 種類の中の種類を示す)から構成されるデータセットである.

  • 画素はグレースケールであり,画素値は0~255である.0が白,255が黒.

    文献

    Han Xiao, Kashif Rasul, and Roland Vollgraf, Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms, arXiv:1708.07747 [cs.LG], 2017.

    サイト内の関連ページ

    関連する外部ページ

  • 1. 前準備

    Python 3.12 のインストール(Windows 上) [クリックして展開]

    以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。

    方法1:winget によるインストール

    管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

    winget install --scope machine --id Python.Python.3.12 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_pip=1 Include_test=0 Include_launcher=1 InstallLauncherAllUsers=1"

    --scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

    方法2:インストーラーによるインストール

    1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
    2. ダウンロードしたインストーラーを実行する。
    3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
    4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

    インストールの確認

    コマンドプロンプトで以下を実行する。

    python --version

    バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

    AIエディタ Windsurf のインストール(Windows 上) [クリックして展開]

    Pythonプログラムの編集・実行には、AIエディタの利用を推奨する。ここでは、Windsurfのインストールを説明する。Windsurf がインストール済みの場合、この手順は不要である。

    管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

    winget install --scope machine --id Codeium.Windsurf -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --custom "/SP- /SUPPRESSMSGBOXES /NORESTART /CLOSEAPPLICATIONS /DIR=""C:\Program Files\Windsurf"" /MERGETASKS=!runcode,addtopath,associatewithfiles,!desktopicon"
    powershell -Command "$env:Path=[System.Environment]::GetEnvironmentVariable('Path','Machine')+';'+[System.Environment]::GetEnvironmentVariable('Path','User'); windsurf --install-extension MS-CEINTL.vscode-language-pack-ja --force; windsurf --install-extension ms-python.python --force; windsurf --install-extension Codeium.windsurfPyright --force"

    --scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

    関連する外部ページ

    Windsurf の公式ページ: https://windsurf.com/

    TensorFlow, TensorFlow データセット, Keras, numpy, matplotlib のインストール

    Windows の場合

    Windows では,コマンドプロンプトを管理者として実行し, 次のコマンドを実行する.

    Windowspip を実行するときは,管理者権限コマンドプロンプトを使用し,システム領域へのインストールを行う.
    python -m pip install -U tensorflow-gpu tensorflow_datasets keras numpy matplotlib
    
    Windows での TensorFlow のインストールの詳細: 別ページ »で説明

    (このページで,Build Tools for Visual Studio 2022,NVIDIA ドライバ, NVIDIA CUDA ツールキットNVIDIA cuDNNのインストールも説明している.)

    Ubuntu の場合

    Ubuntu では,次のコマンドを実行.

    # パッケージリストの情報を更新
    sudo apt update
    sudo apt -y install python3-numpy python3-matplotlib
    sudo pip3 install -U tensorflow-gpu tensorflow_datasets keras
    
    Ubuntu での TensorFlow のインストールの詳細: 別ページ »で説明

    (このページで,NVIDIA ドライバ, NVIDIA CUDA ツールキットNVIDIA cuDNNのインストールも説明している.)

    2. Fashion MNIST データセットのロード

    Python 3.12 のインストール(Windows 上) [クリックして展開]

    以下のいずれかの方法で Python 3.12 をインストールする。Python がインストール済みの場合、この手順は不要である。

    方法1:winget によるインストール

    管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

    winget install --scope machine --id Python.Python.3.12 -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --override "/quiet InstallAllUsers=1 PrependPath=1 Include_pip=1 Include_test=0 Include_launcher=1 InstallLauncherAllUsers=1"

    --scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

    方法2:インストーラーによるインストール

    1. Python 公式サイト(https://www.python.org/downloads/)にアクセスし、「Download Python 3.x.x」ボタンから Windows 用インストーラーをダウンロードする。
    2. ダウンロードしたインストーラーを実行する。
    3. 初期画面の下部に表示される「Add python.exe to PATH」に必ずチェックを入れてから「Customize installation」を選択する。このチェックを入れ忘れると、コマンドプロンプトから python コマンドを実行できない。
    4. 「Install Python 3.xx for all users」にチェックを入れ、「Install」をクリックする。

    インストールの確認

    コマンドプロンプトで以下を実行する。

    python --version

    バージョン番号(例:Python 3.12.x)が表示されればインストール成功である。「'python' は、内部コマンドまたは外部コマンドとして認識されていません。」と表示される場合は、インストールが正常に完了していない。

    AIエディタ Windsurf のインストール(Windows 上) [クリックして展開]

    Pythonプログラムの編集・実行には、AIエディタの利用を推奨する。ここでは、Windsurfのインストールを説明する。Windsurf がインストール済みの場合、この手順は不要である。

    管理者権限コマンドプロンプトで以下を実行する。管理者権限のコマンドプロンプトを起動するには、Windows キーまたはスタートメニューから「cmd」と入力し、表示された「コマンドプロンプト」を右クリックして「管理者として実行」を選択する。

    winget install --scope machine --id Codeium.Windsurf -e --silent --disable-interactivity --force --accept-source-agreements --accept-package-agreements --custom "/SP- /SUPPRESSMSGBOXES /NORESTART /CLOSEAPPLICATIONS /DIR=""C:\Program Files\Windsurf"" /MERGETASKS=!runcode,addtopath,associatewithfiles,!desktopicon"
    powershell -Command "$env:Path=[System.Environment]::GetEnvironmentVariable('Path','Machine')+';'+[System.Environment]::GetEnvironmentVariable('Path','User'); windsurf --install-extension MS-CEINTL.vscode-language-pack-ja --force; windsurf --install-extension ms-python.python --force; windsurf --install-extension Codeium.windsurfPyright --force"

    --scope machine を指定することで、システム全体(全ユーザー向け)にインストールされる。このオプションの実行には管理者権限が必要である。インストール完了後、コマンドプロンプトを再起動すると PATH が自動的に設定される。

    関連する外部ページ

    Windsurf の公式ページ: https://windsurf.com/

    1. パッケージのインポート,TensorFlow のバージョン確認など
      import tensorflow as tf
      import numpy as np
      import tensorflow_datasets as tfds
      
      %matplotlib inline
      import matplotlib.pyplot as plt
      import warnings
      warnings.filterwarnings('ignore')   # Suppress Matplotlib warnings
      
    2. TensorFlow データセット から Fashion MNIST データセット をロード
      • x_train: サイズ 28 × 28 の 60000枚の濃淡画像
      • y_train: 60000枚の濃淡画像それぞれの,種類番号(0 から 9 のどれか)
      • x_test: サイズ 28 × 28 の 10000枚の濃淡画像
      • y_test: 10000枚の濃淡画像それぞれの,種類番号(0 から 9 のどれか)

      結果は,TensorFlow の Tensor である.

      type は型,shape はサイズ,np.max と np.mi は最大値と最小値.

      tensorflow_datasets の loadで, 「batch_size = -1」を指定して,一括読み込みを行っている.

      fashion_mnist, fashion_mnist_metadata = tfds.load('fashion_mnist', with_info = True, shuffle_files=True, as_supervised=True, batch_size = -1)
      x_train, y_train, x_test, y_test = fashion_mnist['train'][0], fashion_mnist['train'][1], fashion_mnist['test'][0], fashion_mnist['test'][1]
      print(fashion_mnist_metadata)
      

    3. Fashion MNIST データセットの確認