トップページ -> データの扱い -> オープンデータ -> くずし字 MNIST(Kuzushiji-MNIST)データセット
[サイトマップへ], [サイト内検索へ]

くずし字 MNIST(Kuzushiji-MNIST)データセット

[image] 金子邦彦研究室: データベース、人工知能(AI)、データサイエンスの融合により不可能を可能にする


前準備

Python のインストール,pip と setuptools の更新,Python 開発環境のインストール

Windows の場合

  1. Python のインストール

    Python の URL: http://www.python.org/

    インストール手順の詳細は: 別ページで説明している.

  2. pip と setuptools の更新Python 開発環境(JupyterLab, spyder)のインストール

    コマンドプロンプトを管理者として実行し,次のコマンドを実行.

    python -m pip install -U pip setuptools
    python -m pip install -U jupyterlab jupyter jupyter-console jupytext spyder
    

Ubuntu の場合

システム Python を使用(インストール操作は不要)

  1. pip と setuptools の更新Python 開発環境(JupyterLab, spyder)のインストール

    次のコマンドを実行.

    sudo apt -yV install python3-dev python3-pip python3-setuptools
    sudo apt -yV install jupyter-qtconsole jupyter-notebook python3-jupyter-client python3-jupyter-console python3-spyder spyder3
    

Python 用 numpy pandas seaborn matplotlib のインストール

Windows の場合

※ 「pip install ...」は,Python パッケージをインストールするための操作.

python -m pip install -U
python -m pip install -U numpy pandas seaborn matplotlib

Ubuntu の場合

sudo apt update
sudo apt -yV install python3-numpy python3-pandas python3-seaborn python3-matplotlib

Git のインストール

Git の URL: https://git-scm.com/


kmnist のダウンロード

Windows での手順を示す.Ubuntu でも同様の手順である.

  1. Windows で,コマンドプロンプトを管理者として実行
  2. ダウンロード用ディレクトリの準備
    mkdir C:\data
    rmdir /s /q kmnist
    

    [image]
  3. ダウンロード

    Kuzushiji-MNIST, Kuzushiji-49, Kuzushiji-Kanji の 3種類をダウンロードできる.

    下の実行例では,Kuzushiji-49 をダウンロードしている.

    cd C:\data
    git clone https://github.com/rois-codh/kmnist
    cd kmnist
    python download_data.py 
    

    [image]

Python でのデータの読み込み

Kuzushiji-MNIST

import numpy as np
X_train = np.load("C:/data/kmnist/kmnist-train-imgs.npz")['arr_0']
y_train = np.load("C:/data/kmnist/kmnist-train-labels.npz")['arr_0']
X_test = np.load("C:/data/kmnist/kmnist-test-imgs.npz")['arr_0']
y_test = np.load("C:/data/kmnist/kmnist-test-labels.npz")['arr_0']
print(X_train.shape)
print(y_train.shape)
print(X_test.shape)
print(y_test.shape)
import matplotlib.pyplot as plt
plt.imshow(X_train[0], cmap='gray')
plt.imshow(X_test[0], cmap='gray')

[image]

Kuzushiji-49

import numpy as np
X_train = np.load("C:/data/kmnist/k49-train-imgs.npz")['arr_0']
y_train = np.load("C:/data/kmnist/k49-train-labels.npz")['arr_0']
X_test = np.load("C:/data/kmnist/k49-test-imgs.npz")['arr_0']
y_test = np.load("C:/data/kmnist/k49-test-labels.npz")['arr_0']
print(X_train.shape)
print(y_train.shape)
print(X_test.shape)
print(y_test.shape)
import matplotlib.pyplot as plt
plt.imshow(X_train[0], cmap='gray')
plt.imshow(X_test[0], cmap='gray')

[image]

本サイトは金子邦彦研究室のWebページです.サイトマップは,サイトマップのページをご覧下さい. 本サイト内の検索は,サイト内検索のページをご利用下さい.

問い合わせ先: 金子邦彦(かねこ くにひこ) [image]