金子邦彦研究室人工知能データセット(人工知能関連)Iris データセット(Python を使用)

Iris データセット(Python を使用)

Iris データセットを紹介する. 利用条件は利用者で確認すること.

目次

  1. Google Colab へのリンク
  2. 前準備
  3. Iris データセットのロードと確認表示(scikit-learn を使用)
  4. Iris データセットのロードと確認表示(TensorFlow データセットを使用)

Iris データセットは公開されているデータセット(オープンデータ)である.

文献】 R.A. Fisher, The use of multiple measurements in taxonomic problems, Annual Eugenics, 7, Part II, pp. 179-188, 1936.

サイト内の関連ページ

関連する外部ページ

1. Google Colab へのリンク

Google Colaboratory のページ:

次のリンクをクリックすると,Google Colaboratoryノートブックが開く. そして,Google アカウントでログインすると,Google Colaboratory のノートブック内のコード等を編集したり再実行したりができる.編集した場合でも,他の人に影響が出たりということはない.そして,編集後のものを,各自の Google ドライブ内に保存することもできる.

https://colab.research.google.com/drive/10u8owk1y9l-OocyenRZuDb0sKxxicVwK?usp=sharing

2. 前準備

Python の準備(Windows,Ubuntu 上)

サイト内の関連ページ

関連する外部ページ

Python の公式ページ: https://www.python.org/

TensorFlow データセット, scikit-learn のインストール

Windows の場合

Windows では,コマンドプロン プトを管理者として実行し, 次のコマンドを実行する.

Windowspip を実行するときは,コマンドプロンプト管理者として開き,それを使って pip を実行することにする.

python -m pip install -U tensorflow-gpu tensorflow_datasets scikit-learn scikit-learn-intelex

Windows での TensorFlow のインストールの詳細: 別ページ »で説明

(このページで,Build Tools for Visual Studio 2022,NVIDIA ドライバ, NVIDIA CUDA ツールキットNVIDIA cuDNNのインストールも説明している.)

Ubuntu の場合

Ubuntu では,次のコマンドを実行.

sudo apt -y update
sudo apt -y install python3-sklearn
sudo pip3 install -U tensorflow-gpu tensorflow_datasets

Ubuntu での TensorFlow のインストールの詳細: 別ページ »で説明

(このページで,NVIDIA ドライバ, NVIDIA CUDA ツールキットNVIDIA cuDNNのインストールも説明している.)

3. Iris データセットのロードと確認表示(scikit-learn を使用)

【Python の利用】

Python は,次のコマンドで起動できる.

Python 開発環境(Jupyter Qt Console, Jupyter ノートブック (Jupyter Notebook), Jupyter Lab, Nteract, Spyder, PyCharm, PyScripterなど)も便利である.

Python のまとめ: 別ページ »にまとめ

scikit-learn を使用,データフレームにロード

Pandas データフレームの df にロードしている.

import pandas as pd
from sklearn.datasets import load_iris
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
print(df)

[image]

scikit-learn を使用,配列にロード

次の Python プログラムは,配列 X, y にロードしている.

import pandas as pd
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
print(X)
print(y)

[image]

4. Iris データセットのロードと確認表示(TensorFlow データセットを使用)