Python の pandas データフレームを用いた基本情報の表示,散布図、要約統計量、ヒストグラムについて, プログラム例などで説明する.
【目次】
Google Colaboratory のページ:
次のリンクをクリックすると,Google Colaboratory のノートブックが開く. そして,Google アカウントでログインすると,Google Colaboratory のノートブック内のコード等を編集したり再実行したりができる.編集した場合でも,他の人に影響が出たりということはない.そして,編集後のものを,各自の Google ドライブ内に保存することもできる.
https://colab.research.google.com/drive/1LfMuE3IVYKhXb57YGdsX_dmfnTvj5oKb?usp=sharing
【サイト内の関連ページ】
【関連する外部ページ】
Python の公式ページ: https://www.python.org/
Windows では,コマンドプロン プトを管理者として実行し, 次のコマンドを実行する.
python -m pip install -U pip setuptools numpy pandas matplotlib seaborn scikit-learn scikit-learn-intelex
端末で,次のコマンドを実行
sudo apt -y update sudo apt -y install python3-numpy python3-pandas python3-seaborn python3-matplotlib python3-sklearn
import pandas as pd import seaborn as sns sns.set() iris = sns.load_dataset('iris') titanic = sns.load_dataset('titanic')
print(iris.head()) print(titanic.head())
print(iris.head()) print(iris.info()) print(iris.shape) print(iris.ndim) print(iris.columns) print(titanic.head()) print(titanic.info()) print(titanic.shape) print(titanic.ndim) print(titanic.columns)
print(iris)
※ オブジェクト iris には 0, 1, 2, 3, 4列目がある.
print(iris.iloc[:,1]) print(iris.iloc[:,2])
「plt.style.use('ggplot')」はグラフの書式の設定.「ro」は「赤い丸」という意味.
%matplotlib inline import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') # Suppress Matplotlib warnings plt.style.use('ggplot') plt.plot(iris.iloc[:,1], iris.iloc[:,2], 'ro') plt.show()
import seaborn as sns sns.set() iris = sns.load_dataset('iris') titanic = sns.load_dataset('titanic') print(iris.describe()) print(titanic.describe())
%matplotlib inline import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') # Suppress Matplotlib warnings plt.style.use('ggplot') plt.hist(iris.iloc[:,1]) plt.show() plt.hist(iris.iloc[:,2]) plt.show()
2次元ヒストグラム
%matplotlib inline import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') # Suppress Matplotlib warnings plt.style.use('ggplot') plt.hist2d(iris.iloc[:,1], iris.iloc[:,2]) plt.show()