Octaveによる統計計算と分析の基本機能

Octaveにおける統計計算と分析の主要な機能について,以下のポイントをメインに説明する.

  1. 基本統計量の計算:mean(平均),var(分散),std(標準偏差),kurtosis(尖度),skewness(歪度)などの基本的な統計量を計算できる.これらの関数は行ベクトルと行列の両方に対応している.
  2. データの正規化:center関数でデータから平均を引き,studentize関数で平均を引いて標準偏差で割ることができる.これらの処理により,データの正規化が可能である.
  3. 相関分析:corrcoef関数による相関係数行列の計算,spearman関数による順位相関係数の計算が可能である.また,mahalanobis関数によりマハラノビス距離を求めることができる.
  4. 統計的検定:ttest(1標本のt検定),ttest2(2標本のt検定),chi2test(カイ二乗検定),vartest2(F検定)などの仮説検定が実行できる.これらの検定により,データの統計的な有意性を評価できる.

目次

  1. Octave のインストール手順(Windows上)
  2. Octaveによる統計計算と分析
  3. 確率分布
  4. 分位点の計算
  5. 仮説検定
  6. データの可視化

Octave のインストール手順(Windows上)

【要点】

インストールには管理者権限が必要である.インストール中は他のアプリケーションを終了し,アンチウイルスソフトが干渉する場合は一時的に無効化することを推奨する.

  1. インストーラーの入手:公式サイト GNU Octave の"Windows Installers"セクションから,最新の安定版64bit版インストーラーをダウンロードする.
  2. 管理者権限での実行:ダウンロードしたインストーラーを右クリックし,「管理者として実行」を選択する.セキュリティ警告が表示された場合は「実行」を選択する.
  3. インストール言語:English(デフォルト)を選択し,「Next」をクリックする.現時点で日本語インターフェースには対応していない.
  4. ライセンス同意:条項を確認し,「I accept the agreement」を選択して「Next」をクリックする.
  5. インストール先の指定:デフォルトのパス(C:\Program Files\GNU Octave)を推奨する.重要:パスにスペースや日本語文字を含めないようにすること.
  6. コンポーネントの選択:以下の項目すべてを選択する.
    • Full installation(完全インストール)
    • Create Desktop Icon(デスクトップアイコンの作成)
    • Associate .m files with GNU Octave(.mファイルの関連付け)
  7. インストール実行:「Install」をクリックしてインストールを開始する.
  8. 初期動作確認:インストール完了後,以下の手順で動作を確認する:
    1. デスクトップ上のOctaveアイコンをダブルクリック
    2. コマンドウィンドウが開き,プロンプト(octave:)が表示されることを確認
    3. version コマンドを実行してバージョンを確認
    4. 2 + 2 を実行し動作を確認
    5. plot([1,2,3]) を実行し,グラフ描画を確認する.

Octaveによる統計計算と分析

平均

mean (行ベクトル → スカラー)または(行列 → 行ベクトルまたは列ベクトル)

二乗和

sumsq (行ベクトル → スカラー)または(行列 → 行ベクトルまたは列ベクトル)

分散

var (行ベクトル → スカラー)または(行列 → 行ベクトルまたは列ベクトル)

var(X)」はデータのばらつきを表す値である.

var (x) = sum(power(x-mean(x), 2))/(length(x)-1)

標準偏差

std (行ベクトル → スカラー)または(行列 → 行ベクトルまたは列ベクトル)

std(X)」は分散の正の平方根である.

std (x) = sqrt (sumsq (x - mean (x)) / (n - 1))

平均を引く

center (行ベクトル → 行ベクトル)または(行列 → 行列)


center の例

平均を引き,標準偏差で割る

studentize (行ベクトル → 行ベクトル)または(行列 → 行列)

尖度

kurtosis (行ベクトル → スカラー)

長さ N のベクトルに対して次の式で計算する.

kurtosis(x) = N^(-1) std(x)^(-4) sum((x - mean(x)).^4) - 3

歪度

skewness (行ベクトル → スカラー)

長さ N のベクトルに対して次の式で計算する.

skewness(x) = N^(-1) std(x)^(-3) sum((x - mean(x)).^3)

統計

statistics (行ベクトルまたは行列 → 行列)

次の統計量を求める:最小値,第1四分位数,中央値,第3四分位数,最大値,平均,標準偏差,歪度,尖度

QQプロット

qqplot (行ベクトル → グラフ)



QQ プロットの例

マハラノビス距離

mahalanobis (行列,行列 → スカラー)

mahalanobis(X,Y) は X と Y のマハラノビスの D-平方距離を求める.

スピアマンの順位相関係数

spearman (行列,行列 → スカラー)

spearman(X,Y) は X と Y の順位相関係数を求める.

確率分布

確率密度関数と累積分布関数 (スカラーまたはベクトル → スカラーまたはベクトル)

分位点の計算

逆累積分布関数 (スカラーまたはベクトル → スカラーまたはベクトル)

仮説検定

統計的仮説検定 (データベクトルまたは行列 → 検定統計量と p 値)

データの可視化

データの分布と関係性の可視化 (データベクトルまたは行列 → グラフ)