トップページ -> 実践知識 -> R を用いた統計処理/データマイニング -> R を用いた散布図の作成
[サイトマップへ], [サイト内検索へ],

R を用いた散布図の作成

サイト構成 連絡先,業績など 実践知識 データの扱い コンピュータ 教材 サポートページ

この Web ページでは,R を用いた散布図について, 散布図内での平均と分散の図示散布図行列スケールの信頼性 の作成手順を図解で説明する

前準備

必要となるソフトウエア


CSVファイルを読み込み,データフレームに格納

  1. (前準備) 使用する CSV ファイルの作成

    Book1.csv をダウンロード (参考: 「外国為替データ(時系列データ)の情報源の紹介」の Web ページ

    以下の説明では、

    として説明を続ける.

    自前の CSV ファイルを使うときの注意: read.table() 関数を使うので, 属性名は英語になっていること.属性名は,CSV ファイルの第一行目に書いていること.

  2. 使用する CSV ファイルの確認

    属性名が CSV ファイルの1行目に書かれていることを確認する.

  3. R の起動

    ◆ Windows での動作画面例

    ◆ Ubuntu での動作画面例

  4. read.table」を用いて,ファイルを変数に読み込み

    端末で,次のコマンドを実行.

    ◆ Windows での動作手順例

    X <- read.table("C:/R/Book1.csv", header=TRUE, sep=",", na.strings="NA", dec=".", strip.white=TRUE);
    

    ◆ Linux での動作手順例

    X <- read.table("/tmp/Book1.csv", header=TRUE, sep=",", na.strings="NA", dec=".", strip.white=TRUE);
    

    オプション

  5. 変数 X の中身の確認

    端末で,次のコマンドを実行.。

    edit(X);
    

    端末で,次のコマンドを実行.。

    str(X)
    


散布図の作成

  1. 数値による要約

    最小値,中央値,平均値,最大値などを表示

    summary(X)
    

  2. 数値による要約

    平均値,標準偏差などを表示

    numSummary( X[,c("USD", "EUR", "AUD")], statistics=c("mean", "sd", "quantiles"), quantiles=c( 0,.25,.5,.75,1 ))
    

  3. scatterplot」を用いた散布図の描画

    要点: 横軸が seq, 縦軸が USD

    scatterplot( USD~seq, reg.line=lm, smooth=TRUE, boxplots=FALSE, span=0.5, data=X )
    

  4. library(ggplot2)
    p <- ggplot(X) 
    p + geom_point( aes(x = seq, y = USD), shape=1) + stat_smooth( aes(x = seq, y = USD) ) 
    

  5. scatterplot」を用いた散布図の描画(分布の平均と分散も図示)

    要点: 横軸が seq, 縦軸が USD.分布の平均と分散も図示

    scatterplot( USD~seq, reg.line=lm, smooth=TRUE, boxplots='xy', span=0.5, data=X )
    

  6. 散布図行列

    scatterplot.matrix( ~seq+USD+EUR+AUD, reg.line=lm, smooth=TRUE, span=0.5, diagonal = 'density', data=X )
    

  7. スケールの信頼性

    reliability( cov(X[,c("USD","EUR","AUD")], use="complete.obs") )