3. データの操作

本格的な統計解析に入る前に、データの操作に慣れておきましょう。

今、読み込まれている、各変数の数値データの平均値や標準偏差を算出したい場合

①平均値

 dummyデータの中の変数KanaM_Hitの平均値は、コマンド mean()を使います。

 mean ( dummy $ KanaM_Hit)   [Enter]

    "dummy"  データが入っている箱の名前

    "$ KanaM_Hit"  dummyの箱から変数"KanaM_Hit"のデータを参照する。

     ($マークは必須)

実行すると下図のように結果がでます。

練習①

dummyデータの"KanjiKanaL_Hit"の平均値を求めましょう。

   答)0.68224

②標準偏差

コマンド sd()を使います。

()内は、①の時と同じように書きます。

例えば、"KanjiKanaM_Hit"の標準偏差を求めたければ

sd(dummy$KanjiKanaM_Hit)のように・・・・

番外編

ここまで、きて毎回dummy$と入力するのは面倒くさいと感じませんか?

Rには、これを省略できる便利なコマンドが用意されています。

それが、attach()コマンドです。その説明はこちらで


③その他

その他によく使うコマンドとして

var() 分散

median() 中央値

quantile() 四分位数

などがあり、()内の書き方は同じです。


また、summary()コマンドでデータの要約をすることもできます。

こんな感じで各変数についての要約が表示されます。

Min(最小値)、1st Qu. (第一四分位)、Median(中央値)、Mean(平均値)、3rd Qu. (第三四分位)、Max. (最大値)です。

ほそぴのR統計解析

ほそぴが、フリー統計解析ソフトRのマニュアルを掲載しています

0コメント

  • 1000 / 1000