2017.12.26 12:36

3. データの操作

本格的な統計解析に入る前に、データの操作に慣れておきましょう。

今、読み込まれている、各変数の数値データの平均値や標準偏差を算出したい場合

①平均値

　dummyデータの中の変数KanaM_Hitの平均値は、コマンド　mean()を使います。

　mean ( dummy $ KanaM_Hit) [Enter]

　　　　"dummy" データが入っている箱の名前

　　　　"$ KanaM_Hit" dummyの箱から変数"KanaM_Hit"のデータを参照する。

　　　　　（$マークは必須）

実行すると下図のように結果がでます。

練習①

dummyデータの"KanjiKanaL_Hit"の平均値を求めましょう。

　　　答）0.68224

②標準偏差

コマンド　sd()を使います。

()内は、①の時と同じように書きます。

例えば、"KanjiKanaM_Hit"の標準偏差を求めたければ

sd(dummy$KanjiKanaM_Hit)のように・・・・

番外編

ここまで、きて毎回dummy$と入力するのは面倒くさいと感じませんか？

Rには、これを省略できる便利なコマンドが用意されています。

それが、attach()コマンドです。その説明はこちらで。

③その他

その他によく使うコマンドとして

var()　分散

median() 中央値

quantile() 四分位数

などがあり、()内の書き方は同じです。

また、summary()コマンドでデータの要約をすることもできます。

こんな感じで各変数についての要約が表示されます。

Min（最小値）、1st Qu. （第一四分位）、Median（中央値）、Mean（平均値）、3rd Qu. （第三四分位）、Max. （最大値）です。

ほそぴのR統計解析

ほそぴが、フリー統計解析ソフトRのマニュアルを掲載しています

0コメント