3. データの操作
本格的な統計解析に入る前に、データの操作に慣れておきましょう。
今、読み込まれている、各変数の数値データの平均値や標準偏差を算出したい場合
①平均値
dummyデータの中の変数KanaM_Hitの平均値は、コマンド mean()を使います。
mean ( dummy $ KanaM_Hit) [Enter]
"dummy" データが入っている箱の名前
"$ KanaM_Hit" dummyの箱から変数"KanaM_Hit"のデータを参照する。
($マークは必須)
実行すると下図のように結果がでます。
練習①
dummyデータの"KanjiKanaL_Hit"の平均値を求めましょう。
答)0.68224
②標準偏差
コマンド sd()を使います。
()内は、①の時と同じように書きます。
例えば、"KanjiKanaM_Hit"の標準偏差を求めたければ
sd(dummy$KanjiKanaM_Hit)のように・・・・
番外編
ここまで、きて毎回dummy$と入力するのは面倒くさいと感じませんか?
Rには、これを省略できる便利なコマンドが用意されています。
それが、attach()コマンドです。その説明はこちらで。
③その他
その他によく使うコマンドとして
var() 分散
median() 中央値
quantile() 四分位数
などがあり、()内の書き方は同じです。
また、summary()コマンドでデータの要約をすることもできます。
こんな感じで各変数についての要約が表示されます。
Min(最小値)、1st Qu. (第一四分位)、Median(中央値)、Mean(平均値)、3rd Qu. (第三四分位)、Max. (最大値)です。
0コメント