KobayashiRui
3/16/2018 - 10:36 AM

Rの情報

参考文献 ・データサイエンスのための統計入門

Rでインストールしたライブラリ

  • matrixStats : 加重中央値などに使用する
  • corrplot : 相関表を作成するのに必要
  • ggplot2 : この関数から六角ビニングプロットをするにはさらにhexbinを入れる必要がある
  • descr : 分割表を作成する
  • ascii : 今のところ必要なし
  • vioplot : バイオリンプロット

Rのインストール方法

ubuntuのsudo aptでの方法だと古いものが入るので新しいものを入れる方法

Rのライブラリ追加方法

Rを起動後
install.package("ライブラリ名")

Rのライブラリ使用方法

library("ライブラリ名")

Rスクリプトの実行方法

Rscript ファイル名.r

各代表値の推定

  • 平均値 : mean(データ)
  • トリム平均 : mean(データ,trim=0.1) : データの両端から(trimに与えた数値*100)%を取り除く
  • 中央値 : median(データ)
  • 加重平均 : weighted.mean(データ, w=重みとなるデータ)
  • 加重中央値 : weightedMedian(データ, w=重みとなるデータ) {library("matrixStats")を事前に呼び出す必要がある} : 通常のRにはないためmatrixStatsライブラリが必要なので注意

散らばりの推定

  • 標準偏差 : sd(データ)
  • 四分位範囲 : IQR(データ)
  • 中央値絶対偏差 : mad(データ) (デフォルトでMADのスケールが平均値と同じになるように調整済み)

Rをjupyterで使用する

  1. Rを起動する
  2. install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'digest'))
  3. devtools::install_github('IRkernel/IRkernel')
  4. IRkernel::installspec()
  5. 上記の作業でjupyterの新規ファイルのメニューにRが追加される