Rことはじめ(自分用メモ)
proxy
- proxyが必要な場合は,起動時に --internet2 という引数をつける
- http://cse.naro.affrc.go.jp/takezawa/r-tips/r/08.htmlより
- Sys.putenv("http_proxy"="http://プロキシーの IP アドレス:ポート番号") を実行と書いてあるページもあったが*1,うまくいかなかった.
エクセルのファイルを直接読み込むには
chooseCRANmirror() install.packages("gregmisc") install.packages("gmodels")
メニューからディレクトリ変更してから,
library(gregmisc) x <- read.xls("Eh_climate.xls", sheet=1)
ここで,エクセルファイルの1行目に日本語が入っていたら
5 は不正なマルチバイト文字です
というエラーになったので,1 byte文字に書き直して再度実行.
重回帰
result1 <- lm(LogSW ~ Alt+Lat+Lon+Temp+Rain+haplotype, data=x) summary(result1) result2 <- step(result1) summary(result2)
とかそんな感じ.カテゴリー変数もそのまま扱えるっぽい.ただ,JMPでいうところの「by」による分割はどうするんだろう?
HN <- split (x, x$Geni.type) resultH <- lm(LogSW ~ Alt+Lat+Lon+Temp+Rain+haplotype, data=HN$H) resultN <- lm(LogSW ~ Alt+Lat+Lon+Temp+Rain+haplotype, data=HN$N)
かな?
RでもJMPと同じで標準偏回帰係数は出してくれないのか.標準偏回帰係数(はxの分散,はyの分散)で求められるらしい*2.
- 重回帰も含めてチュートリアル的:http://cwoweb2.bai.ne.jp/~jgb11101/files/R-dataframe2.pdf
- ysg先生に借りた本(重回帰のやり方もばっちり書いてある):工学のためのデータサイエンス入門―フリーな統計環境Rを用いたデータ解析
やっぱりRは難しいかも.ググろうにも「R」って誤爆しすぎでなかなかヒットしないのがイライラする(^^;;
追記
標準偏回帰係数については,id:xnissy:20060601:1149156112で補足.