R

Linux mint 最新版Rをインストールする方法

R

パッケージリストの用意 /etc/apt/sources.listに以下を追加 deb http://cran.ism.ac.jp/bin/linux/ubuntu trusty/ 鍵の取得 $ gpg --keyserver keyserver.ubuntu.com --recv-key E084DAB9 $ gpg -a --export E084DAB9 | sudo apt-key add - コマンドライン…

Rでレポートを作成する

R

必用ライブラリのインストール The Comprehensive R Archive Network - knitr The Comprehensive R Archive Network - markdown $ library(knitr) $ library(markdown) レポートの作成方法(markdown) test.Rmd # 概要 ## iris summary ` ``{r results='asis'…

WebからLinkedDataを取得する

R

''' library(SPARQL) d<-SPARQL(url="http://...",query="SELECT * WHERE..) '''

ggplot2の使い方

R

基本的なプロット #dataは一次元データを想定 par(family="HiraKakuProN-W3") plot(data,type="p") #散布図 plot(data,type="l") #折れ線グラフ|lines() barplot(data) #棒グラフ hist(res) #ヒストグラム boxplot(res) #箱ヒゲ図 curve(x^2) #関数曲線をプ…

Rによる空間データの統計分析(1)

R

空間データの分類と可視化 library(maptools) library(classInt) #shpファイル読み込み(IDvarには、データのID的なものを指定すると後のテーブル合成などの時に役立つ) jpn_pref<-readShapePoly("jpn_pref.shp",IDvar="PREF_CODE") jpn_COD<-read.csv("COD.c…

RでTwitter

R

準備 Twitter Developers - keyの取得などで必要 とりあえずこれ試してみる Rのバージョン足りないとかで入らなかった。 www.karada-good.net library(twitteR) #FIRST.TIME=TRUE FIRST.TIME=FALSE if( FIRST.TIME ){ consumerKey <- "" consumerSecret <- "…

Rで地理空間データ分析

R

事前準備 spdep,maptoolsをinstall.packages() libraryで読み込み 基礎操作 .shpファイルの読み込み building<-readShapePoly("building.shp") ポリゴンデータの代表点を抽出 building.cor<-coordinate(building) ポリゴンデータをプロット plot(building,co…

Shinyを利用したウェブアプリケーションの作成

R

環境設定 Download RStudio – RStudioよりRStudioをダウンロード。 実行 qiita.com 他のサンプルプログラム d.hatena.ne.jp デプロイ方法 RStudio Shiny チュートリアル レッスン7 Shinyアプリを共有しよう - Qiita を参考にして進める。 RCurlがうまくイン…

HTMLをいじる

R

テーブル形式でない Rでウェブスクレイピングしてみたを参考に進める library(XML) library(stringr) read<-htmlParse("http://*.jp") #更新日情報の取得 ##dl/ddに含まれる文字列のリストを作成 list<-getNodeSet(read, "//dl/dd") #title<-getNodeSet(read…

subset

R

概要 指定列のみ取り出す subset(data,select=c(A,B,C,...)) ベクトルと等しい値を抜き出す subset(data,id %in% vec$id) subset(data,!id %in% vec$id) #等しくない値も簡単に抜き出すことができる %in% ベクトル同士での含まれているかいないかの判定を行…

plyrパッケージ

R

概要 ある指定した特徴量に応じてデータを分割(Split) 分割したデータに対する関数の適用(Apply) 分割したデータを再結合して(list, data.frame, arrayでの)結果の出力(Combine) という操作を一つの関数で実行することができる。 使い方 ddply 月毎の行数 …

parallelパッケージを使ってRandomForestを並列化

通常と並列化の比較 通常のランダムフォレスト library(randomForest) library(kernlab) data(spam) set.seed(777) system.time(fit.rf<-randomForest(type~.,data=spam,ntree=1000)) ユーザ システム 経過 21.584 0.213 21.919 並列化のランダムフォレスト …

ランダムフォレストをループすることによる大量メモリ消費の解決策

概要 データ中に目的変数が複数あり、それぞれについてランダムフォレストを用いてモデルを作成しようとすると方法によってメモリ消費がかなり異なる。 関数内でforループを利用する方法 forループで関数自体をループさせる方法 結論は1.を利用すると大変な…

snowパッケージを使ってrandomForestを並列化

通常と並列化の比較 通常のランダムフォレスト library(randomForest) library(kernlab) data(spam) set.seed(777) system.time(fit.rf<-randomForest(type~.,data=spam,ntree=1000)) ユーザ システム 経過 21.584 0.213 21.919 並列化のランダムフォレスト …