Rの高速化

Rの高速化
Kashiwa.R#１
11 / 11 / 11
@antiplastics

自己紹介
所属：東京理科大学大学院
薬学研究科
修士課程2年（来年からD進学予定）

専門: バイオインフォマティクス

twitterアカウント： @antiplastics

趣味: バイク、サーフィン、アニメ、読書など

研究内容: マイクロアレイデータからの
発現変動遺伝子の検出

扱っているデータの構造
実験１実験２実験３実験287 実験288 実験289
遺伝子１ 1.7 3.9 4.8 4.4 2.5 4.8 実験特異的遺伝子
遺伝子２ -3.3 -0.2 0.2 -4.1 3.1 3.1 発現の検出など

遺伝子5547 -1.2 4.6 -0.9 4.6 -4.4 1.5
遺伝子5548 1.3 2.7 1.6 6.1 -1.4 3.1
遺伝子5549 2.2 3.2 -1.4 1.3 -3.2 2.0

発現変動遺伝子の検出など

行（生物の遺伝子数）列（実験データの数）
＊原核生物（大腸菌、緑膿菌など）＊ますます増加するデータベースへの登録件数
6000gene
＊真菌（カビ、酵母など） × ＊NGS（次世代シーケンサ）の登場
10000gene
＊真核生物（ヒト、マウスなど）
20000gene

超多次元、多変量の大規模データ！！

データ解析の現場の実情

動画

遅い！！！
(ノ; _ ;)ノ ┫：･'.::
結果待ちに数日かかる事もたびたび。
計算が速く終わるかどうかは死活問題。

Rはパッケージがとても豊富。
library(“hogehoge”)とか打ったら小難しい計算も、関数が勝
手にやってくれるからコード行数も少なくて済む。
めちゃくちゃ便利！

だが現実問題これだけ遅いと、やってられない時も。

→Rを高速化させて、サクサク研究を進めたい！！

→速くしようと思ったらどこまで速くなるかをみてみよう。

使用するマシン
iMac(21.5inch)
OS： MacOSⅩ10.6.8
SnowLeopard(64bit)
CPU： 2.8GHz
Intel Corei7（コア数:4）
メモリ： 8GB
HDD： 1TB

以下全てのプログラムはこのマシン上
で走らせる事とする。

比較する計算
以下の数値積分（中点法）により近時的に円周率
πを求める。

＝

N（ステップ数）が増すほど精度が上がる
今回は１千万（107）ステップで計算する

Cのソースコード
#include<stdio.h>
#include<time.h>
#define num_steps 10000000 107という値をとる変数num_stepsを定義

int main(void){
clock_t t1, t2;
t1 = clock();
int i;
double x,pi,sum=0.0,step;
step = 1.0 / (double) num_steps; ステップ = 1/107を定義

for(i = 1;i <= num_steps; i++){
x = (i - 0.5) * step;
sum = sum + 4.0 / (1.0 + x * x);
各ステップ毎に長方形の面積を
} 計算し、最後に和を求める
pi = step * sum;
printf("%f¥n",pi);
t2 = clock();
printf("%f¥n", (double)(t2 - t1) / CLOCKS_PER_SEC);
return(0);
}

Perlのソースコード
$t1 = (times)[0];
$num_steps = 10000000;
$step = 1.0 / $num_steps;

for($i = 1;$i <= $num_steps; $i++){
$x = ($i - 0.5) * $step;
$sum = $sum + 4.0 / (1.0 + $x * $x);
}
$pi = $step * $sum;
print $pi;
print "¥n";

$t2 = (times)[0];
$t3 = $t2 - $t1;
print "$t3 秒¥n";

Pythonのソースコード
import sys
import time
before = time.time()
num_steps = 10000000
sum = 0
step = 1.0 / num_steps

for i in range(1,num_steps):
x = (i - 0.5) * step
sum = sum + 4.0 / (1.0 + x * x)

pi = step * sum
print pi
print "¥n"

after = time.time()
print "Running Time =", after - before, "s"

Rubyのソースコード
require "benchmark"
num_steps = 10000000
step = 1.0 / num_steps
sum = 0

puts Benchmark::CAPTION
puts Benchmark.measure{
for i in 1 .. num_steps
x = (i - 0.5) * step
sum = sum + 4.0 / (1.0 + x * x)
end
pi = step * sum
puts pi
}

結果
ランク言語実行時間（s）
1 C 0.15
2 Python 5.19
3 Perl 5.59
4 Ruby 9.12

やはりCは最速。スクリプト言語とCの差は大きい。

R <R-2.12.1,64bit> のソースコード
*このくらいのステップ数だと32bitのRは使えなくなるので注意。

before <- proc.time()

num_steps <- 10000000
step <- 1.0 / num_steps
summ <- 0
for(i in 1:num_steps){
x <- (i - 0.5) * step
summ <- summ + 4.0 / (1.0 + x * x)
}
pi <- step * summ
print(pi)

after <- proc.time()
print(after – before)

結果
1 C 0.15
2 Python 5.19
3 Perl 5.59
4 Ruby 9.12
new 5 R 23.28

遅い…orz

Rの高速化手法① プログラム修正

num_steps <- 1:10000000 num_stepsを変数からベクトルへ変更
step <- 1.0 / 10000000

x <- (num_steps - 0.5) * step for文をやめて、ベクトルに
pi <- sum((4.0 / (1.0 + x * x))*step) 一度にアクセスするような
書き方をする
print(pi)

print(after - before)

結果
1 C 0.15
new 2 R（プログラム修正） 0.30
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
6 R 23.28

スクリプト言語をぶち抜きましたwww

Rの高速化手法② apply関数の使用

apply関数ファミリー
①で行なったベクトル、行列に同時にアクセス
するような計算を、より明示的にできる関数。入
力データの型、出力データの型の違いなどで、
apply(),lapply(), sapply(), mapply(), tapply()
がある。

Rの高速化手法② apply関数の使用


num_steps <- 1:10000000
step <- 1.0 / 10000000

menseki <- function(A){
x <- (A - 0.5) * step
各ステップで長方形の面積を求める計算は、一
y <- 4.0 / (1.0 + x * x)
度関数として定義する
return(y*step)
}

pi <- sum(sapply(num_steps,menseki)) sapplyを使って、配列num_stepsの各要
print(pi) 素に関数mensekiを適用する。


結果
1 C 0.15
2 R（プログラム修正） 0.30
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
6 R 23.28
new 7 R（apply） 54.16

かえって遅くなった…。ただし、apply関数を覚
えておくといい事がある（後述）。

Rの高速化手法③ 並列化
snowパッケージを使えば、先程のapply関数が並列に計算できる！

applyファミリー snowのでのapplyファミリー
apply() parApply() #行列用
lapply() parLapply() #リスト用
sapply() parSapply() #ベクトル、行列用
mapply() × #グループ化されたデータ用
tapply() × #規則的なリストの作成
× parRapply() #行列の行に対して
× parCapply() #行列の列に対して
× parMM() #行列同士の掛け算

Rの高速化手法③ 並列化
library("snow")
library(“Rmpi”) snowによりMPIクラスターを4個生成
cl <- makeCluster(4,type=“MPI")

num_steps <- 1:10000000
step <- 1.0 / 10000000
clusterExport(cl,”step”)

x <- (A - 0.5) * step
y <- 4.0 / (1.0 + x * x) 各ステップで長方形の面積を求める計算
return(y*step) は、一度関数として定義する
}
snow内で並列化対応したsapplyであ
pi <- sum(parSapply(cl,num_steps,menseki))
print(pi)
るparSapplyを使う

stopCluster(cl)

結果
1 C 0.15
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
new 6 R（snow） 17.35
7 R 23.28
8 R（apply） 54.16

Rの高速化手法④ ffパッケージ
Rはメモリを逼迫させる。

→データはハードディスクから、必要に応じてメモリに
ロードしたい。

＊ベクトル、行列、因子などのデータ：ｆｆパッケージ
＊行列のデータ： bigmemoryパッケージ

しかも上記の2つは並列化まであわせてやってくれる！

Rの高速化手法④ ffパッケージ
library(ff)
library(snowfall)
sfInit(parallel=TRUE, cpus=4,type=“MPI") 4つのクラスターを生成
num_steps <-ff(vmode="integer",1:10000000,length=10000000)
step <- 1.0 / 10000000 ff,stepを各クラス
sfLibrary(ff) ターにエクスポート
sfExport("step")

x <- (A - 0.5) * step
y <- 4.0 / (1.0 + x * x) snowfall内でのsapply()である、
return(y*step) sfSapply()を使う
}
pi <- sum(sfSapply(num_steps,menseki))
print(pi)


結果

1 C 0.15
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
new 6 R（ff） 17.00
7 R（snow） 17.35
8 R 23.28
9 R（apply） 54.16

snowより若干速いくらい

Rの高速化手法⑤ バイトコンパイラーの使用

あらかじめ構文解析後の関数にしておく。
人が見ても何しているのかわからない機械語に近い形式になる。

バイトコンパイル後
list(.Code, list(7L, GETVAR.OP, 1L,
LDCONST.OP, 2L, SUB.OP, 3L,
GETVAR.OP, 4L, MUL.OP, 5L,
①library(“compiler”) SETVAR.OP, 6L, POP.OP, LDCONST.OP,
②menseki2 <- cmpfun(menseki) 7L, LDCONST.OP, 8L, GETVAR.OP, 6L,
③disassemble(menseki2) GETVAR.OP, 6L, MUL.OP,
9L, ADD.OP, 10L, DIV.OP, 11L,
SETVAR.OP, 12L, POP.OP, GETVAR.OP,
バイトコンパイル前 12L, GETVAR.OP, 4L, MUL.OP, 13L,
RETURN.OP), list({
menseki <- function(A){ x <- (A - 0.5) * step
x <- (A - 0.5) * step y <- 4/(1 + x * x)
y <- 4.0 / (1.0 + x * x) return(y * step)
}, A, 0.5, A - 0.5, step, (A - 0.5) * step, x, 4, 1,
return(y*step) x * x, 1 +
} x * x, 4/(1 + x * x), y, y * step))

Rの高速化手法⑤ バイトコンパイラーの使用
library("compiler")

num_steps <- 1:10000000
step <- 1.0 / 10000000

x <- (A - 0.5) * step
y <- 4.0 / (1.0 + x * x)
return(y*step)
}

menseki2 <- cmpfun(menseki) バイトコンパイル

pi <- sum(sapply(num_steps,menseki2))
print(pi)


結果

1 C 0.15
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
6 R（ff） 17.00
7 R（snow） 17.35
8 R 23.28
new 9 R（compiler + apply） 41.14
10 R（apply） 54.16

並列化と組み合わせ
1 C 0.15
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
new 6 R（compiler + ff） 14.41
new 7 R（compiler + snow） 15.11
8 R（ff） 17.00
9 R（snow） 17.35
10 R 23.28
11 R（compiler + apply） 41.14
12 R（apply） 54.16

Rの高速化手法⑥ R-2.14.0
最新VerのR-2.14.0はかなり速い。
＊全ての基本パッケージの関数があらかじめ、バ
イトコンパイルされているとか
R-2.4.0 30.1s
R-2.8.0 30.8s
R-2.9.10 31.7s
R-2.10.0 31.7s
R-2.11.0 24.2s
64bit化
R-2.12.1 23.28s
R-2.13.2 24.4s
？
R-2.14.0 ?
バイトコンパイル化
の順

最終結果
1 C 0.15
3 Python 5.19
4 Perl 5.59
5 Ruby 9.12
6 R（compiler + ff） 14.41
7 R（compiler + snow） 15.11
8 R（ff） 17.00
9 R（snow） 17.35
new 10 R（2.14.0） 22.01
11 R 23.28
12 R（compiler + apply） 41.14
13 R（apply） 54.16

時間の関係でできなかった
高速化手法
• Revolution R
インストール時にコア数を勝手に調べて、マルチコア対応に計算を実行してくれる新型R
（Windows、Redhat用）。普通のRより2〜3倍速いという噂。

• RCCコンパイラー
R→C++に変換できます（Windows、Linux用）。

• RDBMSの利用
Rでリレーショナルデータベース（MySQL,PostgreSQL,RODBC,MiniSQL）がいじれます。

• Hadoop,Mapreduceの利用
http://www.slideshare.net/holidayworking/rmapreduce （以前のTokyo.Rのスライド）

• R＋クラウドコンピューティング
segue: アマゾンがやっているlapply関数を並列に計算してくれるサービス（Mac,Linux用）。
http://code.google.com/p/segue/

Rの高速化

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Rの高速化

Similar to Rの高速化 (20)

More from 弘毅露崎

More from 弘毅露崎 (20)

Recently uploaded

Recently uploaded (11)

Rの高速化

Rの高速化

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Rの高速化

Similar to Rの高速化 (20)

More from 弘毅 露崎

More from 弘毅 露崎 (20)

Recently uploaded

Recently uploaded (11)

Rの高速化

More from 弘毅露崎

More from 弘毅露崎 (20)