WACODEの経緯
antiplastics@RIKEN  ACCC
2015.7.10
⾃自⼰己紹介
露露崎弘毅(つゆざき  こうき)
理理科⼤大・薬学研究科  博⼠士後期課程
  →  理理化学研究所  情報基盤センター
          バイオインフォマティクス研究開発ユニット
      (RIKEN  ACCC  BiT)
連絡先  :  
-‐‑‒  @antiplastics
-‐‑‒  koki.tsuyuzaki  [at]  gmail.com
Rパッケージ職⼈人
第1回Kashiwa.R(2011.11.11)
理理科⼤大
野⽥田キャンパス勢
東⼤大
本郷キャンパス勢
チャリで20分
徒歩→電⾞車車→バスで30分
東⼤大
柏キャンパス勢
2015.7.10  現在
就職
残る柏キャンパス勢
東⼤大
本郷キャンパス
に移動
RIKEN@和光に移動
イギリスに移動
京⼤大に移動
Kashiwaから⼈人がいなくなった
Wakoでやったらいいのでは?
実は和光は都⼼心から近い
次回は⼟土⽇日開催も検討(1.5⽉月に1回くらいの頻度度?)
社会⼈人の⽅方もぜひお越しください
約10km!
急⾏行行で12分!
ほぼ都内!
東武東上線、副都⼼心線、有楽町が利利⽤用可能
(渋⾕谷・横浜⽅方⾯面とかにもアクセスが良良い)
WACODEの意味
1.  WACO(和光)  +  CODE(コーディング)
2.  若若⼈人(わこうど)
3.  ENCODEプロジェクトみたいでカッコイイ
勉強会の⽅方針
Kashiwa.Rでは、Rしか使えないのがやや不不⾃自由だった
⾔言語は何使っても良良いことにしよう
•  機械学習  →  Python
•  Web  →  Ruby
•  ⼤大きめなデータ  →  SQL系⾔言語
•  ソフトウェア開発  →  Java,  C/C++
•  ちょっとした前処理理→  linuxコマンド
R以外を使いたい例例
何話してもいいだと発散するから、毎回テーマを決めよう
勉強会の⽅方針
毎回テーマをやや抽象的に提⽰示
発表者は好きなように解釈する(多少でも関係していればOK)
バックグラウンドが違うと問題の解き⽅方が変わる
→  違う考え⽅方に触れる事ができる
例例:  「でかくて困っているデータ解析」
ビッグデータ
3つのV
サイズより、⾃自分がでかくて困っているかどうかが本質
(何らかの対策を講じる必要があるから)
Hadoop
今⽇日はあえてサイズを問わず「でかくて困ってるデータ」と呼び、
どう対処するか話しましょう
3V  :
Volume<容量量>
Variety<多様性>
Velocity<スピード>
4V  :
3V  +  Veracity<正確さ>  (or  Value<価値>)
情報科学・システム⼯工学教
育向けフリー素材集より
NTTデータ数理理システム、Big  Data  Module紹介
分析の複雑性
データサイズ
PB
TB
GB
MB
Hadoop
Visual  Mining  Studio
S-‐‑‒PLUS  /  R
Excel
和光市のキャラクター
(スライドの素材におすすめ)
http://www.city.wako.lg.jp/home/miryoku/character/_̲10045/kyara.html
©和光市    
正しいわこうっちの使い⽅方は以下を参照(和光市ホームページ)
きちんと書く
さつきちゃんは
なるべくわこうっ
ちと⼀一緒に使う
⾃自分の呼び⽅方  :  ぼく
語尾  :  です、ます調
特徴  :  丁寧な⾔言葉葉使い、
こどもっぽい表現
⽂文字体  :  難しい漢字は使わ
ない、できるだけ平仮名で
表現する
和光市社会福祉協議会  わしゃもんのお部屋より
和光市イメージキャラクター  わこうっち  オフィシャルサイトより

WACODE