Lightning talk on RHadoop at the January meetup of BURN
1. RHadoop: MapReduce R-ben
Kocsis Imre
ikocsis@mit.bme.hu
BURN Meetup, 2014.01.15.
Budapesti Műszaki és Gazdaságtudományi Egyetem
Méréstechnika és Információs Rendszerek Tanszék
2. Egy/A Big Data probléma
„At rest Big Data”
o Nincs update
o „Mindent” elemzünk
Elosztott tárolás
„Computation to data”
„Not true, but a very, very good lie!”
(T. Pratchett, Nightwatch)
11. Előnyök
Map és Reduce: R-ben
o Csomagok!
o MR algoritmus-prototipizálás
+ a vezérlés is: kényelem
Hadoop Job: egy függvényhívás!
o Pl. iteratív MapReduce teljesen R-ben
o Map és Reduce: ~a hívó környezetben
12. Hogyan lehet ilyenem?
Local backend, sandbox VM-ek
o Cloudera, Hortonworks
Saját Hadoop klaszter
Amazon Elastic MapReduce (EMR)
o Bérelhető Hadoop klaszter
Saját felhő megoldás