SlideShare a Scribd company logo
®
© 2014 MapR Technologies 1
®
© 2014 MapR Technologies
マップアールが考える企業システムにおける
分析プラットフォームの進化
草薙  昭彦
MapR Technologies
®
© 2014 MapR Technologies 2
本⽇日のトピック
•  業界のトレンド
–  How・Why・Why Now
•  2つの利利⽤用例例
–  機械学習と検索索技術
–  リアルタイム分析
•  エンタープライズ・データプラットフォーム
®
© 2014 MapR Technologies 3®
© 2014 MapR Technologies
業界のトレンド
®
© 2014 MapR Technologies 4
Google トレンド: ゆっくりな Explosion
®
© 2014 MapR Technologies 5
なぜ今なのか?
•  ムーアの法則は⻑⾧長い間有効であった
•  なぜ Hadoop は今流流⾏行行しているのか?
•  なぜ10年年前ではなく?
•  なぜ20年年前ではなく?
®
© 2014 MapR Technologies 6
さらに質問
•  なぜ⼤大きな会社も⼩小さな会社も?
–  巨⼤大銀⾏行行も社員1名のスタートアップも
•  なぜいろいろな業界で?
–  ⾦金金融、Web、製造、セキュリティ・・・
•  なぜいろいろなアプリケーションで?
–  広告ターゲティング、不不正検知、機器故障予測・・・
•  それもほぼ同じタイミングで!
®
© 2014 MapR Technologies 7
ありがちな回答
より⼤大量量のデータが、より急速に⽣生成される
データサイズが最⼤大容量量の1台のコンピュータにも収まりきらなくなる
データの⽣生成や格納に必要なコストが下がり続けている
これは正しい回答ではありません
®
© 2014 MapR Technologies 8
分析のスケーリングの法則
•  分析のスケーリングの法則は、80:20 ルールに従う
–  はじめはわずかな努⼒力力で⼤大きな成果が得られる
–  ところが急激にリターンが減っていく
•  トータルの価値は、必要なコストがどれだけスケールするかに
かかっている
–  これまで – 指数関数的なスケーリング
–  Big Data – リニアなスケーリング、傾きも緩やか
•  コスト性能⽐比は根本的に変わった
–  ただし、コモディティハードウェアを使うことができれば
®
© 2014 MapR Technologies 9
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
そんなの知ってた
それは知っておく
べきだった
そいつは知らなかった!
ご冗談を・・そんなのあり得るの?
®
© 2014 MapR Technologies 10
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
⽬目が付いてれば誰でも
表計算ソフトを使うインターン
社内分析チーム
業界全体の共同データ研究
国家安全保障局
®
© 2014 MapR Technologies 11
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
トータルの価値の最適条件は、
⼗十分な分析をする以前に尖った
ピークを持つ曲線になる
®
© 2014 MapR Technologies 12
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
しかし、コストのスケール
の法則によっては傾きと形
が変わっていく
®
© 2014 MapR Technologies 13
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
変化が⽬目に⾒見見えてくる
®
© 2014 MapR Technologies 14
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
これはかなり違う
®
© 2014 MapR Technologies 15
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
®
© 2014 MapR Technologies 16
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
®
© 2014 MapR Technologies 17
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
®
© 2014 MapR Technologies 18
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
®
© 2014 MapR Technologies 19
2,0000 500 1000 1500
1
0
0.25
0.5
0.75
Scale
Value
はじめは、リニアなコスト
スケーリングは逆効果
ティッピングポイントに達す
ると、急激に状況は改善する…
®
© 2014 MapR Technologies 20
トレンドの変化の必要条件
•  ティッピングポイントに到達するには
•  アルゴリズムが⽔水平にスケールすること
–  コモディティハードウェアが前提
–  障害は必ず起きるという想定
•  データの扱い⽅方が変化すること
–  データの⾮非正規化が基本になる
–  データ構造定義がフレキシブルでなくてはならない
–  きれいに構造化されたデータは少なくなる
•  ⼈人件費もリニアであること
®
© 2014 MapR Technologies 21®
© 2014 MapR Technologies
2 つの利利⽤用例例
®
© 2014 MapR Technologies 22
機械学習とレコメンデーション
®
© 2014 MapR Technologies 23
®
© 2014 MapR Technologies 24
®
© 2014 MapR Technologies 25
機械学習アルゴリズムとその実装
•  もっとシンプルで、コスト効果が⾼高いものを・・・
A1 A2
!
"
#
$
T
A1 A2
!
"
#
$=
A1
T
A2
T
!
"
%
%
#
$
&
&
A1 A2
!
"
#
$
=
A1
T
A1 A1
T
A2
AT
2A1 AT
2A2
!
"
%
%
#
$
&
&
r1
r2
!
"
%
%
#
$
&
&
=
A1
T
A1 A1
T
A2
AT
2A1 AT
2A2
!
"
%
%
#
$
&
&
h1
h2
!
"
%
%
#
$
&
&
r1 = A1
T
A1 A1
T
A2
!
"%
#
$&
h1
h2
!
"
%
%
#
$
&
&O(κ k d + k3 d) = O(k2 d log n +
k3 d) for small k, high quality
O(κ d log k) or O(d log κ log k)
for larger k, looser quality
®
© 2014 MapR Technologies 26
履履歴マトリクス: ユーザー対アイテム
アリス
ボブ
チャールズ
✔ ✔ ✔
✔ ✔
✔ ✔
®
© 2014 MapR Technologies 27
共起マトリクス: アイテム対アイテム
-
1	
   2	
  
1	
   1	
  
1	
  
1	
  
2	
   1	
  
0	
  
0	
  
0	
   0	
  
あるアイテムを購⼊入したときに、⼀一緒に
購⼊入されやすいものが求められる
この共起データを検索索エンジンのイン
デックスとして実装するとどうなるか?
®
© 2014 MapR Technologies 28
SolR
Indexer
SolR
Indexer
Solr イン
デックス⽣生成
共起データ計算
(Mahout)
アイテム
メタデータ インデックス
全期間の
購⼊入履履歴
データ
オフライン処理理
®
© 2014 MapR Technologies 29
SolR
Indexer
SolR
Indexer
Solr
検索索
Web
サーバ
アイテム
メタデータ インデックス
ユーザーの
直近の
購⼊入履履歴
テキスト検索索のスコアリングと
レコメンデーションのスコアリングは
数学的にほとんど同じ
オンライン処理理
®
© 2014 MapR Technologies 30
機械学習と検索索エンジンまとめ
•  レコメンデーションは最も幅広く活⽤用されている
機械学習のアプリケーション
•  ⾼高い効果を上げるにはシンプルにすることが最も重要
•  機械学習エンジンと検索索エンジンを統合して扱う環境
•  データが増えた場合のスケーラビリティ
®
© 2014 MapR Technologies 31
リアルタイム分析の課題
機械学習は、ふつうはバッチ処理理
直前の情報が反映されない
変化地点の検知を
すぐに⾏行行うことができない
現在のオンラインツールは、
バッチ処理理システムとうまく
連携していない
®
© 2014 MapR Technologies 32
t
現在
Hadoop はあまりリアルタイムではない
未処理理のデータ
処理理済み 直近の分析
対象期間
Hadoop ジョブは
対象データの処
理理にこれだけ必要
®
© 2014 MapR Technologies 33
t
現在
Hadoop でここまでは
うまく動作する
Storm  の
使いどころ
リアルタイム分析と⻑⾧長期分析をいっしょに
Blended viewBlended view分析の統合
®
© 2014 MapR Technologies 34
ツール
•  オンライン集計
–  ユニークセット、カウント、平均値、分散、中央値、トップ40
•  オンラインクラスタリング
–  データ記述をコンパクトに
–  変化点の検知に
•  オンライン Bayesian Bandits
–  設計の最適化に
–  メタモデリングに
®
© 2014 MapR Technologies 35
StormKafka
Twitter
Twitter API
TweetLogger
Kafka
ClusterKafka ClusterKafka
クラスタ
Kafka
API
Web サービス⽤用 NAS
Web データ
Hadoop
Flume
HDFS データ
®
© 2014 MapR Technologies 36
Twitter
Twitter
API
Catcher Storm
トピック
キュー
Web サーバ
http
Web データ
TweetLogger
®
© 2014 MapR Technologies 37
リアルタイム学習まとめ
•  統合プラットフォームを利利⽤用することでシステムをシンプルに
•  リアルタイム学習は、直近の変化を反映できる
•  バッチ学習は、より深く包括的な分析ができる
•  2つの組み合わせで、さらなる競争上の優位性を得られる
®
© 2014 MapR Technologies 38®
© 2014 MapR Technologies
エンタープライズ・
データプラットフォーム
®
© 2014 MapR Technologies 39
•  データ展開
•  保管
•  データ変換
•  データ検索索
•  ストリーミング,  
インタラクション
ビジネスの成功に向けた鍵
Hadoop はエンタープライズシステムの苦痛を取り
除く
業務システム 分析システム
社内ユーザー
信頼性と災害対策1
相互運⽤用性2
⾼高い性能3
4
業務と分析の
両⽅方をサポート
4
®
© 2014 MapR Technologies 40
Advertising
Automation
Cloud!
Sellers
Cloud!
Buyers!
Cloud!
2,000億
⼀一⽇日あたり
広告オークション
®
© 2014 MapR Technologies 41
2,000万
曲
®
© 2014 MapR Technologies 42
4,500万
⼀一ヶ⽉月あたり分析対象
フォーチュン100⼩小売⼤大⼿手
買い物客
®
© 2014 MapR Technologies 43
世界最⼤大のバイオメトリックデータベース
PEOPLE
12億
⼈人
®
© 2014 MapR Technologies 44
エンタープライズ・データアーキテクチャの変⾰革の
好機
重複する処理理システム、部⾨門毎の構築の取り組みから…
®
© 2014 MapR Technologies 45
®
⾼高信頼なエンタープライズデータハブ
…  業務と分析ワークロードの統合へ
®
© 2014 MapR Technologies 46
Hadoop に関する総合情報:Hadoop Times
http://www.hadoop-times.com/
®
© 2014 MapR Technologies 47
Q&A
@mapr_japan maprjapan
sales-jp@mapr.com
お問い合わせはこちらまで
MapR
maprtech
mapr-technologies

More Related Content

What's hot

(LT)Spark and Cassandra
(LT)Spark and Cassandra(LT)Spark and Cassandra
(LT)Spark and Cassandra
datastaxjp
 
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop / Spark Conference Japan
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
Atsushi Kurumada
 
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?maruyama097
 
基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-
基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-
基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-
Keigo Suda
 
Fast Data を扱うためのデザインパターン
Fast Data を扱うためのデザインパターンFast Data を扱うためのデザインパターン
Fast Data を扱うためのデザインパターン
MapR Technologies Japan
 
ビッグデータとデータマート
ビッグデータとデータマートビッグデータとデータマート
ビッグデータとデータマート
株式会社オプト 仙台ラボラトリ
 
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~Developers Summit
 
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
 
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
 
世界一簡単なHadoopの話
世界一簡単なHadoopの話世界一簡単なHadoopの話
世界一簡単なHadoopの話
Koichi Shimazaki
 
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
MapR Technologies Japan
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Japan
 
Hadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformHadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data Platform
Yuta Imai
 
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 FallAmazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 FallShinpei Ohtani
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
Satoru Ishikawa
 
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
 
S01 t3 data_engineer
S01 t3 data_engineerS01 t3 data_engineer
S01 t3 data_engineer
Takeshi Akutsu
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Cloudera Japan
 
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
Insight Technology, Inc.
 

What's hot (20)

(LT)Spark and Cassandra
(LT)Spark and Cassandra(LT)Spark and Cassandra
(LT)Spark and Cassandra
 
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
 
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
 
基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-
基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-
基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-
 
Fast Data を扱うためのデザインパターン
Fast Data を扱うためのデザインパターンFast Data を扱うためのデザインパターン
Fast Data を扱うためのデザインパターン
 
ビッグデータとデータマート
ビッグデータとデータマートビッグデータとデータマート
ビッグデータとデータマート
 
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
 
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
 
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
 
世界一簡単なHadoopの話
世界一簡単なHadoopの話世界一簡単なHadoopの話
世界一簡単なHadoopの話
 
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
 
Hadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformHadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data Platform
 
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 FallAmazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
 
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
 
S01 t3 data_engineer
S01 t3 data_engineerS01 t3 data_engineer
S01 t3 data_engineer
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
 
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
 

Similar to マップアールが考える企業システムにおける分析プラットフォームの進化 - 2014/06/27 Data Scientist Summit 2014

実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
MapR Technologies Japan
 
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
MapR Technologies Japan
 
時系列の世界の時系列データ
時系列の世界の時系列データ時系列の世界の時系列データ
時系列の世界の時系列データ
MapR Technologies Japan
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
Recruit Technologies
 
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
MapR Technologies Japan
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
Insight Technology, Inc.
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Treasure Data, Inc.
 
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
 
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
Recruit Technologies
 
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
Recruit Technologies
 
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
Cloudera Japan
 
異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法
MapR Technologies Japan
 
Apache Drill を利用した実データの分析
Apache Drill を利用した実データの分析Apache Drill を利用した実データの分析
Apache Drill を利用した実データの分析
MapR Technologies Japan
 
LBJ2016オープンステージスライド
LBJ2016オープンステージスライドLBJ2016オープンステージスライド
LBJ2016オープンステージスライド
Kurata Takeshi
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料Recruit Technologies
 
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
MapR Technologies Japan
 
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
Cloudera Japan
 
20120822_dstn技術交流会_DataSpider接続先技術動向
20120822_dstn技術交流会_DataSpider接続先技術動向20120822_dstn技術交流会_DataSpider接続先技術動向
20120822_dstn技術交流会_DataSpider接続先技術動向dstn
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
Mie Mori
 

Similar to マップアールが考える企業システムにおける分析プラットフォームの進化 - 2014/06/27 Data Scientist Summit 2014 (20)

実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
 
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
 
時系列の世界の時系列データ
時系列の世界の時系列データ時系列の世界の時系列データ
時系列の世界の時系列データ
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
 
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
 
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
 
Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証Spark/MapReduceの 機械学習ライブラリ比較検証
Spark/MapReduceの 機械学習ライブラリ比較検証
 
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
レコメンドバッチ高速化に向けたSpark/MapReduceの機械学習ライブラリ比較検証
 
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
 
異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法
 
Apache Drill を利用した実データの分析
Apache Drill を利用した実データの分析Apache Drill を利用した実データの分析
Apache Drill を利用した実データの分析
 
LBJ2016オープンステージスライド
LBJ2016オープンステージスライドLBJ2016オープンステージスライド
LBJ2016オープンステージスライド
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
 
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
 
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
 
20120822_dstn技術交流会_DataSpider接続先技術動向
20120822_dstn技術交流会_DataSpider接続先技術動向20120822_dstn技術交流会_DataSpider接続先技術動向
20120822_dstn技術交流会_DataSpider接続先技術動向
 
Hadoopカンファレンス2013
Hadoopカンファレンス2013Hadoopカンファレンス2013
Hadoopカンファレンス2013
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 

More from MapR Technologies Japan

MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなすMapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
MapR Technologies Japan
 
Drill超簡単チューニング
Drill超簡単チューニングDrill超簡単チューニング
Drill超簡単チューニング
MapR Technologies Japan
 
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
MapR Technologies Japan
 
Apache Drill で日本語を扱ってみよう + オープンデータ解析
Apache Drill で日本語を扱ってみよう + オープンデータ解析Apache Drill で日本語を扱ってみよう + オープンデータ解析
Apache Drill で日本語を扱ってみよう + オープンデータ解析
MapR Technologies Japan
 
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
MapR Technologies Japan
 
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているかHBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
MapR Technologies Japan
 
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
MapR Technologies Japan
 
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッションApache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
MapR Technologies Japan
 
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
MapR Technologies Japan
 
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
MapR Technologies Japan
 
MapR M7 技術概要
MapR M7 技術概要MapR M7 技術概要
MapR M7 技術概要
MapR Technologies Japan
 
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR Technologies Japan
 

More from MapR Technologies Japan (12)

MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなすMapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
 
Drill超簡単チューニング
Drill超簡単チューニングDrill超簡単チューニング
Drill超簡単チューニング
 
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
 
Apache Drill で日本語を扱ってみよう + オープンデータ解析
Apache Drill で日本語を扱ってみよう + オープンデータ解析Apache Drill で日本語を扱ってみよう + オープンデータ解析
Apache Drill で日本語を扱ってみよう + オープンデータ解析
 
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
 
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているかHBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
 
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
 
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッションApache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
 
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
 
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
 
MapR M7 技術概要
MapR M7 技術概要MapR M7 技術概要
MapR M7 技術概要
 
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
 

Recently uploaded

生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
Osaka University
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
chiefujita1
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
 
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
 
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援しますキンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
Takayuki Nakayama
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
Matsushita Laboratory
 
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
t m
 
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
嶋 是一 (Yoshikazu SHIMA)
 
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライドHumanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
tazaki1
 

Recently uploaded (10)

生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
 
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
 
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援しますキンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
キンドリル ネットワークアセスメントサービスご紹介 今のネットワーク環境は大丈夫? 調査〜対策までご支援します
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
 
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
遺伝的アルゴリズムと知識蒸留による大規模言語モデル(LLM)の学習とハイパーパラメータ最適化
 
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
 
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライドHumanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
 

マップアールが考える企業システムにおける分析プラットフォームの進化 - 2014/06/27 Data Scientist Summit 2014

  • 1. ® © 2014 MapR Technologies 1 ® © 2014 MapR Technologies マップアールが考える企業システムにおける 分析プラットフォームの進化 草薙  昭彦 MapR Technologies
  • 2. ® © 2014 MapR Technologies 2 本⽇日のトピック •  業界のトレンド –  How・Why・Why Now •  2つの利利⽤用例例 –  機械学習と検索索技術 –  リアルタイム分析 •  エンタープライズ・データプラットフォーム
  • 3. ® © 2014 MapR Technologies 3® © 2014 MapR Technologies 業界のトレンド
  • 4. ® © 2014 MapR Technologies 4 Google トレンド: ゆっくりな Explosion
  • 5. ® © 2014 MapR Technologies 5 なぜ今なのか? •  ムーアの法則は⻑⾧長い間有効であった •  なぜ Hadoop は今流流⾏行行しているのか? •  なぜ10年年前ではなく? •  なぜ20年年前ではなく?
  • 6. ® © 2014 MapR Technologies 6 さらに質問 •  なぜ⼤大きな会社も⼩小さな会社も? –  巨⼤大銀⾏行行も社員1名のスタートアップも •  なぜいろいろな業界で? –  ⾦金金融、Web、製造、セキュリティ・・・ •  なぜいろいろなアプリケーションで? –  広告ターゲティング、不不正検知、機器故障予測・・・ •  それもほぼ同じタイミングで!
  • 7. ® © 2014 MapR Technologies 7 ありがちな回答 より⼤大量量のデータが、より急速に⽣生成される データサイズが最⼤大容量量の1台のコンピュータにも収まりきらなくなる データの⽣生成や格納に必要なコストが下がり続けている これは正しい回答ではありません
  • 8. ® © 2014 MapR Technologies 8 分析のスケーリングの法則 •  分析のスケーリングの法則は、80:20 ルールに従う –  はじめはわずかな努⼒力力で⼤大きな成果が得られる –  ところが急激にリターンが減っていく •  トータルの価値は、必要なコストがどれだけスケールするかに かかっている –  これまで – 指数関数的なスケーリング –  Big Data – リニアなスケーリング、傾きも緩やか •  コスト性能⽐比は根本的に変わった –  ただし、コモディティハードウェアを使うことができれば
  • 9. ® © 2014 MapR Technologies 9 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value そんなの知ってた それは知っておく べきだった そいつは知らなかった! ご冗談を・・そんなのあり得るの?
  • 10. ® © 2014 MapR Technologies 10 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value ⽬目が付いてれば誰でも 表計算ソフトを使うインターン 社内分析チーム 業界全体の共同データ研究 国家安全保障局
  • 11. ® © 2014 MapR Technologies 11 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value トータルの価値の最適条件は、 ⼗十分な分析をする以前に尖った ピークを持つ曲線になる
  • 12. ® © 2014 MapR Technologies 12 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value しかし、コストのスケール の法則によっては傾きと形 が変わっていく
  • 13. ® © 2014 MapR Technologies 13 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value 変化が⽬目に⾒見見えてくる
  • 14. ® © 2014 MapR Technologies 14 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value これはかなり違う
  • 15. ® © 2014 MapR Technologies 15 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value
  • 16. ® © 2014 MapR Technologies 16 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value
  • 17. ® © 2014 MapR Technologies 17 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value
  • 18. ® © 2014 MapR Technologies 18 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value
  • 19. ® © 2014 MapR Technologies 19 2,0000 500 1000 1500 1 0 0.25 0.5 0.75 Scale Value はじめは、リニアなコスト スケーリングは逆効果 ティッピングポイントに達す ると、急激に状況は改善する…
  • 20. ® © 2014 MapR Technologies 20 トレンドの変化の必要条件 •  ティッピングポイントに到達するには •  アルゴリズムが⽔水平にスケールすること –  コモディティハードウェアが前提 –  障害は必ず起きるという想定 •  データの扱い⽅方が変化すること –  データの⾮非正規化が基本になる –  データ構造定義がフレキシブルでなくてはならない –  きれいに構造化されたデータは少なくなる •  ⼈人件費もリニアであること
  • 21. ® © 2014 MapR Technologies 21® © 2014 MapR Technologies 2 つの利利⽤用例例
  • 22. ® © 2014 MapR Technologies 22 機械学習とレコメンデーション
  • 23. ® © 2014 MapR Technologies 23
  • 24. ® © 2014 MapR Technologies 24
  • 25. ® © 2014 MapR Technologies 25 機械学習アルゴリズムとその実装 •  もっとシンプルで、コスト効果が⾼高いものを・・・ A1 A2 ! " # $ T A1 A2 ! " # $= A1 T A2 T ! " % % # $ & & A1 A2 ! " # $ = A1 T A1 A1 T A2 AT 2A1 AT 2A2 ! " % % # $ & & r1 r2 ! " % % # $ & & = A1 T A1 A1 T A2 AT 2A1 AT 2A2 ! " % % # $ & & h1 h2 ! " % % # $ & & r1 = A1 T A1 A1 T A2 ! "% # $& h1 h2 ! " % % # $ & &O(κ k d + k3 d) = O(k2 d log n + k3 d) for small k, high quality O(κ d log k) or O(d log κ log k) for larger k, looser quality
  • 26. ® © 2014 MapR Technologies 26 履履歴マトリクス: ユーザー対アイテム アリス ボブ チャールズ ✔ ✔ ✔ ✔ ✔ ✔ ✔
  • 27. ® © 2014 MapR Technologies 27 共起マトリクス: アイテム対アイテム - 1   2   1   1   1   1   2   1   0   0   0   0   あるアイテムを購⼊入したときに、⼀一緒に 購⼊入されやすいものが求められる この共起データを検索索エンジンのイン デックスとして実装するとどうなるか?
  • 28. ® © 2014 MapR Technologies 28 SolR Indexer SolR Indexer Solr イン デックス⽣生成 共起データ計算 (Mahout) アイテム メタデータ インデックス 全期間の 購⼊入履履歴 データ オフライン処理理
  • 29. ® © 2014 MapR Technologies 29 SolR Indexer SolR Indexer Solr 検索索 Web サーバ アイテム メタデータ インデックス ユーザーの 直近の 購⼊入履履歴 テキスト検索索のスコアリングと レコメンデーションのスコアリングは 数学的にほとんど同じ オンライン処理理
  • 30. ® © 2014 MapR Technologies 30 機械学習と検索索エンジンまとめ •  レコメンデーションは最も幅広く活⽤用されている 機械学習のアプリケーション •  ⾼高い効果を上げるにはシンプルにすることが最も重要 •  機械学習エンジンと検索索エンジンを統合して扱う環境 •  データが増えた場合のスケーラビリティ
  • 31. ® © 2014 MapR Technologies 31 リアルタイム分析の課題 機械学習は、ふつうはバッチ処理理 直前の情報が反映されない 変化地点の検知を すぐに⾏行行うことができない 現在のオンラインツールは、 バッチ処理理システムとうまく 連携していない
  • 32. ® © 2014 MapR Technologies 32 t 現在 Hadoop はあまりリアルタイムではない 未処理理のデータ 処理理済み 直近の分析 対象期間 Hadoop ジョブは 対象データの処 理理にこれだけ必要
  • 33. ® © 2014 MapR Technologies 33 t 現在 Hadoop でここまでは うまく動作する Storm  の 使いどころ リアルタイム分析と⻑⾧長期分析をいっしょに Blended viewBlended view分析の統合
  • 34. ® © 2014 MapR Technologies 34 ツール •  オンライン集計 –  ユニークセット、カウント、平均値、分散、中央値、トップ40 •  オンラインクラスタリング –  データ記述をコンパクトに –  変化点の検知に •  オンライン Bayesian Bandits –  設計の最適化に –  メタモデリングに
  • 35. ® © 2014 MapR Technologies 35 StormKafka Twitter Twitter API TweetLogger Kafka ClusterKafka ClusterKafka クラスタ Kafka API Web サービス⽤用 NAS Web データ Hadoop Flume HDFS データ
  • 36. ® © 2014 MapR Technologies 36 Twitter Twitter API Catcher Storm トピック キュー Web サーバ http Web データ TweetLogger
  • 37. ® © 2014 MapR Technologies 37 リアルタイム学習まとめ •  統合プラットフォームを利利⽤用することでシステムをシンプルに •  リアルタイム学習は、直近の変化を反映できる •  バッチ学習は、より深く包括的な分析ができる •  2つの組み合わせで、さらなる競争上の優位性を得られる
  • 38. ® © 2014 MapR Technologies 38® © 2014 MapR Technologies エンタープライズ・ データプラットフォーム
  • 39. ® © 2014 MapR Technologies 39 •  データ展開 •  保管 •  データ変換 •  データ検索索 •  ストリーミング,   インタラクション ビジネスの成功に向けた鍵 Hadoop はエンタープライズシステムの苦痛を取り 除く 業務システム 分析システム 社内ユーザー 信頼性と災害対策1 相互運⽤用性2 ⾼高い性能3 4 業務と分析の 両⽅方をサポート 4
  • 40. ® © 2014 MapR Technologies 40 Advertising Automation Cloud! Sellers Cloud! Buyers! Cloud! 2,000億 ⼀一⽇日あたり 広告オークション
  • 41. ® © 2014 MapR Technologies 41 2,000万 曲
  • 42. ® © 2014 MapR Technologies 42 4,500万 ⼀一ヶ⽉月あたり分析対象 フォーチュン100⼩小売⼤大⼿手 買い物客
  • 43. ® © 2014 MapR Technologies 43 世界最⼤大のバイオメトリックデータベース PEOPLE 12億 ⼈人
  • 44. ® © 2014 MapR Technologies 44 エンタープライズ・データアーキテクチャの変⾰革の 好機 重複する処理理システム、部⾨門毎の構築の取り組みから…
  • 45. ® © 2014 MapR Technologies 45 ® ⾼高信頼なエンタープライズデータハブ …  業務と分析ワークロードの統合へ
  • 46. ® © 2014 MapR Technologies 46 Hadoop に関する総合情報:Hadoop Times http://www.hadoop-times.com/
  • 47. ® © 2014 MapR Technologies 47 Q&A @mapr_japan maprjapan sales-jp@mapr.com お問い合わせはこちらまで MapR maprtech mapr-technologies