SlideShare a Scribd company logo
1 of 35
© 2016 IBM Corporation
WatsonとSparkを組み合わせた分析
~Watsonを使ったレコメンドと可能性と問題~
Tanaka Y.P
2016-10-27
© 2016 IBM Corporation2
自己紹介
田中裕一(yuichi tanaka)
主にアーキテクチャとサーバーサイドプログラムを担当
することが多い。Hadoop/Spark周りをよく触ります。
Node.js、Python、最近はSpark周りの仕事でScalaを書く
ことが多い気がします。
休日はOSS周りで遊んだり。
詳解 Apache Spark
© 2016 IBM Corporation3
背景
昨今データ活用の重要性が説かれて久しく、
Hadoop/Sparkといった技術要素が非常に注目されてい
ます。また、AIのワードと共にWatsonなどのCognitive
システムにも注目が集まるようになってきました。
 参考:総務省 H.24 情報通信白書
 http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
© 2016 IBM Corporation4
AIとCognitive
© 2016 IBM Corporation5
Watsonの話
 AI(人工知能)の文脈で紹介されることもあるが実はIBM自身はAIとは
読んでいない
Descriptive
Analytics
Predictive
Analytics
Cognitive
Analytics
現状把握
予測分析
認知
何が起こったのか
将来何が起こるのか
次に取るべき
最適なアクションを判別
共有・指示を行う。
© 2016 IBM Corporation6
Watsonは一体何ができるのか?
 現在WatsonはBluemix上で幾つかの機能をRestI/Fで提供しています。
Natural Language Classifier Retrieve and Rank Document Conversino Speech To Text Text to Speech
Tone Analyzer Personality Insights Visual Recognition
参考:
Watson API Demo
Watsonの一例
© 2016 IBM Corporation7
今日お話しすること
 今日は題材としてWatsonがどんなところで利用可能なのか?を考えるため、Watsonの活
用方法の一つとして、WatsonとSparkを組み合わせて新しい形の映画レコメンドを作って
みます。
• 今日のテーマを通して考えること
• Watsonを巧く利用することによるデータ活用のさらなる可能性
• 面白いから実用へ
• Watsonと機会学習の企業における棲みわけ
• これからAI時代を迎えるにあたっての課題
© 2016 IBM Corporation8
WatsonとSparkで作る映画レコメンド
 今日の手順
1. データの収集と格納(Master Data)
2. Watsonを使ったPersonality分析と結果の格納
3. Sparkを使った前処理とモデルの生成
4. サンプルデータの収集とモデルの適用
© 2016 IBM Corporation9
今日のサンプルの俯瞰
Personality to Item
Webからのデータ収集 Watsonを使った分析
Sparkを使った前処理
レコメンド
© 2016 IBM Corporation10
Masterデータの収集
user_id name age...
1 Yuichi Tanaka 30
2 Sho Kaijima 35
movie_id title desc
1 君の名は。 前作『言の
葉の庭』か
ら...
2 シン・ゴジラ 『シン・ゴジ
ラ』は、...
user_id movie_id value comment
1 1 4.0 個人的にはめっちゃ好きでした...
1 2 3.5 とにかくリアルなのが良い。無駄な
会議含め...
*ユーザー情報のマスタ 映画情報のマスタ
ユーザによる映画評価
© 2016 IBM Corporation11
収集データのWatsonによる分析
user_id movie_id value comment
1 1 4.0 個人的にはめっちゃ好きでした...
1 2 3.5 とにかくリアルなのが良い。無駄な会議含め...
ユーザによる映画評価
Personality Insights
WatsonのAPIの中、Personality InsightsのAPIとユーザーによる映画評価の情報を利用し
ユーザー毎のパーソナリティを作成します。
© 2016 IBM Corporation12
Personality Insight ~書き込みから、心理属性を分析する~
Personality (個性)
Needs (欲求)
Values (価値観)
言語表現の特徴を、心理学的観点から整理・体系化
• 言語的特徴: 助詞・代名詞・数詞・否定表現・他
• 心理作用、精神的・知覚的プロセス: 喜怒哀楽表現・原因表現・他
• 相対的概念: 時間表現・空間表現・行動表現・他
• 関心の対象: 仕事関連・学校関連・娯楽関連・宗教関連・他
テキスト watson
エラー率
© 2016 IBM Corporation13
Personality(個性)の推定
Big 5/OCEAN と呼ばれる軸でPersonalityを推定
• Openness to experience: 好奇心が強い・独創的 vs. 着実・警戒心が強い
• Conscientiousness: 勤勉・まめな人 vs. 楽天的・不注意
• Extraversion: 外向的・エネルギッシュ vs. 孤独を好む・控えめ
• Agreeableness: 人当たりの良い・温情のある vs. 冷たい・不親切
• Neuroticism: 繊細・神経質 vs. 情緒安定な・自信家の
さらに細かい推定も可能
• Openness to experience: 活発度、自己主張、明朗性、刺激希求性、友情、社交性
• Conscientiousness: 大胆性、芸術的関心度、情動性、想像力、思考力、現状打破
• Extraversion: 達成努力、注意深さ、忠実さ、秩序性、自制力、自己効力感
• Agreeableness: 利他主義、協調性、謙虚さ、強硬さ、共感度、信用度
• Neuroticism: 悲観的、自意識過剰、低ストレス耐性、激情的、心配性、利己的
13
© 2016 IBM Corporation14
Needs(欲求)の推定
Kevin FordのUniversal Needs Map に沿った分析 (欲求と社会的価値の関係)
個人の様々な習慣に関係 : ブランドの選択、商品の選択、職業の選択
• Challenge:挑戦
• Closeness:親密さ
• Curiosity:好奇心
• Excitement:興奮
• Harmony:調和
• Ideal:理想
• Liberty:自由
• Love:愛
• Practicality:現実性
• Self-(expression):自己表現
• Stability:安定
• Structure:組織
14
Spending
Thrifty
Materialism
Security
Altruism
Risk
Modesty
Conformism
Industry
© 2016 IBM Corporation15
Value(価値観)の推定
15
Schwartzの価値概説 (Schwartz Value Survey) に沿った分析
4つの上位価値と10個の価値によって構成される
4つの上位価値
•Self-transcendence : 自己超越
•Conservation : 保守(性)
•Self-enhancement :自己高揚
•Open to change : 変化に対する需要(許容)性
10の価値
•博識、善行、調和、伝統、秩序、権勢、
達成、快楽、刺激、自決
http://macs.mainichi.co.jp/space/web/034/marke.html より転載15
© 2016 IBM Corporation16
収集データのWatsonによる分析
user_id movie_id value comment
1 1 4.0 個人的にはめっちゃ好きでした...
1 2 3.5 とにかくリアルなのが良い。無駄な会議含め...
user_id name age... personality
1 Yuichi Tanaka 30 { "id": "personality", "name": "ビッグファイブ",
"children": [ {"id": "Neuroticism_parent", "name":
"情緒不安定性", "category": "personality",
"percentage": 0.8434073484367335, "children": [
2 Sho Kaijima 35 {"id": "Emotionality", "name": "情動性",
"category": "personality", "percentage":
0.3201653809217191, "sampling_error":
0.02634522}
コメントからpersonalityを作成
*ユーザー情報のマスタ
ユーザによる映画評価
© 2016 IBM Corporation17
Sparkによる前処理とモデル作成
M1 M2 M3 M4
U1 3.0 3.2 0 4.2
U2 2.1 2.0 3.0 1.8
U3 4.0 0 0 4.0
U4 0 0 3.0 3.3
M1 M2 M3 M4
U1 5.255 5.382 3.342 6.020
U2 4.728 4.511 6.683 4.076
U3 6.0 4.0 4.0 6.0
U4 4.002 4.002 5.902 6.092
映画の評価
前処理しておく
映画の評価(正規化)
user_id movie_id value comment
1 1 4.0 個人的にはめっちゃ好きでした...
1 2 3.5 とにかくリアルなのが良い。無駄な会議含め...
ユーザによる映画評価
ユーザー毎の映画の評価に変換
バラツキが出るので
© 2016 IBM Corporation18
Sparkによる前処理とモデル作成
user_id name age... personality
1 Yuichi Tanaka 30 { "id": "personality", "name": "ビッグファイブ",
"children": [ {"id": "Neuroticism_parent",
"name": "情緒不安定性", "category":
"personality", "percentage":
0.8434073484367335, "children": [
2 Sho Kaijima 35 {"id": "Emotionality", "name": "情動性",
"category": "personality", "percentage":
0.3201653809217191, "sampling_error":
0.02634522}
*ユーザー情報のマスタ
P1 P2 P3 P4
U1 0.6276 0.5269 0.5798 0.5782
U2 0.4849 0.4450 0.4132 0.4415
U3 0.4338 0.7435 0.7012 0.2925
U4 0.6247 0.7086 0.5751 0.4055
パーソナリティ
ユーザー毎のパーソナリティに変換
エラー率も勘案して計算しておく
P1E P2E P3E P4E
U1 0.0263 0.0341 0.0152 0.4783
U2 0.1238 0.0114 0.0984 0.5783
U3 0.0512 0.0299 0.0378 0.0673
U4 0.0837 0.3512 0.0384 0.1039
エラー率
エラー率で重み付け
© 2016 IBM Corporation19
Sparkによる前処理とモデル作成
P1 P2 P3 P4
U1 0.6276 0.5269 0.5798 0.5782
U2 0.4849 0.4450 0.4132 0.4415
U3 0.4338 0.7435 0.7012 0.2925
U4 0.6247 0.7086 0.5751 0.4055
M1 M2 M3 M4
P1 10.693 9.9009 10.761 12.163
P2 12.170 10.653 11.891 13.764
P3 11.503 10.091 10.899 12.886
P4 8.5093 7.8967 8.4469 9.5043
パーソナリティ
変換後(Personality/Movie)
M1 M2 M3 M4
U1 5.255 5.382 3.342 6.020
U2 4.728 4.511 6.683 4.076
U3 6.0 4.0 4.0 6.0
U4 4.002 4.002 5.902 6.092
映画の評価(正規化)
内積
© 2016 IBM Corporation20
対象データのWatsonによる分析
これまでのデータを学習データとし、映画のレコメンドを行う対象データ
を作ります。
引用:
ホワイトハウス
https://www.whitehouse.gov/briefing-room/speeches-and-remarks
外務省
http://www.mofa.go.jp/mofaj/press/enzetsu/e_souri.html
We get an incomplete.
But the good news is we can still
pass the course if we make
some good decisions now. ....
難民問題は国際社会が直面する最も
大きな課題の一つであり、このサミット
を開催したオバマ大統領のイニシア
ティブに心から敬意を表します。...
{"id": "Adventurousness", "name": "大胆性",
"category": "personality", "percentage":
0.5589476354662417, "sampling_error":
0.03311216},
{"id": "Emotionality", "name": "情動性",
"category": "personality", "percentage":
0.3201653809217191, "sampling_error":
0.02634522},
安倍首相 オバマ大統領
© 2016 IBM Corporation21
対象データのWatsonによる分析
{"id": "Adventurousness",
"name": "大胆性", "category":
"personality", "percentage":
0.5589476354662417,
"sampling_error": 0.03311216},
{"id": "Emotionality",
"name": "情動性",
"category": "personality",
"percentage":
0.3201653809217191,
"sampling_error":
0.02634522},
安倍首相 オバマ大統領
M1 M2 M3 M4
P1 10.693 9.9009 10.761 12.163
P2 12.170 10.653 11.891 13.764
P3 11.503 10.091 10.899 12.886
P4 8.5093 7.8967 8.4469 9.5043
変換後(Personality/Movie)
レコメンドの作成 レコメンドの作成
© 2016 IBM Corporation22
Cognitive/AIの可能性と問題
 ここまで簡易的にWatsonを使ったレコメンドを見てきました。ここから
はこのレコメンドの可能性と問題について見ていきます。
© 2016 IBM Corporation23
Cognitiveの可能性①
 レコメンドの種類/課題
Item to Item
User to Item
Personality to Item
ルールベース
アイテム同士の相関関係によるレコメンド
* パーソナライズがかからない
行動ログ・購買ログを元にしたレコメンド
* 行動や購買実績のないユーザー
ランキングやおすすめ商品のレコメンド
* ディフォルトセットなどで利用
パーソナリティを元にしたレコメンド
• 行動のないユーザーにもある程度
パーソナライズしたレコメンドが可能
© 2016 IBM Corporation24
Cognitiveの可能性②
日本語
We get an incomplete.
But the good news is we can still
pass the course if we make
some good decisions now. ....
難民問題は国際社会が直面する最も
大きな課題の一つであり、このサミット
を開催したオバマ大統領のイニシア
ティブに心から敬意を表します。...
英語
Personality
レコメンデーション
自社のデータ
Watson
経営分析
© 2016 IBM Corporation25
可能性のまとめ
• 今後、差別化・競争化していく中で、自社のデータとソーシャルデータの組み合わせ
はますます重要性を増す。
自社のデータ
ソーシャル・オープンデータ
Watson 新たな価値
© 2016 IBM Corporation26
 今回のサンプルから、Watsonと機会学習の棲みわけについてまとめてみます。
Watsonと機会学習の棲みわけ
ソーシャル・オープンデータ
• 心理学などの専門的な知識、日本語の扱いなどの専門的な知識
• 学習データの収集
• コーパスの作成
• 結果検証
分析
© 2016 IBM Corporation27
 今回のサンプルから、Watsonと機会学習の棲みわけについてまとめてみます。
Watsonと機会学習の棲みわけ
ソーシャル・オープンデータ
自社のデータ
分析
Data Scientist
© 2016 IBM Corporation28
 Watsonを筆頭にCognitiveまたはAIと呼ばれているシステムでは説明性について欠如するケース
がほとんどです。
 今回の例では テキストデータ ー> パーソナリティを利用しました。Watsonはテキストデータ
を元にテキストを記述したユーザーがどう言ったパーソナリティを持っているかを出力しますが、
なぜそう判断したのか?の部分は説明ができません
何が問題になるのか
自前の分析
Watsonの分析data
data
説明できない
説明可能
© 2016 IBM Corporation29
Performanceによる計測
自前の分析
Watsonの分析data
data
説明できない
説明可能
Minimum Viable Product
• MVP(検証可能な最小製品)としてBMLループに組み込む事でPerformanceは計測可能である
• CVR,CTR,回遊率等
Feedback
Performance
© 2016 IBM Corporation30
Performanceによる計測
レコメンドをサイクルさせる為の一つの例
Personality to Item
Other Recommendation
Item1
Item2
Item3
Item4
Item5
View
Click rate,.etc
merge
feedback
merge rate
© 2016 IBM Corporation31
InterpretableとDataScientist
自前の分析
Watsonの分析data
data
説明できない
説明可能
• 説明性は誰が担保するのか?
Interpretable
自社のデータ
Data Scientist
LOB
Report
© 2016 IBM Corporation32
今後Cognitive/AI時代の課題
• 従来、重要であった事
• 知っている事の確認
• 経験則から導き出されていたいわゆる業界知識や暗黙知の可視化
• 現在の状態の数値的な裏付け
• 人が理解出来る新しい知見
• 現在の主流
• ナゼが説明可能、ドノが説明可能
• 判別・検証が可能である
• 今後、どのように付き合うのか?
• 人が理解できない新しい知見
• ナゼドノが説明できない
• 判別・検証が出来ない(難しい)
© 2016 IBM Corporation33
まとめ
 Watsonは色々な事ができる
 自社のデータとソーシャルデータを組み合わせる事で新たな企業価値を作る
事が可能
 Cognitiveをうまく使う事で小さなコストと短い時間で価値抽出が可能となる
 説明性について注意が必要
 人が理解できない結果についてどのように信頼関係を結ぶかは今後の課題
© 2016 IBM Corporation35
ワークショップ、セッション、および資料は、IBMまたはセッション発表者によって準備され、それぞれ独自の見解を反映したものです。それらは情報提供の目的のみで提供されており、いかなる参加者
に対しても法律的またはその他の指導や助言を意図したものではなく、またそのような結果を生むものでもありません。本講演資料に含まれている情報については、完全性と正確性を期するよう努力し
ましたが、「現状のまま」提供され、明示または暗示にかかわらずいかなる保証も伴わないものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損
害が生じた場合も、IBMは責任を負わないものとします。 本講演資料に含まれている内容は、IBMまたはそのサプライヤーやライセンス交付者からいかなる保証または表明を引きだすことを意図した
ものでも、IBMソフトウェアの使用を規定する適用ライセンス契約の条項を変更することを意図したものでもなく、またそのような結果を生むものでもありません。
本講演資料でIBM製品、プログラム、またはサービスに言及していても、IBMが営業活動を行っているすべての国でそれらが使用可能であることを暗示するものではありません。本講演資料で言及して
いる製品リリース日付や製品機能は、市場機会またはその他の要因に基づいてIBM独自の決定権をもっていつでも変更できるものとし、いかなる方法においても将来の製品または機能が使用可能に
なると確約することを意図したものではありません。本講演資料に含まれている内容は、参加者が開始する活動によって特定の販売、売上高の向上、またはその他の結果が生じると述べる、または暗
示することを意図したものでも、またそのような結果を生むものでもありません。 パフォーマンスは、管理された環境において標準的なIBMベンチマークを使用した測定と予測に基づいています。ユー
ザーが経験する実際のスループットやパフォーマンスは、ユーザーのジョブ・ストリームにおけるマルチプログラミングの量、入出力構成、ストレージ構成、および処理されるワークロードなどの考慮事
項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと同様の結果を得られると確約するものではありません。
記述されているすべてのお客様事例は、それらのお客様がどのようにIBM製品を使用したか、またそれらのお客様が達成した結果の実例として示されたものです。実際の環境コストおよびパフォーマ
ンス特性は、お客様ごとに異なる場合があります。
IBM、IBM ロゴ、ibm.com、[以下当該情報に関連し商標リスト中に掲載されたIBMブランドやIBMの製品名称があれば追加する]は、 世界の多くの国で登録されたInternational Business Machines
Corporationの商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、
www.ibm.com/legal/copytrade.shtmlをご覧ください。
Adobe, Adobeロゴ, PostScript, PostScriptロゴは、Adobe Systems Incorporatedの米国およびその他の国における登録商標または商標です。
IT Infrastructure LibraryはAXELOS Limitedの登録商標です。
インテル, Intel, Intelロゴ, Intel Inside, Intel Insideロゴ, Centrino, Intel Centrinoロゴ, Celeron, Xeon, Intel SpeedStep, Itanium, およびPentium は Intel Corporationまたは子会社の米国およびそ
の他の国における商標または登録商標です。
Linuxは、Linus Torvaldsの米国およびその他の国における登録商標です。
PowerLinux is a trademark of International Business Machines Corp. The registered trademark Linux is used pursuant to a sublicense from LMI, the exclusive licensee of Linus Torvalds,
owner of the mark on a world-wide basis.
Microsoft, Windows, Windows NT および Windowsロゴは Microsoft Corporationの米国およびその他の国における商標です。
ITILはAXELOS Limitedの登録商標です。
UNIXはThe Open Groupの米国およびその他の国における登録商標です。
Cell Broadband Engineは、Sony Computer Entertainment, Inc.の米国およびその他の国における商標であり、同社の許諾を受けて使用しています。
JavaおよびすべてのJava関連の商標およびロゴは Oracleやその関連会社の米国およびその他の国における商標または登録商標です。
Linear Tape-Open, LTO, LTOロゴ, UltriumおよびUltriumロゴは、HP, IBM Corp.およびQuantumの米国およびその他の国における商標です。

More Related Content

What's hot

リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介Recruit Technologies
 
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例Makoto SHIMURA
 
データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方Tomoyuki Oota
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けRecruit Technologies
 
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4shakezo
 
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworksKimihiko Kitase
 
Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介Kimihiko Kitase
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポートKimihiko Kitase
 
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)NTT DATA Technology & Innovation
 
Hadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いHadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いRyuji Tamagawa
 
aslead Searchのご紹介
aslead Searchのご紹介aslead Searchのご紹介
aslead Searchのご紹介aslead
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料Recruit Technologies
 
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のことMachine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のことNaoto Tamiya
 
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニアYu Yamada
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史Leading Edge Co.,Ltd.
 
リクルートライフスタイルのデータを支える技術
リクルートライフスタイルのデータを支える技術リクルートライフスタイルのデータを支える技術
リクルートライフスタイルのデータを支える技術Yu Yamada
 

What's hot (20)

[Japan Tech summit 2017] MAI 005
[Japan Tech summit 2017] MAI 005[Japan Tech summit 2017] MAI 005
[Japan Tech summit 2017] MAI 005
 
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
 
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例
 
データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
プロトタイプで終わらせない死の谷を超える機械学習プロジェクトの進め方 #MLCT4
 
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
 
WebDB Forum 2013
WebDB Forum 2013 WebDB Forum 2013
WebDB Forum 2013
 
Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介Hortonworksが提供する データ活用方法の紹介
Hortonworksが提供する データ活用方法の紹介
 
Hadoop Summit 2016 San Jose レポート
Hadoop Summit 2016  San Jose レポートHadoop Summit 2016  San Jose レポート
Hadoop Summit 2016 San Jose レポート
 
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
 
Hadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食いHadoop / Elastic MapReduceつまみ食い
Hadoop / Elastic MapReduceつまみ食い
 
aslead Searchのご紹介
aslead Searchのご紹介aslead Searchのご紹介
aslead Searchのご紹介
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
 
分散システム処理モデルの課題および展望#yjdsw3
分散システム処理モデルの課題および展望#yjdsw3分散システム処理モデルの課題および展望#yjdsw3
分散システム処理モデルの課題および展望#yjdsw3
 
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のことMachine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
 
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア
 
大規模HDFS & ErasureCoding#yjdsw3
大規模HDFS & ErasureCoding#yjdsw3大規模HDFS & ErasureCoding#yjdsw3
大規模HDFS & ErasureCoding#yjdsw3
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
リクルートライフスタイルのデータを支える技術
リクルートライフスタイルのデータを支える技術リクルートライフスタイルのデータを支える技術
リクルートライフスタイルのデータを支える技術
 

Viewers also liked

Hadoop in the Cloud – The What, Why and How from the Experts
Hadoop in the Cloud – The What, Why and How from the ExpertsHadoop in the Cloud – The What, Why and How from the Experts
Hadoop in the Cloud – The What, Why and How from the ExpertsDataWorks Summit/Hadoop Summit
 
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...DataWorks Summit/Hadoop Summit
 
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...DataWorks Summit/Hadoop Summit
 
Path to 400M Members: LinkedIn’s Data Powered Journey
Path to 400M Members: LinkedIn’s Data Powered JourneyPath to 400M Members: LinkedIn’s Data Powered Journey
Path to 400M Members: LinkedIn’s Data Powered JourneyDataWorks Summit/Hadoop Summit
 
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
Investment in Yahoo! JAPAN's dataplatform and business growth by big dataInvestment in Yahoo! JAPAN's dataplatform and business growth by big data
Investment in Yahoo! JAPAN's dataplatform and business growth by big dataDataWorks Summit/Hadoop Summit
 
Evolving HDFS to a Generalized Distributed Storage Subsystem
Evolving HDFS to a Generalized Distributed Storage SubsystemEvolving HDFS to a Generalized Distributed Storage Subsystem
Evolving HDFS to a Generalized Distributed Storage SubsystemDataWorks Summit/Hadoop Summit
 
Major advancements in Apache Hive towards full support of SQL compliance
Major advancements in Apache Hive towards full support of SQL complianceMajor advancements in Apache Hive towards full support of SQL compliance
Major advancements in Apache Hive towards full support of SQL complianceDataWorks Summit/Hadoop Summit
 
Apache Phoenix and HBase: Past, Present and Future of SQL over HBase
Apache Phoenix and HBase: Past, Present and Future of SQL over HBaseApache Phoenix and HBase: Past, Present and Future of SQL over HBase
Apache Phoenix and HBase: Past, Present and Future of SQL over HBaseDataWorks Summit/Hadoop Summit
 
Network for the Large-scale Hadoop cluster at Yahoo! JAPAN
Network for the Large-scale Hadoop cluster at Yahoo! JAPANNetwork for the Large-scale Hadoop cluster at Yahoo! JAPAN
Network for the Large-scale Hadoop cluster at Yahoo! JAPANDataWorks Summit/Hadoop Summit
 
Using Hadoop to build a Data Quality Service for both real-time and batch data
Using Hadoop to build a Data Quality Service for both real-time and batch dataUsing Hadoop to build a Data Quality Service for both real-time and batch data
Using Hadoop to build a Data Quality Service for both real-time and batch dataDataWorks Summit/Hadoop Summit
 
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the EnterpriseEnabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the EnterpriseDataWorks Summit/Hadoop Summit
 
How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...
How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...
How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...DataWorks Summit/Hadoop Summit
 
From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...
From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...
From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...DataWorks Summit/Hadoop Summit
 

Viewers also liked (20)

Hadoop in the Cloud – The What, Why and How from the Experts
Hadoop in the Cloud – The What, Why and How from the ExpertsHadoop in the Cloud – The What, Why and How from the Experts
Hadoop in the Cloud – The What, Why and How from the Experts
 
LLAP: Sub-Second Analytical Queries in Hive
LLAP: Sub-Second Analytical Queries in HiveLLAP: Sub-Second Analytical Queries in Hive
LLAP: Sub-Second Analytical Queries in Hive
 
Protecting Enterprise Data In Apache Hadoop
Protecting Enterprise Data In Apache HadoopProtecting Enterprise Data In Apache Hadoop
Protecting Enterprise Data In Apache Hadoop
 
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
 
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
Real-World Machine Learning - Leverage the Features of MapR Converged Data Pl...
 
Path to 400M Members: LinkedIn’s Data Powered Journey
Path to 400M Members: LinkedIn’s Data Powered JourneyPath to 400M Members: LinkedIn’s Data Powered Journey
Path to 400M Members: LinkedIn’s Data Powered Journey
 
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
Investment in Yahoo! JAPAN's dataplatform and business growth by big dataInvestment in Yahoo! JAPAN's dataplatform and business growth by big data
Investment in Yahoo! JAPAN's dataplatform and business growth by big data
 
Evolving HDFS to a Generalized Distributed Storage Subsystem
Evolving HDFS to a Generalized Distributed Storage SubsystemEvolving HDFS to a Generalized Distributed Storage Subsystem
Evolving HDFS to a Generalized Distributed Storage Subsystem
 
Apache NiFi 1.0 in Nutshell
Apache NiFi 1.0 in NutshellApache NiFi 1.0 in Nutshell
Apache NiFi 1.0 in Nutshell
 
Streamline Hadoop DevOps with Apache Ambari
Streamline Hadoop DevOps with Apache AmbariStreamline Hadoop DevOps with Apache Ambari
Streamline Hadoop DevOps with Apache Ambari
 
Major advancements in Apache Hive towards full support of SQL compliance
Major advancements in Apache Hive towards full support of SQL complianceMajor advancements in Apache Hive towards full support of SQL compliance
Major advancements in Apache Hive towards full support of SQL compliance
 
To The Cloud and Back: A Look At Hybrid Analytics
To The Cloud and Back: A Look At Hybrid AnalyticsTo The Cloud and Back: A Look At Hybrid Analytics
To The Cloud and Back: A Look At Hybrid Analytics
 
Apache Phoenix and HBase: Past, Present and Future of SQL over HBase
Apache Phoenix and HBase: Past, Present and Future of SQL over HBaseApache Phoenix and HBase: Past, Present and Future of SQL over HBase
Apache Phoenix and HBase: Past, Present and Future of SQL over HBase
 
Network for the Large-scale Hadoop cluster at Yahoo! JAPAN
Network for the Large-scale Hadoop cluster at Yahoo! JAPANNetwork for the Large-scale Hadoop cluster at Yahoo! JAPAN
Network for the Large-scale Hadoop cluster at Yahoo! JAPAN
 
Using Hadoop to build a Data Quality Service for both real-time and batch data
Using Hadoop to build a Data Quality Service for both real-time and batch dataUsing Hadoop to build a Data Quality Service for both real-time and batch data
Using Hadoop to build a Data Quality Service for both real-time and batch data
 
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the EnterpriseEnabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
 
Rebuilding Web Tracking Infrastructure for Scale
Rebuilding Web Tracking Infrastructure for ScaleRebuilding Web Tracking Infrastructure for Scale
Rebuilding Web Tracking Infrastructure for Scale
 
Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and HadoopCase Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
 
How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...
How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...
How to overcome mysterious problems caused by large and multi-tenancy Hadoop ...
 
From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...
From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...
From a single droplet to a full bottle, our journey to Hadoop at Coca-Cola Ea...
 

Similar to Combined analysis of Watson and Spark

CISOが、適切にセキュリティ機能とレベルを決めるには
CISOが、適切にセキュリティ機能とレベルを決めるにはCISOが、適切にセキュリティ機能とレベルを決めるには
CISOが、適切にセキュリティ機能とレベルを決めるにはRiotaro OKADA
 
Watson Explorerを使ったテキストマイニング
Watson Explorerを使ったテキストマイニングWatson Explorerを使ったテキストマイニング
Watson Explorerを使ったテキストマイニングHori Tasuku
 
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門陽一 滝川
 
ソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised FinalソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised FinalRoy Sugimura, Ph.D
 
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイントApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイントTanaka Yuichi
 
BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...
BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...
BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...Gohsuke Takama
 
WordPress の現況
WordPress の現況WordPress の現況
WordPress の現況Naoko Takano
 
JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"
JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"
JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"MPN Japan
 
座談会資料(趣旨説明資料) 20161117
座談会資料(趣旨説明資料) 20161117座談会資料(趣旨説明資料) 20161117
座談会資料(趣旨説明資料) 20161117知礼 八子
 
副業推奨とオープンソース @ 俺聞け4
副業推奨とオープンソース @ 俺聞け4副業推奨とオープンソース @ 俺聞け4
副業推奨とオープンソース @ 俺聞け4Oishi Yuichi
 
日本CFA協会アドボカシーウェビナー 資産運用業界における人工知能
日本CFA協会アドボカシーウェビナー  資産運用業界における人工知能日本CFA協会アドボカシーウェビナー  資産運用業界における人工知能
日本CFA協会アドボカシーウェビナー 資産運用業界における人工知能Takanobu Mizuta
 
参謀本部事業計画書
参謀本部事業計画書参謀本部事業計画書
参謀本部事業計画書貴義 齊藤
 
Career - design, adaption and diversity - for EMC I&D event
Career - design, adaption and diversity - for EMC I&D eventCareer - design, adaption and diversity - for EMC I&D event
Career - design, adaption and diversity - for EMC I&D eventMiya Kohno
 
世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜
世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜
世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜Taisuke Fukuno
 
これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史
これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史
これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史schoowebcampus
 
20191013_Wolf and Seven Little Goats -Serverless Fairy Tales-
20191013_Wolf and Seven Little Goats  -Serverless Fairy Tales-20191013_Wolf and Seven Little Goats  -Serverless Fairy Tales-
20191013_Wolf and Seven Little Goats -Serverless Fairy Tales-Typhon 666
 
jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207Toshiyuki Konparu
 
第9回八子クラウド座談会資料 20121208
第9回八子クラウド座談会資料 20121208第9回八子クラウド座談会資料 20121208
第9回八子クラウド座談会資料 20121208知礼 八子
 
使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング
使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング
使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィングYoshiki Hayama
 

Similar to Combined analysis of Watson and Spark (20)

CISOが、適切にセキュリティ機能とレベルを決めるには
CISOが、適切にセキュリティ機能とレベルを決めるにはCISOが、適切にセキュリティ機能とレベルを決めるには
CISOが、適切にセキュリティ機能とレベルを決めるには
 
Watson Explorerを使ったテキストマイニング
Watson Explorerを使ったテキストマイニングWatson Explorerを使ったテキストマイニング
Watson Explorerを使ったテキストマイニング
 
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
 
ソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised FinalソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised Final
 
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイントApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
 
BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...
BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...
BCL WhiteSalon "Convergence of Bio X Silicon X Robotics may bring us to the C...
 
WordPress の現況
WordPress の現況WordPress の現況
WordPress の現況
 
JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"
JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"
JPC2016: WMS-02: デジタル トランスフォーメーションを牽引する "Azure + OSS"
 
座談会資料(趣旨説明資料) 20161117
座談会資料(趣旨説明資料) 20161117座談会資料(趣旨説明資料) 20161117
座談会資料(趣旨説明資料) 20161117
 
副業推奨とオープンソース @ 俺聞け4
副業推奨とオープンソース @ 俺聞け4副業推奨とオープンソース @ 俺聞け4
副業推奨とオープンソース @ 俺聞け4
 
japan teacher
japan teacherjapan teacher
japan teacher
 
日本CFA協会アドボカシーウェビナー 資産運用業界における人工知能
日本CFA協会アドボカシーウェビナー  資産運用業界における人工知能日本CFA協会アドボカシーウェビナー  資産運用業界における人工知能
日本CFA協会アドボカシーウェビナー 資産運用業界における人工知能
 
参謀本部事業計画書
参謀本部事業計画書参謀本部事業計画書
参謀本部事業計画書
 
Career - design, adaption and diversity - for EMC I&D event
Career - design, adaption and diversity - for EMC I&D eventCareer - design, adaption and diversity - for EMC I&D event
Career - design, adaption and diversity - for EMC I&D event
 
世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜
世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜
世界最安値!? 鯖江産コンピューターIchigoJam 〜福井技術者の集い その2〜
 
これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史
これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史
これからの産業をつくるために、ものづくりの今を学ぶ 先生:高野 元・野村 岳史
 
20191013_Wolf and Seven Little Goats -Serverless Fairy Tales-
20191013_Wolf and Seven Little Goats  -Serverless Fairy Tales-20191013_Wolf and Seven Little Goats  -Serverless Fairy Tales-
20191013_Wolf and Seven Little Goats -Serverless Fairy Tales-
 
jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207
 
第9回八子クラウド座談会資料 20121208
第9回八子クラウド座談会資料 20121208第9回八子クラウド座談会資料 20121208
第9回八子クラウド座談会資料 20121208
 
使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング
使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング
使いやすいAI(人工知能)「IBM Watson」を見てみよう! - 書籍「現場で使える! Watson開発入門」連動セミナー:リクルートスタッフィング
 

More from DataWorks Summit/Hadoop Summit

Unleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache RangerUnleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache RangerDataWorks Summit/Hadoop Summit
 
Enabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science PlatformEnabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science PlatformDataWorks Summit/Hadoop Summit
 
Double Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSenseDouble Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSenseDataWorks Summit/Hadoop Summit
 
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...DataWorks Summit/Hadoop Summit
 
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...DataWorks Summit/Hadoop Summit
 
Mool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and MLMool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and MLDataWorks Summit/Hadoop Summit
 
The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)DataWorks Summit/Hadoop Summit
 
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...DataWorks Summit/Hadoop Summit
 

More from DataWorks Summit/Hadoop Summit (20)

Running Apache Spark & Apache Zeppelin in Production
Running Apache Spark & Apache Zeppelin in ProductionRunning Apache Spark & Apache Zeppelin in Production
Running Apache Spark & Apache Zeppelin in Production
 
State of Security: Apache Spark & Apache Zeppelin
State of Security: Apache Spark & Apache ZeppelinState of Security: Apache Spark & Apache Zeppelin
State of Security: Apache Spark & Apache Zeppelin
 
Unleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache RangerUnleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache Ranger
 
Enabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science PlatformEnabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science Platform
 
Revolutionize Text Mining with Spark and Zeppelin
Revolutionize Text Mining with Spark and ZeppelinRevolutionize Text Mining with Spark and Zeppelin
Revolutionize Text Mining with Spark and Zeppelin
 
Double Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSenseDouble Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSense
 
Hadoop Crash Course
Hadoop Crash CourseHadoop Crash Course
Hadoop Crash Course
 
Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
 
Apache Spark Crash Course
Apache Spark Crash CourseApache Spark Crash Course
Apache Spark Crash Course
 
Dataflow with Apache NiFi
Dataflow with Apache NiFiDataflow with Apache NiFi
Dataflow with Apache NiFi
 
Schema Registry - Set you Data Free
Schema Registry - Set you Data FreeSchema Registry - Set you Data Free
Schema Registry - Set you Data Free
 
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
 
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
 
Mool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and MLMool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and ML
 
How Hadoop Makes the Natixis Pack More Efficient
How Hadoop Makes the Natixis Pack More Efficient How Hadoop Makes the Natixis Pack More Efficient
How Hadoop Makes the Natixis Pack More Efficient
 
HBase in Practice
HBase in Practice HBase in Practice
HBase in Practice
 
The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)
 
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
Breaking the 1 Million OPS/SEC Barrier in HOPS HadoopBreaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
 
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
 
Backup and Disaster Recovery in Hadoop
Backup and Disaster Recovery in Hadoop Backup and Disaster Recovery in Hadoop
Backup and Disaster Recovery in Hadoop
 

Recently uploaded

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Recently uploaded (14)

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

Combined analysis of Watson and Spark

  • 1. © 2016 IBM Corporation WatsonとSparkを組み合わせた分析 ~Watsonを使ったレコメンドと可能性と問題~ Tanaka Y.P 2016-10-27
  • 2. © 2016 IBM Corporation2 自己紹介 田中裕一(yuichi tanaka) 主にアーキテクチャとサーバーサイドプログラムを担当 することが多い。Hadoop/Spark周りをよく触ります。 Node.js、Python、最近はSpark周りの仕事でScalaを書く ことが多い気がします。 休日はOSS周りで遊んだり。 詳解 Apache Spark
  • 3. © 2016 IBM Corporation3 背景 昨今データ活用の重要性が説かれて久しく、 Hadoop/Sparkといった技術要素が非常に注目されてい ます。また、AIのワードと共にWatsonなどのCognitive システムにも注目が集まるようになってきました。  参考:総務省 H.24 情報通信白書  http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
  • 4. © 2016 IBM Corporation4 AIとCognitive
  • 5. © 2016 IBM Corporation5 Watsonの話  AI(人工知能)の文脈で紹介されることもあるが実はIBM自身はAIとは 読んでいない Descriptive Analytics Predictive Analytics Cognitive Analytics 現状把握 予測分析 認知 何が起こったのか 将来何が起こるのか 次に取るべき 最適なアクションを判別 共有・指示を行う。
  • 6. © 2016 IBM Corporation6 Watsonは一体何ができるのか?  現在WatsonはBluemix上で幾つかの機能をRestI/Fで提供しています。 Natural Language Classifier Retrieve and Rank Document Conversino Speech To Text Text to Speech Tone Analyzer Personality Insights Visual Recognition 参考: Watson API Demo Watsonの一例
  • 7. © 2016 IBM Corporation7 今日お話しすること  今日は題材としてWatsonがどんなところで利用可能なのか?を考えるため、Watsonの活 用方法の一つとして、WatsonとSparkを組み合わせて新しい形の映画レコメンドを作って みます。 • 今日のテーマを通して考えること • Watsonを巧く利用することによるデータ活用のさらなる可能性 • 面白いから実用へ • Watsonと機会学習の企業における棲みわけ • これからAI時代を迎えるにあたっての課題
  • 8. © 2016 IBM Corporation8 WatsonとSparkで作る映画レコメンド  今日の手順 1. データの収集と格納(Master Data) 2. Watsonを使ったPersonality分析と結果の格納 3. Sparkを使った前処理とモデルの生成 4. サンプルデータの収集とモデルの適用
  • 9. © 2016 IBM Corporation9 今日のサンプルの俯瞰 Personality to Item Webからのデータ収集 Watsonを使った分析 Sparkを使った前処理 レコメンド
  • 10. © 2016 IBM Corporation10 Masterデータの収集 user_id name age... 1 Yuichi Tanaka 30 2 Sho Kaijima 35 movie_id title desc 1 君の名は。 前作『言の 葉の庭』か ら... 2 シン・ゴジラ 『シン・ゴジ ラ』は、... user_id movie_id value comment 1 1 4.0 個人的にはめっちゃ好きでした... 1 2 3.5 とにかくリアルなのが良い。無駄な 会議含め... *ユーザー情報のマスタ 映画情報のマスタ ユーザによる映画評価
  • 11. © 2016 IBM Corporation11 収集データのWatsonによる分析 user_id movie_id value comment 1 1 4.0 個人的にはめっちゃ好きでした... 1 2 3.5 とにかくリアルなのが良い。無駄な会議含め... ユーザによる映画評価 Personality Insights WatsonのAPIの中、Personality InsightsのAPIとユーザーによる映画評価の情報を利用し ユーザー毎のパーソナリティを作成します。
  • 12. © 2016 IBM Corporation12 Personality Insight ~書き込みから、心理属性を分析する~ Personality (個性) Needs (欲求) Values (価値観) 言語表現の特徴を、心理学的観点から整理・体系化 • 言語的特徴: 助詞・代名詞・数詞・否定表現・他 • 心理作用、精神的・知覚的プロセス: 喜怒哀楽表現・原因表現・他 • 相対的概念: 時間表現・空間表現・行動表現・他 • 関心の対象: 仕事関連・学校関連・娯楽関連・宗教関連・他 テキスト watson エラー率
  • 13. © 2016 IBM Corporation13 Personality(個性)の推定 Big 5/OCEAN と呼ばれる軸でPersonalityを推定 • Openness to experience: 好奇心が強い・独創的 vs. 着実・警戒心が強い • Conscientiousness: 勤勉・まめな人 vs. 楽天的・不注意 • Extraversion: 外向的・エネルギッシュ vs. 孤独を好む・控えめ • Agreeableness: 人当たりの良い・温情のある vs. 冷たい・不親切 • Neuroticism: 繊細・神経質 vs. 情緒安定な・自信家の さらに細かい推定も可能 • Openness to experience: 活発度、自己主張、明朗性、刺激希求性、友情、社交性 • Conscientiousness: 大胆性、芸術的関心度、情動性、想像力、思考力、現状打破 • Extraversion: 達成努力、注意深さ、忠実さ、秩序性、自制力、自己効力感 • Agreeableness: 利他主義、協調性、謙虚さ、強硬さ、共感度、信用度 • Neuroticism: 悲観的、自意識過剰、低ストレス耐性、激情的、心配性、利己的 13
  • 14. © 2016 IBM Corporation14 Needs(欲求)の推定 Kevin FordのUniversal Needs Map に沿った分析 (欲求と社会的価値の関係) 個人の様々な習慣に関係 : ブランドの選択、商品の選択、職業の選択 • Challenge:挑戦 • Closeness:親密さ • Curiosity:好奇心 • Excitement:興奮 • Harmony:調和 • Ideal:理想 • Liberty:自由 • Love:愛 • Practicality:現実性 • Self-(expression):自己表現 • Stability:安定 • Structure:組織 14 Spending Thrifty Materialism Security Altruism Risk Modesty Conformism Industry
  • 15. © 2016 IBM Corporation15 Value(価値観)の推定 15 Schwartzの価値概説 (Schwartz Value Survey) に沿った分析 4つの上位価値と10個の価値によって構成される 4つの上位価値 •Self-transcendence : 自己超越 •Conservation : 保守(性) •Self-enhancement :自己高揚 •Open to change : 変化に対する需要(許容)性 10の価値 •博識、善行、調和、伝統、秩序、権勢、 達成、快楽、刺激、自決 http://macs.mainichi.co.jp/space/web/034/marke.html より転載15
  • 16. © 2016 IBM Corporation16 収集データのWatsonによる分析 user_id movie_id value comment 1 1 4.0 個人的にはめっちゃ好きでした... 1 2 3.5 とにかくリアルなのが良い。無駄な会議含め... user_id name age... personality 1 Yuichi Tanaka 30 { "id": "personality", "name": "ビッグファイブ", "children": [ {"id": "Neuroticism_parent", "name": "情緒不安定性", "category": "personality", "percentage": 0.8434073484367335, "children": [ 2 Sho Kaijima 35 {"id": "Emotionality", "name": "情動性", "category": "personality", "percentage": 0.3201653809217191, "sampling_error": 0.02634522} コメントからpersonalityを作成 *ユーザー情報のマスタ ユーザによる映画評価
  • 17. © 2016 IBM Corporation17 Sparkによる前処理とモデル作成 M1 M2 M3 M4 U1 3.0 3.2 0 4.2 U2 2.1 2.0 3.0 1.8 U3 4.0 0 0 4.0 U4 0 0 3.0 3.3 M1 M2 M3 M4 U1 5.255 5.382 3.342 6.020 U2 4.728 4.511 6.683 4.076 U3 6.0 4.0 4.0 6.0 U4 4.002 4.002 5.902 6.092 映画の評価 前処理しておく 映画の評価(正規化) user_id movie_id value comment 1 1 4.0 個人的にはめっちゃ好きでした... 1 2 3.5 とにかくリアルなのが良い。無駄な会議含め... ユーザによる映画評価 ユーザー毎の映画の評価に変換 バラツキが出るので
  • 18. © 2016 IBM Corporation18 Sparkによる前処理とモデル作成 user_id name age... personality 1 Yuichi Tanaka 30 { "id": "personality", "name": "ビッグファイブ", "children": [ {"id": "Neuroticism_parent", "name": "情緒不安定性", "category": "personality", "percentage": 0.8434073484367335, "children": [ 2 Sho Kaijima 35 {"id": "Emotionality", "name": "情動性", "category": "personality", "percentage": 0.3201653809217191, "sampling_error": 0.02634522} *ユーザー情報のマスタ P1 P2 P3 P4 U1 0.6276 0.5269 0.5798 0.5782 U2 0.4849 0.4450 0.4132 0.4415 U3 0.4338 0.7435 0.7012 0.2925 U4 0.6247 0.7086 0.5751 0.4055 パーソナリティ ユーザー毎のパーソナリティに変換 エラー率も勘案して計算しておく P1E P2E P3E P4E U1 0.0263 0.0341 0.0152 0.4783 U2 0.1238 0.0114 0.0984 0.5783 U3 0.0512 0.0299 0.0378 0.0673 U4 0.0837 0.3512 0.0384 0.1039 エラー率 エラー率で重み付け
  • 19. © 2016 IBM Corporation19 Sparkによる前処理とモデル作成 P1 P2 P3 P4 U1 0.6276 0.5269 0.5798 0.5782 U2 0.4849 0.4450 0.4132 0.4415 U3 0.4338 0.7435 0.7012 0.2925 U4 0.6247 0.7086 0.5751 0.4055 M1 M2 M3 M4 P1 10.693 9.9009 10.761 12.163 P2 12.170 10.653 11.891 13.764 P3 11.503 10.091 10.899 12.886 P4 8.5093 7.8967 8.4469 9.5043 パーソナリティ 変換後(Personality/Movie) M1 M2 M3 M4 U1 5.255 5.382 3.342 6.020 U2 4.728 4.511 6.683 4.076 U3 6.0 4.0 4.0 6.0 U4 4.002 4.002 5.902 6.092 映画の評価(正規化) 内積
  • 20. © 2016 IBM Corporation20 対象データのWatsonによる分析 これまでのデータを学習データとし、映画のレコメンドを行う対象データ を作ります。 引用: ホワイトハウス https://www.whitehouse.gov/briefing-room/speeches-and-remarks 外務省 http://www.mofa.go.jp/mofaj/press/enzetsu/e_souri.html We get an incomplete. But the good news is we can still pass the course if we make some good decisions now. .... 難民問題は国際社会が直面する最も 大きな課題の一つであり、このサミット を開催したオバマ大統領のイニシア ティブに心から敬意を表します。... {"id": "Adventurousness", "name": "大胆性", "category": "personality", "percentage": 0.5589476354662417, "sampling_error": 0.03311216}, {"id": "Emotionality", "name": "情動性", "category": "personality", "percentage": 0.3201653809217191, "sampling_error": 0.02634522}, 安倍首相 オバマ大統領
  • 21. © 2016 IBM Corporation21 対象データのWatsonによる分析 {"id": "Adventurousness", "name": "大胆性", "category": "personality", "percentage": 0.5589476354662417, "sampling_error": 0.03311216}, {"id": "Emotionality", "name": "情動性", "category": "personality", "percentage": 0.3201653809217191, "sampling_error": 0.02634522}, 安倍首相 オバマ大統領 M1 M2 M3 M4 P1 10.693 9.9009 10.761 12.163 P2 12.170 10.653 11.891 13.764 P3 11.503 10.091 10.899 12.886 P4 8.5093 7.8967 8.4469 9.5043 変換後(Personality/Movie) レコメンドの作成 レコメンドの作成
  • 22. © 2016 IBM Corporation22 Cognitive/AIの可能性と問題  ここまで簡易的にWatsonを使ったレコメンドを見てきました。ここから はこのレコメンドの可能性と問題について見ていきます。
  • 23. © 2016 IBM Corporation23 Cognitiveの可能性①  レコメンドの種類/課題 Item to Item User to Item Personality to Item ルールベース アイテム同士の相関関係によるレコメンド * パーソナライズがかからない 行動ログ・購買ログを元にしたレコメンド * 行動や購買実績のないユーザー ランキングやおすすめ商品のレコメンド * ディフォルトセットなどで利用 パーソナリティを元にしたレコメンド • 行動のないユーザーにもある程度 パーソナライズしたレコメンドが可能
  • 24. © 2016 IBM Corporation24 Cognitiveの可能性② 日本語 We get an incomplete. But the good news is we can still pass the course if we make some good decisions now. .... 難民問題は国際社会が直面する最も 大きな課題の一つであり、このサミット を開催したオバマ大統領のイニシア ティブに心から敬意を表します。... 英語 Personality レコメンデーション 自社のデータ Watson 経営分析
  • 25. © 2016 IBM Corporation25 可能性のまとめ • 今後、差別化・競争化していく中で、自社のデータとソーシャルデータの組み合わせ はますます重要性を増す。 自社のデータ ソーシャル・オープンデータ Watson 新たな価値
  • 26. © 2016 IBM Corporation26  今回のサンプルから、Watsonと機会学習の棲みわけについてまとめてみます。 Watsonと機会学習の棲みわけ ソーシャル・オープンデータ • 心理学などの専門的な知識、日本語の扱いなどの専門的な知識 • 学習データの収集 • コーパスの作成 • 結果検証 分析
  • 27. © 2016 IBM Corporation27  今回のサンプルから、Watsonと機会学習の棲みわけについてまとめてみます。 Watsonと機会学習の棲みわけ ソーシャル・オープンデータ 自社のデータ 分析 Data Scientist
  • 28. © 2016 IBM Corporation28  Watsonを筆頭にCognitiveまたはAIと呼ばれているシステムでは説明性について欠如するケース がほとんどです。  今回の例では テキストデータ ー> パーソナリティを利用しました。Watsonはテキストデータ を元にテキストを記述したユーザーがどう言ったパーソナリティを持っているかを出力しますが、 なぜそう判断したのか?の部分は説明ができません 何が問題になるのか 自前の分析 Watsonの分析data data 説明できない 説明可能
  • 29. © 2016 IBM Corporation29 Performanceによる計測 自前の分析 Watsonの分析data data 説明できない 説明可能 Minimum Viable Product • MVP(検証可能な最小製品)としてBMLループに組み込む事でPerformanceは計測可能である • CVR,CTR,回遊率等 Feedback Performance
  • 30. © 2016 IBM Corporation30 Performanceによる計測 レコメンドをサイクルさせる為の一つの例 Personality to Item Other Recommendation Item1 Item2 Item3 Item4 Item5 View Click rate,.etc merge feedback merge rate
  • 31. © 2016 IBM Corporation31 InterpretableとDataScientist 自前の分析 Watsonの分析data data 説明できない 説明可能 • 説明性は誰が担保するのか? Interpretable 自社のデータ Data Scientist LOB Report
  • 32. © 2016 IBM Corporation32 今後Cognitive/AI時代の課題 • 従来、重要であった事 • 知っている事の確認 • 経験則から導き出されていたいわゆる業界知識や暗黙知の可視化 • 現在の状態の数値的な裏付け • 人が理解出来る新しい知見 • 現在の主流 • ナゼが説明可能、ドノが説明可能 • 判別・検証が可能である • 今後、どのように付き合うのか? • 人が理解できない新しい知見 • ナゼドノが説明できない • 判別・検証が出来ない(難しい)
  • 33. © 2016 IBM Corporation33 まとめ  Watsonは色々な事ができる  自社のデータとソーシャルデータを組み合わせる事で新たな企業価値を作る 事が可能  Cognitiveをうまく使う事で小さなコストと短い時間で価値抽出が可能となる  説明性について注意が必要  人が理解できない結果についてどのように信頼関係を結ぶかは今後の課題
  • 34.
  • 35. © 2016 IBM Corporation35 ワークショップ、セッション、および資料は、IBMまたはセッション発表者によって準備され、それぞれ独自の見解を反映したものです。それらは情報提供の目的のみで提供されており、いかなる参加者 に対しても法律的またはその他の指導や助言を意図したものではなく、またそのような結果を生むものでもありません。本講演資料に含まれている情報については、完全性と正確性を期するよう努力し ましたが、「現状のまま」提供され、明示または暗示にかかわらずいかなる保証も伴わないものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損 害が生じた場合も、IBMは責任を負わないものとします。 本講演資料に含まれている内容は、IBMまたはそのサプライヤーやライセンス交付者からいかなる保証または表明を引きだすことを意図した ものでも、IBMソフトウェアの使用を規定する適用ライセンス契約の条項を変更することを意図したものでもなく、またそのような結果を生むものでもありません。 本講演資料でIBM製品、プログラム、またはサービスに言及していても、IBMが営業活動を行っているすべての国でそれらが使用可能であることを暗示するものではありません。本講演資料で言及して いる製品リリース日付や製品機能は、市場機会またはその他の要因に基づいてIBM独自の決定権をもっていつでも変更できるものとし、いかなる方法においても将来の製品または機能が使用可能に なると確約することを意図したものではありません。本講演資料に含まれている内容は、参加者が開始する活動によって特定の販売、売上高の向上、またはその他の結果が生じると述べる、または暗 示することを意図したものでも、またそのような結果を生むものでもありません。 パフォーマンスは、管理された環境において標準的なIBMベンチマークを使用した測定と予測に基づいています。ユー ザーが経験する実際のスループットやパフォーマンスは、ユーザーのジョブ・ストリームにおけるマルチプログラミングの量、入出力構成、ストレージ構成、および処理されるワークロードなどの考慮事 項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと同様の結果を得られると確約するものではありません。 記述されているすべてのお客様事例は、それらのお客様がどのようにIBM製品を使用したか、またそれらのお客様が達成した結果の実例として示されたものです。実際の環境コストおよびパフォーマ ンス特性は、お客様ごとに異なる場合があります。 IBM、IBM ロゴ、ibm.com、[以下当該情報に関連し商標リスト中に掲載されたIBMブランドやIBMの製品名称があれば追加する]は、 世界の多くの国で登録されたInternational Business Machines Corporationの商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、 www.ibm.com/legal/copytrade.shtmlをご覧ください。 Adobe, Adobeロゴ, PostScript, PostScriptロゴは、Adobe Systems Incorporatedの米国およびその他の国における登録商標または商標です。 IT Infrastructure LibraryはAXELOS Limitedの登録商標です。 インテル, Intel, Intelロゴ, Intel Inside, Intel Insideロゴ, Centrino, Intel Centrinoロゴ, Celeron, Xeon, Intel SpeedStep, Itanium, およびPentium は Intel Corporationまたは子会社の米国およびそ の他の国における商標または登録商標です。 Linuxは、Linus Torvaldsの米国およびその他の国における登録商標です。 PowerLinux is a trademark of International Business Machines Corp. The registered trademark Linux is used pursuant to a sublicense from LMI, the exclusive licensee of Linus Torvalds, owner of the mark on a world-wide basis. Microsoft, Windows, Windows NT および Windowsロゴは Microsoft Corporationの米国およびその他の国における商標です。 ITILはAXELOS Limitedの登録商標です。 UNIXはThe Open Groupの米国およびその他の国における登録商標です。 Cell Broadband Engineは、Sony Computer Entertainment, Inc.の米国およびその他の国における商標であり、同社の許諾を受けて使用しています。 JavaおよびすべてのJava関連の商標およびロゴは Oracleやその関連会社の米国およびその他の国における商標または登録商標です。 Linear Tape-Open, LTO, LTOロゴ, UltriumおよびUltriumロゴは、HP, IBM Corp.およびQuantumの米国およびその他の国における商標です。

Editor's Notes

  1. 1
  2. 会社ではSparkとHadoopのスペシャリストやってます。
  3. 普段1ミリも製品の話しをしませんが、今日は珍しくIBMの製品と絡めた話しをします。
  4. まずWatsonの前提知識を2ページで
  5. 渡辺謙とwatsonが話しても企業は1円も売り上げが上がりません。
  6. 事業者ではないので特にベースとなるデータを持っていません。そこで、Web上に散在する映画にまつわる情報を収集しMasterデータとしております。通常皆様におかれましては自社のDBなどに保持されているデータになります。
  7. 今日は映画をサンプルに作ってみましたが、例えば口コミ系、マッチングアプリ系でも利用できそうですね。
  8. 今回のレコメンドは何が良いのでしょうか? ログではなくユーザーの表現からのレコメンド
  9. ・今回、日本語の評価ー>Personalityー>レコメンドと間にPersonalityを挟むことで、他言語のユーザーを扱える ・パーソナリティと映画評価の関連を取る事で、どう言った内容(アクション・ホラー(ゾンビ))がその地域(国)で受けるのか? を過去のデータを元に分析が可能です。何を誰に押すのか?といった部分(経験的に推測可能な部分の数値的な裏付け)
  10. Cognitiveと機会学習(データサイエンティスト)の棲みわけです。 Personality Insightsを自社で用意するコストを考えてみます。
  11. 説明できないというのは、機会学習触られている皆さんはピンとくると思いますが、 どのパラメータがどのように働いたかがわかりません。 この問題にどのように付き合っていくべきでしょうか? 観点として今日は2つ着目します。 なぜ機会学習が必要なのか? ー> データから知見を得、我々が理解する事 ー> データを元により高い精度を得る
  12. 結果が出ればOKであるという事業目線
  13. 説明性が重要なケース  例えばキャンペーンの対象ユーザーの抽出について考えて見ると ・なぜこのユーザーグループキャンペーンを当てるの? ・Watsonがそう言ったから・・・・・ ここで何を説明性とするのか? ・他のクラスタを反映していないか? ・これは難しい問題