SlideShare a Scribd company logo
本当に知ってる!?
リアルなデータ分析の世界
~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
祖山 寿雄
株式会社サイカ
2017/03/16
ヒカラボ
ヒカラボ
2017/03/16
2
自己紹介
●
祖山 寿雄
– @who_you_me
●
株式会社サイカ
– Statistics Division
●
Data Analysis Engineer
●
社会学修士→ネットワークエンジニア→Webエン
ジニア→DBエンジニア→データ分析エンジニア
今日の目的
Before
●
データサイエンティスト/AI/ディープラーニング
流行ってるけどなんだかよく分からない
●
自分もやってみたいけど、どこから何に手を付け
After
●
AI/ディープラーニング/機械学習/統計学 これ
らがどんなものか分かる
●
これらの分野の将来像が分かる
ヒカラボ
2017/03/16
6
今日話さないこと
●
個別の手法の解説
– 自分で手を動かして学ばないと身につかないです
– 自ら学ぶためのアドバイスはします
●
明日すぐに役立つこと
– 明日役に立つことは明後日には役に立たなくなって
るかもしれません
1.
AI/ディープラーニング/
機械学習/統計学
一体何が違うのか
ヒカラボ
2017/03/16
8
一般的なイメージ (1/2)
●
AI
– なんかすごいもの
– 人の仕事を奪うもの
– いつかはこいつが人類を支配する日が来るらしい
●
ディープラーニング
– なんかすごいもの
– 囲碁で人間に勝った
ヒカラボ
2017/03/16
9
一般的なイメージ (2/2)
●
機械学習
– よくわからない
●
統計学
– 昔授業でやったけどぜんぜんわからなかったやつ
ヒカラボ
2017/03/16
10
実際はこうじゃ
ヒカラボ
2017/03/16
11
AI (1/2)
●
人工的にコンピュータ上などで人間と同様の知
能を実現させようという試み、或いはそのため
の一連の基礎技術を指す(Wikipedia)
●
バズワードとして使われている「AI」は「機械
学習」とほぼ同義であり、その中の大半は
「ディープラーニング」
– 囲碁、将棋
– 自動運転 etc...
ヒカラボ
2017/03/16
12
AI (2/2)
●
「何でもできるすごいやつ」みたいに思われて
いる実際はそんなことない
●
現に大手ベンダーとかが「AI」と称して売って
いるのは単なる機械学習パッケージ
– H社の事例
●
http://social-innovation.hitachi/jp/solutions/ai/
●
https://wirelesswire.jp/2016/11/57683/
ヒカラボ
2017/03/16
13
ディープラーニング
●
「機械学習」の一手法
●
パーセプトロン→ニューラルネットワーク→
ディープラーニング と進化してきた
– 半ば見捨てられていた手法がムーアの法則により蘇
り世界を席巻するという胸熱展開ではある
ヒカラボ
2017/03/16
14
再掲
残ったのは「機械学習」「統計学」
じゃあこれらはいったい?
の前に、説明してない
大事な言葉がもうひとつ
データサイエンス/
データサイエンティスト
ヒカラボ
2017/03/16
18
定義 (1/5)
●
「データサイエンティスト協会」なるものがあ
るのでここを見れば分かるに違いない
– http://www.datascientist.or.jp/
●
“実際には新しい職業である「データサイエン
ティスト」には明確な定義がなく、対応領域も
広いことから、さまざまな課題も生まれていま
す”
– 定義ないんかーい
ヒカラボ
2017/03/16
19
定義はどこだ (2/5)
●
がんばってPDF漁ったらあった
– http://www.datascientist.or.jp/news/2014/pdf/1
210.pdf
●
「データサイエンティストとは、データサイエ
ンス力、データエンジニアリング力をベースに
データから価値を創出し、ビジネス課題に答え
を出すプロフェッショナル」
ヒカラボ
2017/03/16
20
定義はどこだ (3/5)
●
「データサイエンス」「データエンジニアリン
グ」 is 何
●
データサイエンス(力)
– 「情報処理、人工知能、統計学などの情報科学系の
知恵を理解し、使う力」
●
データエンジニアリング(力)
– 「データサイエンスを意味のある形に使えるように
し、実装、運用できるようにする力」
ヒカラボ
2017/03/16
21
定義を求めて三千里 (4/5)
●
よくわからんので、今春開設される滋賀大学
データサイエンス学部のサイトも見てみる
– https://www.ds.shiga-u.ac.jp/
●
“データサイエンスとは社会に溢れているデータ
から<価値>を引き出す学問です”
ヒカラボ
2017/03/16
22
やっと定義に出会えた (5/5)
●
これは非常に分かりやすいし、皆さんがこの分
野に興味を持っているのもここなのでは
– データから価値を引き出したいですよね?
●
というわけで、やっと「機械学習」と「統計
学」の話に戻ります
機械学習 vs. 統計学 (1/3)
●
結論から言うと「データから価値を引き出す」
ヒカラボ
2017/03/16
24
機械学習 vs. 統計学 (2/3)
●
機械学習で定評のある入門書『はじめてのパ
ターン認識』で取り上げられている手法

ベイズの識別規則

kNN法

線形識別関数

ロジスティック回帰

パーセプトロン

サポートベクトルマシン

主成分分析

部分空間法

k-means法

階層型クラスタリング

EMアルゴリズム

決定木

ブースティング

ランダムフォレスト
ヒカラボ
2017/03/16
25
機械学習 vs. 統計学 (3/3)
●
明らかに統計学の手法だったり、そこから派生
したものだったりが混じっている

ベイズの識別規則

kNN法

線形識別関数

ロジスティック回帰

パーセプトロン

サポートベクトルマシン

主成分分析

部分空間法

k-means法

階層型クラスタリング

EMアルゴリズム

決定木

ブースティング

ランダムフォレスト
ヒカラボ
2017/03/16
26
機械学習の定義
●
大量のデータをコンピュータを使って学習し、そ
こに潜むパターンを見つけ出すこと
– SASのサイトから借用して一部アレンジ
●
見つけ出したパターンを未知のデータに適用し、
予測すること
– メールの文章からスパムかどうか判定する
– 明日の天気と気温からビールの売上を予測する
ヒカラボ
2017/03/16
27
統計学の定義
●
対象の全体または一部を観察し、そこから数量
的法則(規則)を発見する
– みんな大好き『統計学入門』を要約
●
あれっおんなじだ
ヒカラボ
2017/03/16
28
機械学習 vs. 統計学 再び
●
どちらも「データからパターン・法則を見出
す」という点であんまり変わらない
– 木を切るのに斧を使うのか鉈を使うのかぐらいのノ
リで、「木を切る」という行為に変わりはない
●
若干のニュアンスの違いはある(後述)
– とはいえ「データから価値を引き出す」が目的であ
る我々にとっては単なる道具の違いでしかない
– 道具を選り好みする奴にろくなのはいない
ヒカラボ
2017/03/16
29
まとめ (1/2)
●
「AI」は「機械学習」とほぼ同義で使われてい
る
●
「ディープラーニング」は機械学習の一手法
●
「機械学習」「統計学」はどちらもデータから
何らかのパターン・法則を見出す手法
ヒカラボ
2017/03/16
30
まとめ (2/2)
●
我々がやりたいのは「データから価値を引き出
す」こと
●
この目的に照らすと、機械学習も統計学もあく
まで道具であり、取り立てて区別する必要はな
い
2.
「データ分析」の
今とこれから
ヒカラボ
2017/03/16
32
はじめに
●
ここまでは便宜上「統計学や機械学習を駆使し
てデータから法則を見出す行為」を「データサ
イエンス」と呼称していましたが、宗教上の理
由によりここからは「データ分析」とします
– 理由が気になる人は懇親会で聞いてみてください
問題です
データ分析の中でも
「AI」がすごいブームですが、
なんでブームに
なっているんでしょうか?
答え
誰でも簡単にできるように
なってきたから
ヒカラボ
2017/03/16
37
昔
●
そもそもデータがない
●
データがあってもマシンパワーが足りない
●
高度な数学の知識がないと扱えない
●
ナレッジがない
ヒカラボ
2017/03/16
38
今 (1/2)
●
データなら腐るほどある
– 人の行動履歴がWebに蓄積されるようになった
– オープンデータがいっぱい
●
マシンパワーも腐るほどある
– ムーアの法則
– GPU
– クラウド
ヒカラボ
2017/03/16
39
今 (2/2)
●
大量データと潤沢な計算資源により、高度な数
学を駆使しなくても「物理で殴れる」
– 総当り(に近いノリ)で試行錯誤が可能に
●
ディープラーニングとかまさにそれ
●
情報がいくらでも転がっている
– 出版ラッシュ
– Webにもいっぱい
ね、簡単でしょう?
ここで第二問
「誰でも簡単にできること」が
ただできるだけで
競争優位になるでしょうか?
ヒカラボ
2017/03/16
43
生存戦略としてのデータ分析 (1/5)
●
今流行ってるのは機械学習よりのアプローチ
●
機械学習は工学的なアプローチのため、ITエン
ジニアとの親和性が高い
– 理論、プロセスより結果重視
●
というのもあり、周囲でも優秀なエンジニアが
どんどん機械学習を始めている
– 優秀なのですぐに成果が上がっている
ヒカラボ
2017/03/16
44
生存戦略としてのデータ分析 (2/5)
●
端的に言うとエンジニア個人の生存戦略という
観点ではこの分野はとっくにレッドオーシャン
●
他の分野で既に優秀な人が、得意分野と機械学
習を掛け合わせてなんかやる、みたいなのはま
だまだ有望
●
むしろある程度使えないとヤバいみたいになる
こともありえる……?
ヒカラボ
2017/03/16
45
生存戦略としてのデータ分析 (3/5)
●
まだあるよ
●
某2016年にもっとも売れた技術書にこんな記述
が
– 「ディープラーニングって学習の過程に人が介在し
ないから素晴らしい」(意訳)
●
それってもう人いらないじゃん……
ヒカラボ
2017/03/16
46
生存戦略としてのデータ分析 (4/5)
●
マシンパワーを武器に試行錯誤するアプローチ
は容易に機械で代替可能
●
「データさえ突っ込めば勝手に学習してくれ
る」ことを謳うプロダクトは既にいっぱいある
し、精度もこれから上がる
ヒカラボ
2017/03/16
47
生存戦略としてのデータ分析 (5/5)
●
こんな時代はもう目の前
– 実用上必要なレベルの精度は機械が勝手に出せる
– それを越えようとしたらとてつもない専門性が必要
●
データ収集や前処理など、とても大事だが地道
でつらい作業は当分残りそうではある
– そういうのが好きな人はそこに振るのはありそう
ヒカラボ
2017/03/16
48
小休止
●
「人工知能ブーム」は誰でも簡単にできるよう
になったから起こった
●
「誰でも簡単にできる」ので、既存の得意分野
と組み合わせるとか、みんなやりたがらないこ
とをするとかしないと競争優位にならない
– 「これしかできない」データサイエンティストはす
ぐに仕事がなくなる……
あれ?
あんまり明るい話にならない?
- - - ここからポジショントーク - - -
ヒカラボ
2017/03/16
51
このセクションのタイトルは?
●
「データ分析」の今とこれから
●
ここまで機械学習の話ばっかりだけど統計学は?
●
そうです
– なので
●
ここから
– さっきちょっと言った「若干のニュアンスの違い」の話をします
ポジショントーク中
ヒカラボ
2017/03/16
52
ニュアンスの違い is 何
●
キーワードは既に出ている
– 「機械学習は工学的なアプローチ」
– 「理論、プロセスより結果重視」
●
「結果重視」の結果とは?
– 機械学習の定義をおさらい
●
大量のデータをコンピュータを使って学習し、そこに潜むパ
ターンを見つけ出す
●
見つけ出したパターンを未知のデータに適用し、予測する
ポジショントーク中
ヒカラボ
2017/03/16
53
機械学習
●
(主流の)機械学習の目的は「予測」
– 予測が当たれば正義
●
なので、予測精度が上がるためならなんでもやる
– ニューラルネットをものすごい多層にしたり
– 複数の学習器で多数決したり
ポジショントーク中
ヒカラボ
2017/03/16
55
一方の統計学
●
「データからパターンを見出す」という点では
同じでは
– 同じです
●
だが、統計学においては必ずしもパターンを予
測に使うことが目的ではない
– 「パターンを見出しそれを理解する」ことに力点が
置かれる
ポジショントーク中
ポジショントーク中
http://xica.net/magellan/marketing-idea/stats/statistics-words/
それって何が違うのか (1/2)
●
競馬予測を例に取ってみましょう
ポジショントーク中
ヒカラボ
2017/03/16
58
それって何が違うのか (2/2)
●
予想屋
– 使える情報は全て使って、勝つ馬が予測できればそ
れでいい
●
勝つ馬が分かればお金が儲かるから
– 税務署がアップを始めました
●
馬主、調教師
– 予測できるだけではあまり意味がない
ポジショントーク中
ヒカラボ
2017/03/16
59
なぜ意味がない?
●
彼らの仕事は「勝てる馬を育てる」「目の前に
いるこの馬を勝たせる」こと
– 「強い馬はなぜ強いのか」「今強くない馬を強くす
るにはどうすればいいか」が重要
●
なので、生まれてから成長し、強くなるまでの
パターン(メカニズム)そのものを理解する必
要がある
ポジショントーク中
ヒカラボ
2017/03/16
60
補足:それって機械学習じゃダメ?
●
機械学習なら予測できるんだから、シミュレー
ションして一番いい結果が出る方法を採用すれ
ばいいんじゃないの?
●
あまりよくない
– 特徴量がすごい多いので総当りできなそう
– 「相関」と「因果」は違う
– 「雨の日には絶対勝てます!」じゃあ雨降らせろっ
てか……?
ポジショントーク中
- - ポジショントークが加速します - -
ポジショントーク中
ヒカラボ
2017/03/16
62
まとめ (1/5)
●
機械学習の目的は「未来(未知のデータ)を予
測すること」
– 予測さえできればそれがゴール
●
統計学の目的は「データの背後に潜むメカニズ
ムを理解すること」
– ある程度の予測精度はもちろん必要
– だが、予測の精度を上げるためには何でもやってい
い訳ではない
ポジショントーク中
ヒカラボ
2017/03/16
63
まとめ (2/5)
●
「未来を予測する」ことだけが目的なら、人を
介さず機械だけで完結する時代は目の前
– もちろんそれだけでも価値をたくさん生み出すこと
はできる
●
でも、やりたいことって本当にそれだけ?
ポジショントーク中
ヒカラボ
2017/03/16
64
まとめ (3/5)
●
競馬の話に戻ります
●
調教師は目の前にいる馬が「次のレースで負け
る」と予測されれば諦めるのか?
– 勝とうともがくよね
– 勝つための手段を追求し続けるよね
●
彼/彼女がやりたいのは「未来を変える」こと
ポジショントーク中
ヒカラボ
2017/03/16
65
まとめ (4/5)
●
「未来を予測する」だけではなく「未来を変え
る」ことまで求められるフィールドは絶対にある
●
「未来を変える」ためには「人の行動を変える」
必要がある
●
人の行動を変えられるのは人だけ
– 「なんだかよく分からないけど当たるからそれに従
え」で人は動くか?
– それって神のお告げと何も変わらない
ポジショントーク中
ヒカラボ
2017/03/16
66
まとめ (5/5)
●
なぜ人にしかできないのか
– 事象の背後に潜むメカニズムを明らかにして、成功
までのストーリーを提示しないと人は動かない
– 今のところ(そしてたぶん今後しばらくは)「背後
のメカニズムを理解する分析」は機械だけではでき
ない
●
人や社会の行動に関する深い考察と、それを数式に落とし
こむ能力が必要
ポジショントーク中
結論
●
こっちはまだまだ明るいぞ
ポジショントーク中
- - - ポジショントークここまで - - -
おまけ
●
適当に書いて出した事前のプログラムから漏れ
ヒカラボ
2017/03/16
70
Googleと同じ土俵で戦っても
Googleには勝てない
●
機械学習(特にディープラーニング)では大量
のデータと潤沢な計算資源で「物理で殴る」の
がとっても有効
●
世界で一番データと計算資源を持っているのは
誰?
– おまけに連中はディープラーニングに最適化された
プロセッサを独自に作ったりとかしてるぞ
ヒカラボ
2017/03/16
71
「AI」の得意なこと、苦手なこと
(1/3)
●
実活用の分野では、人間の「ちょっぴり知的だ
けどほぼ単純作業」はかなりの部分が代替可能
– 名刺の画像からデータ化
– エッチな画像を検出してBAN
– ローンの審査
– 自動運転もこの範疇かな
ヒカラボ
2017/03/16
72
「AI」の得意なこと、苦手なこと
(2/3)
●
「囲碁で勝つ」は「ちょっぴり知的だけどほぼ
単純作業」には当てはまらなそうだが、これも
万能ではない
– 囲碁で勝つAIは将棋では勝てない
●
それどころか将棋を指すことすらできない
– 将棋で勝てるAIも別にあるが、こんな面白い話が
●
http://www.news-postseven.com/archives/20140424_
252628.html
ヒカラボ
2017/03/16
73
「AI」の得意なこと、苦手なこと
(3/3)
●
「ルールが明確に決まっていて今後もそのルー
ルは変わらない」分野では人間を超えられる
– この世界のごく一部
●
AIは意味を理解することができないので、ルー
ル自体が変わると弱い
– 囲碁で勝つことはできても「どうして勝っている
か」は分からない
●
人に教えることはできない
3.
未来を変える人になるための
道標
ヒカラボ
2017/03/16
75
さあ一歩踏み出そう
●
さっきまでのは一旦忘れましょう
– あくまでハートやスタンスの問題であって、技術的
にはやることそんなに変わらない
– 機械学習を学ぶと統計にフィードバックがあるし、
逆もまた然り
●
てなわけで、学ぶ時も好き嫌いせず両方やりま
しょう
ヒカラボ
2017/03/16
76
大事な心構え (1/2)
●
あなたが簡単に身に付けられるものは、隣の人
も簡単に身に付けられる
– なのですぐ追い付かれる
●
だが、苦労して身に付けたものは簡単には追い
付かれない
ヒカラボ
2017/03/16
77
大事な心構え (2/2)
●
努力しよう
●
「大事って分かっているが面倒だから実際には
なかなかできない」ことを地道にやろう
– それって具体的に何というのは後述
で、まずは何から
始めればいいの?
ヒカラボ
2017/03/16
79
これは実は
ヒカラボ
2017/03/16
80
こうじゃ
ヒカラボ
2017/03/16
81
数学は科学の女王にして奴隷 (1/3)
●
今日の聴衆はエンジニア想定だからコンピュー
タサイエンスはそこそこ分かってるとして……
●
当たり前だが数学分からないと無理
ヒカラボ
2017/03/16
82
数学は科学の女王にして奴隷 (2/3)
●
でも安心を
– 統計学/機械学習に入門するための数学はそこまで
レベル高くない
●
高校数学+大学入門レベルの微積・線形代数で
十分
– それすらやりたくない人は諦めましょう
ヒカラボ
2017/03/16
83
数学は科学の女王にして奴隷 (3/3)
●
高校数学やり直しではこの本が評判いい
– 朝倉書店『統計学のための数学入門30講』
●
大学数学はぶっちゃけ学習参考書が実用的で割
といい
– マセマの『大学数学キャンパス・ゼミシリーズ』
– 読んだことないが高校数学もマセマでいいかも
ヒカラボ
2017/03/16
84
大事な心構え 再び
●
「大事って分かっているが面倒だから実際には
なかなかできない」ことを地道にやろう
– 真面目に技術書読む時には「写経」するよね
– 数学も全く同じ
●
読むだけじゃ理解したつもりになってるだけ
– 手を動かそう
●
さあ紙とペンを持って
ヒカラボ
2017/03/16
85
準備は整った
●
ここまでやると、いよいよ統計学/機械学習の
入門書がちゃんと読めるようになる
●
ここからは独断と偏見で、というか自分が読ん
でよかったと思う本を紹介
– 割と定番書ばかりなので面白みとかはない
– いきなり本だと重い人はオンラインコースでもいい
かも
●
自分は詳しくないのでググッて
ヒカラボ
2017/03/16
86
統計学編 (1/2)
●
東大出版会『統計学入門』(通称「赤本」)は
やはり外せない……
– 初学者には難しいという声もあるが、確率・確率分
布は早めに入門しておかないと
– 線形回帰はいろんな手法の基礎だし
●
東大出版会『自然科学の統計学』(通称「青
本」)も超いい本だが難しい
– 一人で読めたら自信を持っていい
ヒカラボ
2017/03/16
87
統計学編 (2/2)
●
これだけだとベイズ論者から馬鹿にされるので
ベイズも
– 岩波書店『データ解析のための統計モデリング入
門』だと前2冊からうまく接続できる
●
「因果は相関と違う」と言ったが因果を追求す
る統計学も実はある
– 『岩波データサイエンス vol.3』がすごく分かりやす
い
ヒカラボ
2017/03/16
88
機械学習編
●
黄色い悪魔は必ず挫折するのでやめよう
●
森北出版『はじめてのパターン認識』(通称
「はじパタ」)はかなりいい
– が、結構難しいのでコロナ社『言語処理のための機
械学習入門』を先に読んでおくといいかも
●
古い版は誤植多いので注意
ヒカラボ
2017/03/16
89
大事な心構え 再び
●
「大事って分かっているが面倒だから実際には
なかなかできない」ことを地道にやろう
– さあ紙とペンを持って
– 数式は全部写して式展開省略してるところは全部自
分で埋めるぐらいの気概は必要
●
一人でやるとしんどいので、教えてくれる人や一緒に悩ん
でくれる人を探すのが結構重要かもしれない
プログラミング編
●
まあPythonだよね
●
インプレス『Python機械学習プログラミング』
ヒカラボ
2017/03/16
91
その先は……
●
ここまでできたあなたは相当力がついています
●
自分の好きな分野のオープンデータを探してい
ろいろやってみましょう
●
割とガチな勉強会に行ってもだいたい話は通じ
るので、人から刺激を受けましょう
という訳で
みんなで
「未来を変える分析ができる人」
になろう!
以上、
ご清聴ありがとうございました

More Related Content

What's hot

計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
Takashi J OZAKI
 
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
Takashi J OZAKI
 
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
Shohei Hido
 
機械学習CROSS 前半資料
機械学習CROSS 前半資料機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
 
自然言語処理紹介(就職編)
自然言語処理紹介(就職編)自然言語処理紹介(就職編)
自然言語処理紹介(就職編)
長岡技術科学大学 自然言語処理研究室
 
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会Yuya Unno
 
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言ICML2013読み会 開会宣言
ICML2013読み会 開会宣言
Shohei Hido
 
mlabforum2012_okanohara
mlabforum2012_okanoharamlabforum2012_okanohara
mlabforum2012_okanohara
Preferred Networks
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Preferred Networks
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)Yuya Unno
 
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Shohei Hido
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
Shohei Hido
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Preferred Networks
 
Jubatus使ってみた
Jubatus使ってみたJubatus使ってみた
Jubatus使ってみた
Tohru Kobayashi
 
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会Yuya Unno
 
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―Hisao Soyama
 
aiconf2017okanohara
aiconf2017okanoharaaiconf2017okanohara
aiconf2017okanohara
Preferred Networks
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
Core Concept Technologies
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
 

What's hot (20)

計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
 
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
 
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
 
機械学習CROSS 前半資料
機械学習CROSS 前半資料機械学習CROSS 前半資料
機械学習CROSS 前半資料
 
自然言語処理紹介(就職編)
自然言語処理紹介(就職編)自然言語処理紹介(就職編)
自然言語処理紹介(就職編)
 
rcast_20140411
rcast_20140411rcast_20140411
rcast_20140411
 
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
 
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言ICML2013読み会 開会宣言
ICML2013読み会 開会宣言
 
mlabforum2012_okanohara
mlabforum2012_okanoharamlabforum2012_okanohara
mlabforum2012_okanohara
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 
Jubatus使ってみた
Jubatus使ってみたJubatus使ってみた
Jubatus使ってみた
 
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
 
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
 
aiconf2017okanohara
aiconf2017okanoharaaiconf2017okanohara
aiconf2017okanohara
 
ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 

Similar to 本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~

AIへの期待 わかること、わからないこと(AI eats UX)
AIへの期待 わかること、わからないこと(AI eats UX)AIへの期待 わかること、わからないこと(AI eats UX)
AIへの期待 わかること、わからないこと(AI eats UX)
chachaki chachaki
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
株式会社Consumer first
 
MANABIYA 2018 DB kinoshita DB for AItech
MANABIYA 2018 DB kinoshita DB for AItechMANABIYA 2018 DB kinoshita DB for AItech
MANABIYA 2018 DB kinoshita DB for AItech
Yasufumi Kinoshita
 
カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録
syou6162
 
20200605_wids_explainableAI
20200605_wids_explainableAI20200605_wids_explainableAI
20200605_wids_explainableAI
Rio Kurihara
 
オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用
syou6162
 
新卒2ヶ月でAIを社会実装させた3つのデザイン
新卒2ヶ月でAIを社会実装させた3つのデザイン新卒2ヶ月でAIを社会実装させた3つのデザイン
新卒2ヶ月でAIを社会実装させた3つのデザイン
NodokaFujimoto
 
新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)
新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)
新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)
NodokaFujimoto
 
構造化データをツールで簡単に分析
構造化データをツールで簡単に分析構造化データをツールで簡単に分析
構造化データをツールで簡単に分析
Yoshitaka Seo
 
新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー
慧悟 岩本
 
シビックテックとデザイン
シビックテックとデザインシビックテックとデザイン
シビックテックとデザイン
CodeForTokyo
 
シビックテックとデザイン
シビックテックとデザインシビックテックとデザイン
シビックテックとデザイン
Yuichi Yazaki
 
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
YASUKAZU NAGATOMI
 
Garraway7 Terakoya 前夜祭 プロトタイプのススメ
Garraway7 Terakoya 前夜祭 プロトタイプのススメGarraway7 Terakoya 前夜祭 プロトタイプのススメ
Garraway7 Terakoya 前夜祭 プロトタイプのススメ
Daiyu Hatakeyama
 
GDG2018 vision kit mahjong
GDG2018 vision kit mahjongGDG2018 vision kit mahjong
GDG2018 vision kit mahjong
Rio Kurihara
 
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションいじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
cyberagent
 
QnA Maker 逆入門
QnA Maker 逆入門QnA Maker 逆入門
QnA Maker 逆入門
Yoshitaka Seo
 
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
Shunsuke Nakamura
 
20180730 ds womens
20180730 ds womens20180730 ds womens
20180730 ds womens
Rio Kurihara
 
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
 [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
Insight Technology, Inc.
 

Similar to 本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~ (20)

AIへの期待 わかること、わからないこと(AI eats UX)
AIへの期待 わかること、わからないこと(AI eats UX)AIへの期待 わかること、わからないこと(AI eats UX)
AIへの期待 わかること、わからないこと(AI eats UX)
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
 
MANABIYA 2018 DB kinoshita DB for AItech
MANABIYA 2018 DB kinoshita DB for AItechMANABIYA 2018 DB kinoshita DB for AItech
MANABIYA 2018 DB kinoshita DB for AItech
 
カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録
 
20200605_wids_explainableAI
20200605_wids_explainableAI20200605_wids_explainableAI
20200605_wids_explainableAI
 
オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用
 
新卒2ヶ月でAIを社会実装させた3つのデザイン
新卒2ヶ月でAIを社会実装させた3つのデザイン新卒2ヶ月でAIを社会実装させた3つのデザイン
新卒2ヶ月でAIを社会実装させた3つのデザイン
 
新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)
新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)
新卒2ヶ月でAIを社会実装させた3つのデザイン(修正前)
 
構造化データをツールで簡単に分析
構造化データをツールで簡単に分析構造化データをツールで簡単に分析
構造化データをツールで簡単に分析
 
新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー新卒採用を、まっとうに ー面接者への通信簿ー
新卒採用を、まっとうに ー面接者への通信簿ー
 
シビックテックとデザイン
シビックテックとデザインシビックテックとデザイン
シビックテックとデザイン
 
シビックテックとデザイン
シビックテックとデザインシビックテックとデザイン
シビックテックとデザイン
 
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
 
Garraway7 Terakoya 前夜祭 プロトタイプのススメ
Garraway7 Terakoya 前夜祭 プロトタイプのススメGarraway7 Terakoya 前夜祭 プロトタイプのススメ
Garraway7 Terakoya 前夜祭 プロトタイプのススメ
 
GDG2018 vision kit mahjong
GDG2018 vision kit mahjongGDG2018 vision kit mahjong
GDG2018 vision kit mahjong
 
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションいじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
 
QnA Maker 逆入門
QnA Maker 逆入門QnA Maker 逆入門
QnA Maker 逆入門
 
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
【今日ジョブチェンジ】エンジニアからデータサイエンティストになる方法【サポーターズCoLab勉強会】
 
20180730 ds womens
20180730 ds womens20180730 ds womens
20180730 ds womens
 
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
 [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
 

More from Hisao Soyama

People analyticsと社会ネットワーク分析
People analyticsと社会ネットワーク分析People analyticsと社会ネットワーク分析
People analyticsと社会ネットワーク分析
Hisao Soyama
 
コードレビューのアンチパターンについて考えてみた
コードレビューのアンチパターンについて考えてみたコードレビューのアンチパターンについて考えてみた
コードレビューのアンチパターンについて考えてみた
Hisao Soyama
 
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
Hisao Soyama
 
『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データ『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データHisao Soyama
 
『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論 『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論 Hisao Soyama
 
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
Hisao Soyama
 
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
 グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ- グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-Hisao Soyama
 
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入Hisao Soyama
 
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―Hisao Soyama
 
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクションHisao Soyama
 

More from Hisao Soyama (11)

People analyticsと社会ネットワーク分析
People analyticsと社会ネットワーク分析People analyticsと社会ネットワーク分析
People analyticsと社会ネットワーク分析
 
コードレビューのアンチパターンについて考えてみた
コードレビューのアンチパターンについて考えてみたコードレビューのアンチパターンについて考えてみた
コードレビューのアンチパターンについて考えてみた
 
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
 
『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データ『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データ
 
『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論 『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論
 
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
 
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
 グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ- グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
 
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
 
Matrix
MatrixMatrix
Matrix
 
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
 
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
 

本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~