SlideShare a Scribd company logo
TECHNOMOBILE
GROUP
HEAD OFFICE
TOKUSHIMA development section
| 5floor Column Minamiaoyama,7-1-5,Minamiaoyama,Minato-ku,Tokyo 107-0062,Japan
| 3floor Tokushimakenkohkagaku-center,Hiraishisumiyoshi,Kawauchi-cho,Tokushima-shi Tokushima 771-0134,Japan
実践:今日から使えるビックデータハンズオン
あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
2
機械学習とは
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
最近よく聞く「機械学習」っ
てなんでしょう?
3
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
どばーっと大量のデータをパ
ソコンに取り込んで。。
4
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
うーってパソコンが考えて。。
5
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
とりゃーって答えを教えてく
れる仕組みです。
6
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
統計学の知識が必要なのでは?
7
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
最近のツールは良く出来ていて、
ブラウザ上でなんとなくブロッ
クをつなぎ合わせていくだけで
機械学習ができちゃいます。
ただし、結果が良
いのかどうか評価
できる知識は必要
8
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
なので、
「採用する前に優秀かどうか知り
たくないですか?」
「どこで広告を流すと課金ユーザ
になってくれるのか知りたくない
ですか?」
そういう答えを知りたいすべての
人に「機械学習」を使って欲しい
のです。
9
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
回帰
クラス分類 レコメンデーション
クラスタリング
教師あり 教師なし
※ほかにもいろいろ
答えをもとに学習します データを元に傾向を学習します
機械学習の種類
10
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
・回帰...数値を予測します。
・クラス分類...分類を予測します。
二項分類、多項分類
・クラスタリング...グループに分けます。
・レコメンデーション...お勧めを示します。
11
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
今回は
クラス分類(二項分類)
を実践形式で学びます。
12
機械学習するためのワンパターン
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
どうやって「機械学習」って
するの?
1つのパターンを覚えれば
OK!→あとは調整していく
13
ワンパターン
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
1. データを取り込む
2. 学習用と評価用にデータを分
ける
3. 学習用データを使って学習す
る。
4. 学習した結果を使って評価用
のデータの答えを推測する。
5. 推測した答えを評価する。
14
早速実践
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
ツールはなにがよいの?
マイクロソフトのAzure MLを
使います。1ヶ月無料で使え
る。1ヶ月後もFreeプランが
あります。
AzureML
http://azure.microsoft.com/ja-jp/services/machine-learning/
料金
http://azure.microsoft.com/ja-jp/pricing/details/machine-learning/
15
「まずはユーザ登録」のページを実行して、事前にユーザー登録をしておいてく
ださい。
6
事前準備
16
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
この学びの対象者は?
→答えが知りたい人。ブラウザが使
えればOK!統計の話は出てこないで
す。
教えないことは?
→統計については質問しないでくだ
さいorz 理系ですが専門じゃないで
す。
17
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
なにを推論するの?
おもしろもの!!
今回はタイタニックの乗客が生
き残るかどうか推論しましょ
う!ちょっと不謹慎ですが。。。
参考:AzureMLのチュートリアル
https://gallery.azureml.net/Details/01b2765fa75147ce99679e18482d280f
18
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
あなたは生き残れるか!!
19
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
講師
Gashfara,Inc.代表
デジタルハリウッド大学院客員講師
茂木健一
mogi@gashfara.com
kenichi.mogi@tcmobile.jp
http://facebook.com/mogiken
http://www.slideshare.net/mogiken1
自己紹介
[プロフィール/実績]
もぎ・けんいち●青山学院大学大学院卒。(株)東洋情報システム退社後、(株)
エイチアイ、グランスフィア(株)、(株)ファッションウォーカーなど数社の
ベンチャー企業の立ち上げ・創業期に参画し、ガシュファラ・インクをUSで起業。
システム開発ではゲーム、M&A企業評価システム、動画配信システム、電子マ
ネーシステム、ECフルフィルメントシステムなど、多彩な分野を経験。IT関連教
育ではBrew、Java、セキュリティーなどの講師として活躍。現在、(株)HUGG
を設立し、スマホのカップル向けSNSサービス[HUGG]をグローバルに展開。㈱テ
クノモバイルにて技術サポート。
【著書】
BREWプログラミング実践バイブル [共著] (インプレス)、PHP逆引き大全 516
の極意[共著](秀和システム)
20
成長を実現させるシステム”モバイルトータルソリュー
ション”
Web
システム
1
スマホ
アプリ
2 ゲーム
アプリ
3
モバイルトータルソリューション
B2B2C
• コンシューマ向けの大規模Webシステムの開発からアプリ・ゲーム開発までをマルチデバイスで対応
高い技術力 市場ニーズとマッチ
大規模
Webシステム
に強い
Java,PHP
Strong1
最先端技術・独自
フレームワークで
効率的な
開発
Strong2
高トラフィック、
インフラ
ネットワーク
に強い
Strong3 プライマリー
ベンダー、
ヒアリング・
要件定義
に強い
StrongⅠ
情報資産の活用
最先端と
知見に強い
StrongⅡ
最先端のマルチ
デバイス
ウェアラブルに
強い
StrongⅢ
Mashup Awards 5年連続 受賞
会社名 株式会社テクノモバイル
設 立 2008年
資本金 2,500万円
代 表 播田 誠
従業員数 100名(グループ合計)
本社所在地
〒 107-0062
東京都港区南青山7-1-5 コラム南青山 5F
開発室
〒771-0134
徳島県徳島市川内町平石住吉209-5
徳島健康科学総合センター 3F
21
まずはユーザ登録
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
ユーザ登録してください
AzureML(Machine Learning)
http://azure.microsoft.com/ja-jp/services/machine-learning/
22
ログイン
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
https://studio.azureml.net/?selectAccess=true&o=1 にアクセ
スしてください。
23
ワンパターンその1:データを取り込む
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
データを用意します。
ここのtrain.csvを使います。
乗客の情報と生死がCSVデー
タになってます。
https://www.kaggle.com/c/titanic-gettingStarted/data
Downloadできないひとは講師に問い合わせて。
24
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
Excelで開いてみます。それぞ
れのデータの意味は
PassengerId=顧客ID
Survived=1:生存、0:死亡
Pclass=1:一等席、2:二等席、3:3等席
Name=名前
Sex=性別
Age=年齢
SibSp=同乗している兄弟の人数(自分は数えない)
Parch=同乗している親または子供の人数(自分は数えない)
ticket=チケットNo
fare=料金 1等席はだいたい50〜200,2等席10〜80,3等席7〜50
ポンド:1ポンドの現在価値は0.7万円くらいかな?
cabin=客室番号
embarked=乗船した場所 C = Cherbourg; Q = Queenstown; S =
Southampton
Survivedが知りたい情報です。こ
れを目的変数(label)と言いま
す。
その他のデータは説明変数
(features)です。
labelは1つだけです。featuresは
いくつでもOKです。
labelは0,1のように2つの値だけ
を持つようなデータで検証する
のが分かりやすいです。
25
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
AzureMLに取り込みます
①
②
⑤train.csvを選択します。
③ ④
⑥
DATASETSに
登録されま
す。
http://azure.microsoft.com/ja-jp/services/machine-learning/ からログイン
または
https://studio.azureml.net/?selectAccess=true&o=1
26
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
データを取り込むロジックを
作成します
①
②
③
④
⑤
⑥train.csvをDragDrop
この画面で左にある部品をつ
なぎあわせながら機械学習の
ロジックを組み立てていきます。
以上
27
ワンパターンその2:学習用と評価用にデータを分ける
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
①キーワード検索
②D&D
③つなぐ
丸いところが接続可能
④Splitの図
形を選択し
て0.6に変更。
6割、4割
にデータが
わかれる
6割 4割
以上
28
ワンパターンその3:学習用データを使って学習する
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
①
②ここで6割のデータを
使って学習します。
③
④
こんな感じに部品を組み立てましょう。labelの指定が必要なので忘れずに。
Two-Class Bayes Point Machineが学習するロジック(model)になります。これを変
更するといろいろなロジックを試すことが出来ます。0,1のようにlabelが2つの値
を持つならば、Two-Class Bayesが吉!
labelが3つ以上の値を保つ場合や実数の場合などはそれに応じてmodelを変更する
必要があります。どのmodelを選ぶのかの目安は、名前にTwo-Class Multi-Classな
どのようにわかり易い名前が付いています。教師なしmodelもありますが説明は省
略します。
⑤TrainModelを選択して
ボタンを押す
⑥labelにSurvivedを指定します。
以上
29
ワンパターンその4:学習した結果を使って評価用の
データの答えを推測する
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
①ここで4割のデータを推測する
こんな感じに部品を組み立てましょう。
②
③
以上
30
ワンパターンその5:推測した答えを評価する
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
①ここでScoreModelの結果を評価します
こんな感じに部品を組み立てましょう。
②
以上
31
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
実行
ロジックが出来たので実行し
ます
ぽちっと押します。キュー(実行待ち)
に入るので完了するまで待ちます
終了すると右上にこんな感じに表示されます。
32
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
ScoreModelの結果を見ましょう
②
①線をつないでいるポッチを押しましょう。
③結果が表示されます
Splitで分けた4割のデータが表示されます。Scored Labelsが推測した値です。TrainModelでlabel
にSurvivedを指定しているのでこの値と比較すれば推測があたっているかどうかわかります。
33
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
EvaluateModelの結果を見ましょう
②
①線をつないでいるポッチを押しましょう。
③結果が表示されます
ScoreModelでは全体的に良い結果なのかどうか判断しにくいのです。そこでEvaluateModelを
使ってざっくりと推測の精度が良いのかどうか判断します。
とりあえず2つだけポイントを抑えればOKです。他にたくさん指標がありますがGoogleなどで
検索すればどのように評価すればよいのか出ています。
34
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
EvaluateModelの結果をみる2つのポイ
ント(超初心者用)
ROCのグラフは対角線を基準として左上側に線があると精度が良いと
考えます。赤い線のようなのが理想的です。
対角線はちょうど五分五分の精度です(要はランダムに推測した結果
に近い)。
Accuracyが1に近いほど精度が良いです。
現状、ROCは対角線に近
く、Accuracyも1には程遠
いので精度は良くないです
ね。。。
※学習modelによって評価の仕方が変わります
35
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
なにが悪いの?
データ?
データを良く見てみよう!!
36
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
改めてCSVデータを見ると、
生死に関係なさそうな値や未
入力の値もありそうです。
これらを削除すれば精度が良
くなるのでは?
37
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
未入力データがあるものは行
ごと削除
PassengerId、Nameは生死に
関係ないでしょう
ticketも関係なさそう
cabinもユニークな番号っぽい
ので関係ないのでは?
38
データを綺麗にしよう
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
②
①
③
④
⑤
⑥ProjectColumunsの設定
⑦MissingValuesScrubberの設定
こんな感じに部品を組み立てましょう。
39
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
再度実行
修正出来たので実行します
結果を待ちましょう。。。
どきどきどきどき
40
EvalutateModelを見ましょう
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
グラフもAccuracy
もいい感じ!!
更に精度を高めるには使うデータ
の見直し、データを加工して学習
しやすくする、Bayes以外のmodel
も試してみる、など試行錯誤して
みましょう。
41
他のデータに応用するには?
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
①データの変更
②学習ロジックの変更
0,1のように2つの値ならこのままでもOK
③Labelの変更
たった、3箇所を変更するだけ!
42
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
あなたは生き残れるか!!
43
検証データを入力できるようにする
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
AzureMLはAPIとして簡単に
インターネットに外部公開で
きます。そこからデータを入
力して生き残れるか検証しま
す。
44
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
①
②
③4割の検証データの代わりにAPIのデー
タを使います
④
こんな感じに部品を組み立てましょう。
Webで検証するための入り口と出口が出来ました!
45
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
これを押すとAPIとして公開されます。押せない時は「RUN」を実行してから再試行します。
46
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
このサービスにアクセスするAPIが公開されます。アクセスするにはプログラムが必要です。ですが
「Test」を使うと検証が簡単にできます。入力するデータはCSVとおなじ内容です。結果は
ScoreModelのVisualで表示されるデータと同じです。
入力
結果:Jason
47
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
あなたは生き残れるか!!
Survived=1:生存、0:死亡 結果のデータなので適当でOK
Pclass=1:一等席、2:二等席、3:3等席
Sex=male,female
Age=年齢
SibSp=同乗している兄弟の人数(自分は数えない)
Parch=同乗している親または子供の人数(自分は数えない)
fare=料金 1等席はだいたい50〜200,2等席10〜80,3等席7〜50
ポンド:1ポンドの現在価値は0.7万円くらいかな?
embarked=乗船した場所 C = Cherbourg; Q = Queenstown; S = Southampton
検証!!
48
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
あとは身近なデータでトライ!!
コンテストデータはここに
https://www.kaggle.com/
野良データはここにも
https://goo.gl/IHxkkO
49
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
http://goo.gl
/jGKrYy
書籍が発売されています。
下記のドキュメントなど
を読み込みましょう。
http://azure.microsoft.com/ja-
jp/services/machine-learning/
さらに勉強するには
50
COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED.
6
・Webサービスの知能化
・データ分析サービスの追加
・エンジニアのデータ分析能力向上
・DeepLearningなど先端技術の導入支援
適用事例(経営者・営業担当の方に)

More Related Content

Viewers also liked

Tensorflowのチュートリアルで理解するdeep learningはじめてハンズオン
Tensorflowのチュートリアルで理解するdeep learningはじめてハンズオンTensorflowのチュートリアルで理解するdeep learningはじめてハンズオン
Tensorflowのチュートリアルで理解するdeep learningはじめてハンズオン
健一 茂木
 
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
徹 上野山
 
Cocos2d js セットアップ for windows
Cocos2d js セットアップ for windowsCocos2d js セットアップ for windows
Cocos2d js セットアップ for windows
健一 茂木
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
tak9029
 
代数的実数とCADの実装紹介
代数的実数とCADの実装紹介代数的実数とCADの実装紹介
代数的実数とCADの実装紹介
Masahiro Sakai
 
RでKaggleの登竜門に挑戦
RでKaggleの登竜門に挑戦RでKaggleの登竜門に挑戦
RでKaggleの登竜門に挑戦
幹雄 小川
 
Docker環境でetherium開発環境を作る際のはまりどころ
Docker環境でetherium開発環境を作る際のはまりどころDocker環境でetherium開発環境を作る際のはまりどころ
Docker環境でetherium開発環境を作る際のはまりどころ
健一 茂木
 
関数型軽い紹介
関数型軽い紹介関数型軽い紹介
関数型軽い紹介
Daniel Perez
 
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオンHyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
健一 茂木
 
徹底解説 ネットショップの決済の全て
徹底解説 ネットショップの決済の全て徹底解説 ネットショップの決済の全て
徹底解説 ネットショップの決済の全て
ec-campus
 
Firefox Mobile
Firefox MobileFirefox Mobile
Firefox Mobile
Makoto Kato
 
Iccw2010 sdk4 air
Iccw2010 sdk4 airIccw2010 sdk4 air
Iccw2010 sdk4 airIsao Soma
 
Comunicar 3.0
Comunicar 3.0Comunicar 3.0
Comunicar 3.0
Adelino Sousa
 
Azure ml発表資料
Azure ml発表資料Azure ml発表資料
Azure ml発表資料
kota matsumoto
 
Point card
Point cardPoint card
Point card
Akimitsu Takase
 
Android Wear Design Guideline
Android Wear Design GuidelineAndroid Wear Design Guideline
Android Wear Design Guideline
Soyeon Lee
 
White paper querydata_goldenweek2015_20150414
White paper querydata_goldenweek2015_20150414White paper querydata_goldenweek2015_20150414
White paper querydata_goldenweek2015_20150414
Yahoo! JAPAN Marketing Solution
 
2)アイデアPartの導入
2)アイデアPartの導入2)アイデアPartの導入
2)アイデアPartの導入Rikie Ishii
 

Viewers also liked (20)

Tensorflowのチュートリアルで理解するdeep learningはじめてハンズオン
Tensorflowのチュートリアルで理解するdeep learningはじめてハンズオンTensorflowのチュートリアルで理解するdeep learningはじめてハンズオン
Tensorflowのチュートリアルで理解するdeep learningはじめてハンズオン
 
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
 
Cocos2d js セットアップ for windows
Cocos2d js セットアップ for windowsCocos2d js セットアップ for windows
Cocos2d js セットアップ for windows
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
 
代数的実数とCADの実装紹介
代数的実数とCADの実装紹介代数的実数とCADの実装紹介
代数的実数とCADの実装紹介
 
RでKaggleの登竜門に挑戦
RでKaggleの登竜門に挑戦RでKaggleの登竜門に挑戦
RでKaggleの登竜門に挑戦
 
Docker環境でetherium開発環境を作る際のはまりどころ
Docker環境でetherium開発環境を作る際のはまりどころDocker環境でetherium開発環境を作る際のはまりどころ
Docker環境でetherium開発環境を作る際のはまりどころ
 
関数型軽い紹介
関数型軽い紹介関数型軽い紹介
関数型軽い紹介
 
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオンHyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
 
徹底解説 ネットショップの決済の全て
徹底解説 ネットショップの決済の全て徹底解説 ネットショップの決済の全て
徹底解説 ネットショップの決済の全て
 
Firefox Mobile
Firefox MobileFirefox Mobile
Firefox Mobile
 
Iccw2010 sdk4 air
Iccw2010 sdk4 airIccw2010 sdk4 air
Iccw2010 sdk4 air
 
Comunicar 3.0
Comunicar 3.0Comunicar 3.0
Comunicar 3.0
 
2e64ed78b0951c70ef8bd10cc818dbc6[1]
2e64ed78b0951c70ef8bd10cc818dbc6[1]2e64ed78b0951c70ef8bd10cc818dbc6[1]
2e64ed78b0951c70ef8bd10cc818dbc6[1]
 
Azure ml発表資料
Azure ml発表資料Azure ml発表資料
Azure ml発表資料
 
Point card
Point cardPoint card
Point card
 
Android Wear Design Guideline
Android Wear Design GuidelineAndroid Wear Design Guideline
Android Wear Design Guideline
 
15 memory card
15 memory card15 memory card
15 memory card
 
White paper querydata_goldenweek2015_20150414
White paper querydata_goldenweek2015_20150414White paper querydata_goldenweek2015_20150414
White paper querydata_goldenweek2015_20150414
 
2)アイデアPartの導入
2)アイデアPartの導入2)アイデアPartの導入
2)アイデアPartの導入
 

Similar to 実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門

20141203 tiberoセミナー講演資料
20141203 tiberoセミナー講演資料20141203 tiberoセミナー講演資料
20141203 tiberoセミナー講演資料
tmaxsoftjpn
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
Recruit Technologies
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
DataWorks Summit/Hadoop Summit
 
Participation report of data stax accelerate 2019
Participation report of data stax accelerate 2019Participation report of data stax accelerate 2019
Participation report of data stax accelerate 2019
MKT-INTHEFOREST
 
【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918
Cybozucommunity
 
Struggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit groupStruggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit group
Recruit Technologies
 
Hieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータ
Hieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータHieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータ
Hieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータ
Puppet
 
de:code2018 登壇資料
de:code2018 登壇資料de:code2018 登壇資料
de:code2018 登壇資料
Hiroshi Senga
 
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
Insight Technology, Inc.
 
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
Optuna on Kubeflow Pipeline 分散ハイパラチューニングOptuna on Kubeflow Pipeline 分散ハイパラチューニング
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
Takashi Suzuki
 
ソフトウェアテストの最新動向の学び方
ソフトウェアテストの最新動向の学び方ソフトウェアテストの最新動向の学び方
ソフトウェアテストの最新動向の学び方
Keizo Tatsumi
 
Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下
Koyo Takenoshita
 
ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向
Keizo Tatsumi
 
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
Dai Iwai
 
BPStudy#101発表資料
BPStudy#101発表資料BPStudy#101発表資料
BPStudy#101発表資料
Toyohisa Tanaka
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
Insight Technology, Inc.
 
Jazug-8th: Azure AKS & FIWARE & Robot
Jazug-8th: Azure AKS & FIWARE & RobotJazug-8th: Azure AKS & FIWARE & Robot
Jazug-8th: Azure AKS & FIWARE & Robot
Nobuyuki Matsui
 
201110 01 Polytech Center 1
201110 01 Polytech Center 1201110 01 Polytech Center 1
201110 01 Polytech Center 1
openrtm
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
Insight Technology, Inc.
 
ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)
ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)
ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)
Keizo Tatsumi
 

Similar to 実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門 (20)

20141203 tiberoセミナー講演資料
20141203 tiberoセミナー講演資料20141203 tiberoセミナー講演資料
20141203 tiberoセミナー講演資料
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
 
Participation report of data stax accelerate 2019
Participation report of data stax accelerate 2019Participation report of data stax accelerate 2019
Participation report of data stax accelerate 2019
 
【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918【kintone hive 上海】ウィングアーク上海講演資料_160918
【kintone hive 上海】ウィングアーク上海講演資料_160918
 
Struggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit groupStruggle against cross-domain data complexity in Recruit group
Struggle against cross-domain data complexity in Recruit group
 
Hieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータ
Hieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータHieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータ
Hieraテクニック - 効率的にパラメータシートから設定値を取り込む - 横山 浩輔、株式会社NTTデータ
 
de:code2018 登壇資料
de:code2018 登壇資料de:code2018 登壇資料
de:code2018 登壇資料
 
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
Optuna on Kubeflow Pipeline 分散ハイパラチューニングOptuna on Kubeflow Pipeline 分散ハイパラチューニング
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
 
ソフトウェアテストの最新動向の学び方
ソフトウェアテストの最新動向の学び方ソフトウェアテストの最新動向の学び方
ソフトウェアテストの最新動向の学び方
 
Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下
 
ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向ソフトウェアテストの歴史と近年の動向
ソフトウェアテストの歴史と近年の動向
 
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
 
BPStudy#101発表資料
BPStudy#101発表資料BPStudy#101発表資料
BPStudy#101発表資料
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
 
Jazug-8th: Azure AKS & FIWARE & Robot
Jazug-8th: Azure AKS & FIWARE & RobotJazug-8th: Azure AKS & FIWARE & Robot
Jazug-8th: Azure AKS & FIWARE & Robot
 
201110 01 Polytech Center 1
201110 01 Polytech Center 1201110 01 Polytech Center 1
201110 01 Polytech Center 1
 
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
 
ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)
ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)
ニューノーマル時代のテストエンジニアへの"food for thought" (JaSST'18 Kansai)
 

Recently uploaded

【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
 

Recently uploaded (16)

【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 

実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門

  • 1. TECHNOMOBILE GROUP HEAD OFFICE TOKUSHIMA development section | 5floor Column Minamiaoyama,7-1-5,Minamiaoyama,Minato-ku,Tokyo 107-0062,Japan | 3floor Tokushimakenkohkagaku-center,Hiraishisumiyoshi,Kawauchi-cho,Tokushima-shi Tokushima 771-0134,Japan 実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
  • 2. 2 機械学習とは COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 最近よく聞く「機械学習」っ てなんでしょう?
  • 3. 3 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 どばーっと大量のデータをパ ソコンに取り込んで。。
  • 4. 4 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 うーってパソコンが考えて。。
  • 5. 5 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 とりゃーって答えを教えてく れる仕組みです。
  • 6. 6 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 統計学の知識が必要なのでは?
  • 7. 7 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 最近のツールは良く出来ていて、 ブラウザ上でなんとなくブロッ クをつなぎ合わせていくだけで 機械学習ができちゃいます。 ただし、結果が良 いのかどうか評価 できる知識は必要
  • 8. 8 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 なので、 「採用する前に優秀かどうか知り たくないですか?」 「どこで広告を流すと課金ユーザ になってくれるのか知りたくない ですか?」 そういう答えを知りたいすべての 人に「機械学習」を使って欲しい のです。
  • 9. 9 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 回帰 クラス分類 レコメンデーション クラスタリング 教師あり 教師なし ※ほかにもいろいろ 答えをもとに学習します データを元に傾向を学習します 機械学習の種類
  • 10. 10 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ・回帰...数値を予測します。 ・クラス分類...分類を予測します。 二項分類、多項分類 ・クラスタリング...グループに分けます。 ・レコメンデーション...お勧めを示します。
  • 11. 11 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 今回は クラス分類(二項分類) を実践形式で学びます。
  • 12. 12 機械学習するためのワンパターン COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 どうやって「機械学習」って するの? 1つのパターンを覚えれば OK!→あとは調整していく
  • 13. 13 ワンパターン COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 1. データを取り込む 2. 学習用と評価用にデータを分 ける 3. 学習用データを使って学習す る。 4. 学習した結果を使って評価用 のデータの答えを推測する。 5. 推測した答えを評価する。
  • 14. 14 早速実践 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ツールはなにがよいの? マイクロソフトのAzure MLを 使います。1ヶ月無料で使え る。1ヶ月後もFreeプランが あります。 AzureML http://azure.microsoft.com/ja-jp/services/machine-learning/ 料金 http://azure.microsoft.com/ja-jp/pricing/details/machine-learning/
  • 16. 16 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 この学びの対象者は? →答えが知りたい人。ブラウザが使 えればOK!統計の話は出てこないで す。 教えないことは? →統計については質問しないでくだ さいorz 理系ですが専門じゃないで す。
  • 17. 17 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 なにを推論するの? おもしろもの!! 今回はタイタニックの乗客が生 き残るかどうか推論しましょ う!ちょっと不謹慎ですが。。。 参考:AzureMLのチュートリアル https://gallery.azureml.net/Details/01b2765fa75147ce99679e18482d280f
  • 18. 18 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 あなたは生き残れるか!!
  • 19. 19 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 講師 Gashfara,Inc.代表 デジタルハリウッド大学院客員講師 茂木健一 mogi@gashfara.com kenichi.mogi@tcmobile.jp http://facebook.com/mogiken http://www.slideshare.net/mogiken1 自己紹介 [プロフィール/実績] もぎ・けんいち●青山学院大学大学院卒。(株)東洋情報システム退社後、(株) エイチアイ、グランスフィア(株)、(株)ファッションウォーカーなど数社の ベンチャー企業の立ち上げ・創業期に参画し、ガシュファラ・インクをUSで起業。 システム開発ではゲーム、M&A企業評価システム、動画配信システム、電子マ ネーシステム、ECフルフィルメントシステムなど、多彩な分野を経験。IT関連教 育ではBrew、Java、セキュリティーなどの講師として活躍。現在、(株)HUGG を設立し、スマホのカップル向けSNSサービス[HUGG]をグローバルに展開。㈱テ クノモバイルにて技術サポート。 【著書】 BREWプログラミング実践バイブル [共著] (インプレス)、PHP逆引き大全 516 の極意[共著](秀和システム)
  • 20. 20 成長を実現させるシステム”モバイルトータルソリュー ション” Web システム 1 スマホ アプリ 2 ゲーム アプリ 3 モバイルトータルソリューション B2B2C • コンシューマ向けの大規模Webシステムの開発からアプリ・ゲーム開発までをマルチデバイスで対応 高い技術力 市場ニーズとマッチ 大規模 Webシステム に強い Java,PHP Strong1 最先端技術・独自 フレームワークで 効率的な 開発 Strong2 高トラフィック、 インフラ ネットワーク に強い Strong3 プライマリー ベンダー、 ヒアリング・ 要件定義 に強い StrongⅠ 情報資産の活用 最先端と 知見に強い StrongⅡ 最先端のマルチ デバイス ウェアラブルに 強い StrongⅢ Mashup Awards 5年連続 受賞 会社名 株式会社テクノモバイル 設 立 2008年 資本金 2,500万円 代 表 播田 誠 従業員数 100名(グループ合計) 本社所在地 〒 107-0062 東京都港区南青山7-1-5 コラム南青山 5F 開発室 〒771-0134 徳島県徳島市川内町平石住吉209-5 徳島健康科学総合センター 3F
  • 21. 21 まずはユーザ登録 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ユーザ登録してください AzureML(Machine Learning) http://azure.microsoft.com/ja-jp/services/machine-learning/
  • 22. 22 ログイン COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. https://studio.azureml.net/?selectAccess=true&o=1 にアクセ スしてください。
  • 23. 23 ワンパターンその1:データを取り込む COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 データを用意します。 ここのtrain.csvを使います。 乗客の情報と生死がCSVデー タになってます。 https://www.kaggle.com/c/titanic-gettingStarted/data Downloadできないひとは講師に問い合わせて。
  • 24. 24 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 Excelで開いてみます。それぞ れのデータの意味は PassengerId=顧客ID Survived=1:生存、0:死亡 Pclass=1:一等席、2:二等席、3:3等席 Name=名前 Sex=性別 Age=年齢 SibSp=同乗している兄弟の人数(自分は数えない) Parch=同乗している親または子供の人数(自分は数えない) ticket=チケットNo fare=料金 1等席はだいたい50〜200,2等席10〜80,3等席7〜50 ポンド:1ポンドの現在価値は0.7万円くらいかな? cabin=客室番号 embarked=乗船した場所 C = Cherbourg; Q = Queenstown; S = Southampton Survivedが知りたい情報です。こ れを目的変数(label)と言いま す。 その他のデータは説明変数 (features)です。 labelは1つだけです。featuresは いくつでもOKです。 labelは0,1のように2つの値だけ を持つようなデータで検証する のが分かりやすいです。
  • 25. 25 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 AzureMLに取り込みます ① ② ⑤train.csvを選択します。 ③ ④ ⑥ DATASETSに 登録されま す。 http://azure.microsoft.com/ja-jp/services/machine-learning/ からログイン または https://studio.azureml.net/?selectAccess=true&o=1
  • 26. 26 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 データを取り込むロジックを 作成します ① ② ③ ④ ⑤ ⑥train.csvをDragDrop この画面で左にある部品をつ なぎあわせながら機械学習の ロジックを組み立てていきます。 以上
  • 27. 27 ワンパターンその2:学習用と評価用にデータを分ける COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ①キーワード検索 ②D&D ③つなぐ 丸いところが接続可能 ④Splitの図 形を選択し て0.6に変更。 6割、4割 にデータが わかれる 6割 4割 以上
  • 28. 28 ワンパターンその3:学習用データを使って学習する COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ① ②ここで6割のデータを 使って学習します。 ③ ④ こんな感じに部品を組み立てましょう。labelの指定が必要なので忘れずに。 Two-Class Bayes Point Machineが学習するロジック(model)になります。これを変 更するといろいろなロジックを試すことが出来ます。0,1のようにlabelが2つの値 を持つならば、Two-Class Bayesが吉! labelが3つ以上の値を保つ場合や実数の場合などはそれに応じてmodelを変更する 必要があります。どのmodelを選ぶのかの目安は、名前にTwo-Class Multi-Classな どのようにわかり易い名前が付いています。教師なしmodelもありますが説明は省 略します。 ⑤TrainModelを選択して ボタンを押す ⑥labelにSurvivedを指定します。 以上
  • 29. 29 ワンパターンその4:学習した結果を使って評価用の データの答えを推測する COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ①ここで4割のデータを推測する こんな感じに部品を組み立てましょう。 ② ③ 以上
  • 30. 30 ワンパターンその5:推測した答えを評価する COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ①ここでScoreModelの結果を評価します こんな感じに部品を組み立てましょう。 ② 以上
  • 31. 31 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 実行 ロジックが出来たので実行し ます ぽちっと押します。キュー(実行待ち) に入るので完了するまで待ちます 終了すると右上にこんな感じに表示されます。
  • 32. 32 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ScoreModelの結果を見ましょう ② ①線をつないでいるポッチを押しましょう。 ③結果が表示されます Splitで分けた4割のデータが表示されます。Scored Labelsが推測した値です。TrainModelでlabel にSurvivedを指定しているのでこの値と比較すれば推測があたっているかどうかわかります。
  • 33. 33 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 EvaluateModelの結果を見ましょう ② ①線をつないでいるポッチを押しましょう。 ③結果が表示されます ScoreModelでは全体的に良い結果なのかどうか判断しにくいのです。そこでEvaluateModelを 使ってざっくりと推測の精度が良いのかどうか判断します。 とりあえず2つだけポイントを抑えればOKです。他にたくさん指標がありますがGoogleなどで 検索すればどのように評価すればよいのか出ています。
  • 34. 34 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 EvaluateModelの結果をみる2つのポイ ント(超初心者用) ROCのグラフは対角線を基準として左上側に線があると精度が良いと 考えます。赤い線のようなのが理想的です。 対角線はちょうど五分五分の精度です(要はランダムに推測した結果 に近い)。 Accuracyが1に近いほど精度が良いです。 現状、ROCは対角線に近 く、Accuracyも1には程遠 いので精度は良くないです ね。。。 ※学習modelによって評価の仕方が変わります
  • 35. 35 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 なにが悪いの? データ? データを良く見てみよう!!
  • 36. 36 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 改めてCSVデータを見ると、 生死に関係なさそうな値や未 入力の値もありそうです。 これらを削除すれば精度が良 くなるのでは?
  • 37. 37 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 未入力データがあるものは行 ごと削除 PassengerId、Nameは生死に 関係ないでしょう ticketも関係なさそう cabinもユニークな番号っぽい ので関係ないのでは?
  • 38. 38 データを綺麗にしよう COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ② ① ③ ④ ⑤ ⑥ProjectColumunsの設定 ⑦MissingValuesScrubberの設定 こんな感じに部品を組み立てましょう。
  • 39. 39 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 再度実行 修正出来たので実行します 結果を待ちましょう。。。 どきどきどきどき
  • 40. 40 EvalutateModelを見ましょう COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 グラフもAccuracy もいい感じ!! 更に精度を高めるには使うデータ の見直し、データを加工して学習 しやすくする、Bayes以外のmodel も試してみる、など試行錯誤して みましょう。
  • 41. 41 他のデータに応用するには? COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. ①データの変更 ②学習ロジックの変更 0,1のように2つの値ならこのままでもOK ③Labelの変更 たった、3箇所を変更するだけ!
  • 42. 42 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 あなたは生き残れるか!!
  • 43. 43 検証データを入力できるようにする COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 AzureMLはAPIとして簡単に インターネットに外部公開で きます。そこからデータを入 力して生き残れるか検証しま す。
  • 44. 44 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ① ② ③4割の検証データの代わりにAPIのデー タを使います ④ こんな感じに部品を組み立てましょう。 Webで検証するための入り口と出口が出来ました!
  • 45. 45 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 これを押すとAPIとして公開されます。押せない時は「RUN」を実行してから再試行します。
  • 46. 46 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 このサービスにアクセスするAPIが公開されます。アクセスするにはプログラムが必要です。ですが 「Test」を使うと検証が簡単にできます。入力するデータはCSVとおなじ内容です。結果は ScoreModelのVisualで表示されるデータと同じです。 入力 結果:Jason
  • 47. 47 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 あなたは生き残れるか!! Survived=1:生存、0:死亡 結果のデータなので適当でOK Pclass=1:一等席、2:二等席、3:3等席 Sex=male,female Age=年齢 SibSp=同乗している兄弟の人数(自分は数えない) Parch=同乗している親または子供の人数(自分は数えない) fare=料金 1等席はだいたい50〜200,2等席10〜80,3等席7〜50 ポンド:1ポンドの現在価値は0.7万円くらいかな? embarked=乗船した場所 C = Cherbourg; Q = Queenstown; S = Southampton 検証!!
  • 48. 48 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 あとは身近なデータでトライ!! コンテストデータはここに https://www.kaggle.com/ 野良データはここにも https://goo.gl/IHxkkO
  • 49. 49 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 http://goo.gl /jGKrYy 書籍が発売されています。 下記のドキュメントなど を読み込みましょう。 http://azure.microsoft.com/ja- jp/services/machine-learning/ さらに勉強するには
  • 50. 50 COPYRIGHT(C) TECHNOMOBILE ALL RIGHTS RESERVED. 6 ・Webサービスの知能化 ・データ分析サービスの追加 ・エンジニアのデータ分析能力向上 ・DeepLearningなど先端技術の導入支援 適用事例(経営者・営業担当の方に)

Editor's Notes

  1. 弊社がご提供しているソリューション内容です。 企画から運営・保守にいたるまでを一気通貫で、 軸となるコンシューマ向けの大規模Webシステムをはじめ、スマホアプリ、ゲーム開発などをご提供しております。 特に大きな実績として、大規模ECシステム、求人検索サイトの開発となっております。 他にも音楽DLサイトや、業務を効率する管理系のシステムの実績も多数あります。 (30秒)