Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
5分でわかる
怖くない機械学習
プログラミング生放送勉強会LT
自己紹介
じょんすみす(ひらがな) これ→
@__john_smith__
※フォローしないこと推奨
どこにでもいる普通のアル中
願望
北海道帰りたい
彼女欲しい
彼女欲しい
データ分析系の勉強会じゃないので
緩めの話をします
何だかよくわからなくてとりあえず使ってみよう
※ほんとはダメです
「やりたい!」って言ってる人は難しそうだとなんどと言ってやらない
エンジニアはとりあえず動いてるもの見た方が理解しやすいのです
ちゃんとやりたい人はいい結果が出せるように
ちゃん...
機械学習って単語を聞いたことがある人
機械学習をやったことがある人
※手を挙げた人は寝ててください
機械学習ってなんなの?
関連商品のレコメンド(オススメ)
広告のクリック率予測・表示するかの判定
検索結果のランキング
などなど、もはやみんな呼吸するのと同じくらい
ナチュラルに使ってる
機械学習ってなんなの?
簡単なもの
機械学習ってなんなの?
簡単なもの
機械学習ってなんなの?
簡単なもの
この線を引きたい
機械学習ってなんなの?
簡単なもの
男性
女性
機械学習ってなんなの?
魔法じゃない
全てを完璧に予想することはできません
データが持っている情報に依存します
結果はデータに依存
この入力ならこの出力見たいのが予想しづらい
だから単体テストみたいなのもしづらい
機械学習ってなんなの?
予測するのが目的
答えがわかってるデータからパターンを発見する
答えがわかってないデータの答えを予測
データの数が大事
データが少ないなら人間に任せた方がいい
データが大量な時に機械の方が優れる
凛ちゃん分類
http://www.lovelive-anime.jp/member/member05.html
http://www.mbga.jp/_game_intro?game_id=12008305
http://www.fate-s...
凛ちゃん情報
2chの各凛ちゃんについて語られているスレ
作品自体のスレ、複数キャラや凛ちゃん同士の
比較スレは使わない
1000まで行ったものを2スレッド分使用
凛ちゃんごと2000件のデータ
URLやアンカーは削除
その結果何も残らなかった...
ぶんるい!
Jubatus:機械学習のフレームワーク
機械学習する上での面倒な部分が省略できる
割と簡単に使える
http://jubat.us/ja/
形態素解析
プロ生ちゃんまじ天使を
プロ生ちゃん / まじ / 天使 のように分解
分解し...
ぶんるい!
簡単Jubatus
jsonで設定
ほぼexampleのコピペ
ぶんるい!
簡単Jubatus
ぶんるい!
簡単Jubatus
学習
スコアが一番高い凛ちゃんを予測値として取得
各レスごとに単語と出現回数をHashで持たせたら…
{“プロ生ちゃん” => 1, “まじ” => 1, “天使” => 1}
Hashどの凛ちゃんの話題か
ぶんるい!
ぶんるい!
↓
こ
れ
が
正
解
→こう予想した
ぶんるい!
完璧じゃない!
ぶんるい!
ぶんるい!
なんか頑張って2次元に落とし込んだら
それっぽい情報が確認できる
ぶんるい!
ぶんるい!
データは多い方がいい
多すぎると集めるコストがつらい
ぶんるい!
ちなみにこの形から
わかることもあります
けつろん!
とりあえずやってみるといいよ
勉強しだすときりがない
動いてるとこから確かめるとイメージしやすい
ただし、実用レベルならいろいろ知らないとダメ
賢いかわいいエリーチカ
ソース
https://github.com/john-smit...
ぶんけん!
入門機械学習
数式なし
使用言語:R
戦略的データサイエンス入門
機械学習自体について詳しく扱ってる訳ではない
モデルの出力結果の見方、解釈の仕方などの参考に
オンライン機械学習(MLPシリーズ)
数式でてくるが、疑似コードあり
J...
Upcoming SlideShare
Loading in …5
×

5分でわかる 怖くない機械学習

1,629 views

Published on

プログラミング生放送のLT

Published in: Engineering

5分でわかる 怖くない機械学習

  1. 1. 5分でわかる 怖くない機械学習 プログラミング生放送勉強会LT
  2. 2. 自己紹介 じょんすみす(ひらがな) これ→ @__john_smith__ ※フォローしないこと推奨 どこにでもいる普通のアル中 願望 北海道帰りたい 彼女欲しい 彼女欲しい
  3. 3. データ分析系の勉強会じゃないので 緩めの話をします
  4. 4. 何だかよくわからなくてとりあえず使ってみよう ※ほんとはダメです 「やりたい!」って言ってる人は難しそうだとなんどと言ってやらない エンジニアはとりあえず動いてるもの見た方が理解しやすいのです ちゃんとやりたい人はいい結果が出せるように ちゃんと勉強してください
  5. 5. 機械学習って単語を聞いたことがある人 機械学習をやったことがある人 ※手を挙げた人は寝ててください
  6. 6. 機械学習ってなんなの? 関連商品のレコメンド(オススメ) 広告のクリック率予測・表示するかの判定 検索結果のランキング などなど、もはやみんな呼吸するのと同じくらい ナチュラルに使ってる
  7. 7. 機械学習ってなんなの? 簡単なもの
  8. 8. 機械学習ってなんなの? 簡単なもの
  9. 9. 機械学習ってなんなの? 簡単なもの この線を引きたい
  10. 10. 機械学習ってなんなの? 簡単なもの 男性 女性
  11. 11. 機械学習ってなんなの? 魔法じゃない 全てを完璧に予想することはできません データが持っている情報に依存します 結果はデータに依存 この入力ならこの出力見たいのが予想しづらい だから単体テストみたいなのもしづらい
  12. 12. 機械学習ってなんなの? 予測するのが目的 答えがわかってるデータからパターンを発見する 答えがわかってないデータの答えを予測 データの数が大事 データが少ないなら人間に任せた方がいい データが大量な時に機械の方が優れる
  13. 13. 凛ちゃん分類 http://www.lovelive-anime.jp/member/member05.html http://www.mbga.jp/_game_intro?game_id=12008305 http://www.fate-sn.com/chara/ http://iwatobi-sc.com/#x-character 星空凛 渋谷凛 遠坂凛 松岡凛 この4人のうち誰の、 話題なのかを予想するプログラムを作ってみる
  14. 14. 凛ちゃん情報 2chの各凛ちゃんについて語られているスレ 作品自体のスレ、複数キャラや凛ちゃん同士の 比較スレは使わない 1000まで行ったものを2スレッド分使用 凛ちゃんごと2000件のデータ URLやアンカーは削除 その結果何も残らなかったものはそれ自体削除 7600件くらいまで減った AAはあえて残してみる 学習に6000件、残りはテスト用
  15. 15. ぶんるい! Jubatus:機械学習のフレームワーク 機械学習する上での面倒な部分が省略できる 割と簡単に使える http://jubat.us/ja/ 形態素解析 プロ生ちゃんまじ天使を プロ生ちゃん / まじ / 天使 のように分解 分解した各要素の出現回数とどの凛ちゃんの話 題かの情報をJubatusに渡すだけ
  16. 16. ぶんるい! 簡単Jubatus jsonで設定 ほぼexampleのコピペ
  17. 17. ぶんるい! 簡単Jubatus
  18. 18. ぶんるい! 簡単Jubatus 学習 スコアが一番高い凛ちゃんを予測値として取得 各レスごとに単語と出現回数をHashで持たせたら… {“プロ生ちゃん” => 1, “まじ” => 1, “天使” => 1} Hashどの凛ちゃんの話題か
  19. 19. ぶんるい!
  20. 20. ぶんるい! ↓ こ れ が 正 解 →こう予想した
  21. 21. ぶんるい! 完璧じゃない!
  22. 22. ぶんるい!
  23. 23. ぶんるい! なんか頑張って2次元に落とし込んだら それっぽい情報が確認できる
  24. 24. ぶんるい!
  25. 25. ぶんるい! データは多い方がいい 多すぎると集めるコストがつらい
  26. 26. ぶんるい! ちなみにこの形から わかることもあります
  27. 27. けつろん! とりあえずやってみるといいよ 勉強しだすときりがない 動いてるとこから確かめるとイメージしやすい ただし、実用レベルならいろいろ知らないとダメ 賢いかわいいエリーチカ ソース https://github.com/john-smith/jubatus_rin_chan ぜひ、実際に動かしてみてください 「Jubatusハンズオン」とかでググってみると もっと詳しくわかります
  28. 28. ぶんけん! 入門機械学習 数式なし 使用言語:R 戦略的データサイエンス入門 機械学習自体について詳しく扱ってる訳ではない モデルの出力結果の見方、解釈の仕方などの参考に オンライン機械学習(MLPシリーズ) 数式でてくるが、疑似コードあり Jubatusの中の人が書いてる 言語処理のための機械学習入門 数式使って理論知りたい人向け 高校レベルの数学がわかってれば読める

×