Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

初心者向けに機械学習のハンズオンセミナーをしてわかったこと

1,369 views

Published on

#dslt祭り

Published in: Engineering
  • Be the first to comment

初心者向けに機械学習のハンズオンセミナーをしてわかったこと

  1. 1. 初⼼者向けに機械学習のハンズオン セミナーをしてわかったこと じょんすみす
  2. 2. 誰? • じょんすみす • @__john_smith__ • どこにでもいる普通のアル中 これ→
  3. 3. 今⽇話すことは... 「ですよねー」的な感じの話です この話から得られる学びは特に無いと思います
  4. 4. やったこと Java Doという勉強会で機械学習のハンズオン http://javado.connpass.com/ 北海道のJavaユーザグループ ほぼ同じ内容を場所を変えて⼆回くらいやった これ→
  5. 5. 地⽅勉強会のツラみ この釣りまくりなタイトルと内容で
  6. 6. 地⽅勉強会のツラみ この釣りまくりなタイトルと内容で この⼈数である
  7. 7. 地⽅勉強会のツラみ この釣りまくりなタイトルと内容で この⼈数である 別な回でJava界隈では⾮常に有名な寺⽥佳央さんが登壇しても 定員には届かなかったようである
  8. 8. 地⽅勉強会のツラみ 東京にばっか⼈集まりすぎなんだよ! なんのためのITだよ!!
  9. 9. と、それはさておき本題
  10. 10. 数式、ダメ、絶対。 • 数式出して説明してもいい? • みんな⾸を横に振ります • 気になる⼈は後で資料⾒てね! • 資料に数式載せるのって結構苦⾏ですよねw • でもたぶん誰も⾒てくれないんだろうなぁ • 正直ライブラリ使うだけならそこまで知らなくても • ⾦儲けが⼤正義って部分もある • オフライン評価でいい感じでも出してみたら・・・ってことあります よね?
  11. 11. 数式、ダメ、絶対。 なぜみんな数式が怖いのか考えてみた 機械学習でよく出てくるもの
  12. 12. 数式、ダメ、絶対。 なぜみんな数式が怖いのか考えてみた 機械学習でよく出てくるもの Σ 条件付き確率 微分
  13. 13. 数式、ダメ、絶対。 なぜみんな数式が怖いのか考えてみた 機械学習でよく出てくるもの Σ 条件付き確率 微分 これだけでもみんなのトラウマ
  14. 14. 数式、ダメ、絶対。 なぜみんな数式が怖いのか考えてみた 機械学習でよく出てくるもの Σ 条件付き確率 微分 これだけでもみんなのトラウマ log? exp? なにそれおいしいの?
  15. 15. 数式、ダメ、絶対。 たぶんこんな感じ 数学ダメです!というか算数のころからダメです! 公式に当てはめて問題解くのはできます! 数式の意味を理解して与えられた問題を解くのに使えます! サイヤ⼈の限界を超えている⼈
  16. 16. 数式、ダメ、絶対。 たぶんこんな感じ 数学ダメです!というか算数のころからダメです! 公式に当てはめて問題解くのはできます! 数式の意味を理解して与えられた問題を解くのに使えます! サイヤ⼈の限界を超えている⼈ 初めからPRLMとか読んで ⾃⼒で理解する このレベルの⼈は ヤムチャ視点で眺める
  17. 17. 数式、ダメ、絶対。 たぶんこんな感じ 数学ダメです!というか算数のころからダメです! 公式に当てはめて問題解くのはできます! 数式の意味を理解して与えられた問題を解くのに使えます! サイヤ⼈の限界を超えている⼈ ここがターゲットになる
  18. 18. 数式、ダメ、絶対。 たぶんこんな感じ 数学ダメです!というか算数のころからダメです! 公式に当てはめて問題解くのはできます! 数式の意味を理解して与えられた問題を解くのに使えます! サイヤ⼈の限界を超えている⼈ 久しく触れていないから 忘れてる ⾼校レベル(かそれ以下)から ⾃⼒で勉強できる
  19. 19. 数式、ダメ、絶対。 たぶんこんな感じ 数学ダメです!というか算数のころからダメです! 公式に当てはめて問題解くのはできます! 数式の意味を理解して与えられた問題を解くのに使えます! サイヤ⼈の限界を超えている⼈ 別途⼿段を考える 場合によっては数学的な部分 はボカシ通すのもあり?
  20. 20. 数式、ダメ、絶対。 たぶんこんな感じ 数学ダメです!というか算数のころからダメです! 公式に当てはめて問題解くのはできます! 数式の意味を理解して与えられた問題を解くのに使えます! サイヤ⼈の限界を超えている⼈ いずれにせよ1回のハンズオン では無理っぽい から数式は出さないほうがいい
  21. 21. 学習→評価は何をしてるかイメージしづらい データ 前処理 学習 モデル 評価 予測 だいたいのフローの簡易図
  22. 22. 学習→評価は何をしてるかイメージしづらい データ 前処理 学習 モデル 評価 予測 だいたいのフローの簡易図 前処理は⾟いので 必要の無いデータセットか 事前にやったデータを⽤意
  23. 23. 学習→評価は何をしてるかイメージしづらい データ 前処理 学習 モデル 評価 予測 だいたいのフローの簡易図 ライブラリを使うと サクッと出来てしまうので 何したかイメージしづらい
  24. 24. 学習→評価は何をしてるかイメージしづらい データ 前処理 学習 モデル 評価 予測 だいたいのフローの簡易図 Accはまだしも Precision, Recallあたりからは 眠そうな⼈が出る ここの説明は薄くする 詳細はReferenceに譲る
  25. 25. 学習→評価は何をしてるかイメージしづらい データ 前処理 学習 モデル 評価 予測 だいたいのフローの簡易図 ここが⼀番 挙動をイメージしやすいっぽい いろいろ試してみる時間では だいたいみんなここで遊ぶ
  26. 26. 学習→評価は何をしてるかイメージしづらい データ 前処理 学習 モデル 評価 予測 だいたいのフローの簡易図 遊んでみやすデータセットを ⽤意するといい感じになる
  27. 27. 遊びやすいデータは? • Titanicがとても良かった • タイタニック号と処⼥航海で沈没したことが有名 • 変数をどういじってみればいいかわかりやすい • pclass, age, sexあたりをのこして⽋損値を除去みたいな簡易化してもいける • 2値分類なので⼊⾨としてもやりやすい
  28. 28. 遊びやすいデータは? みんなとりあえず⾃分の情報を⼊れてみる
  29. 29. 遊びやすいデータは? みんなとりあえず⾃分の情報を⼊れてみる そしてだいたいみんな死ぬ
  30. 30. 遊びやすいデータは? みんなとりあえず⾃分の情報を⼊れてみる そしてだいたいみんな死ぬ という流れまで含めてつかみはOK
  31. 31. 今後どうするかとか • 今後も興味を持っていろいろやってみてもらえるきっかけにな れたかまでは不明 • Referenceは⼊⾨からガチまで取り揃えておいたが果たしてそれらを 読むきっかけにまでなりきれたか・・・ • 実際の利⽤シーンを想像してもらうのが難しかったかもしれない

×