Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
とりあえず
機械学習をやってみた
目次
●
今回の目的
●
自己紹介
●
機械学習って何?
●
どういう準備をしたか
●
学習した結果
●
気がついたこと、反省点
●
次回やりたいこと
このパワポの目的
とりあえず機械学習のソフ
トを触ってみた結果を報告
します
自己紹介
●
鈴木 良(すずき りょう)
●
iOS アプリでご飯食べてます
●
変わった技術のつまみ食いが好きです
●
将来は山奥で仙人暮らしをしたい
自己紹介
●
鈴木 良(すずき りょう)
●
iOS アプリでご飯食べてます
●
変わった技術のつまみ食いが好きです
●
将来は山奥で仙人暮らしをしたい
機械学習は完全未経験です
機械学習って何?
●
あるデータから規則性や特徴を見つけさせ
て、色々便利なことをすること
●
昔からある分野みたいです
●
実は色々な分野で使われているみたいです
( 検索エンジン、スパムメール判定 etc...)
機械学習の流れ
0.4,0.5,11...
データの下処理
学習
行 1 行 2 行 3 行 4
0
2
4
6
8
10
12
学習結果
を使う
データを
集める
機械学習の流れ
0.4,0.5,11...
データの下処理
学習
行 1 行 2 行 3 行 4
0
2
4
6
8
10
12
学習結果
を使う
データを
集める
ここが大事だと思いますが
機械学習の流れ
0.4,0.5,11...
データの下処理
学習
行 1 行 2 行 3 行 4
0
2
4
6
8
10
12
学習結果
を使う
データを
集める
ここに結構時間かかりました
使ったデータ
使ったデータ
競艇のレース結果
使ったデータ
機械学習の勉強用のサンプ
ルデータもあるから、それ
を使ってもいいと思います
(最終的にデータ集めるのに 2 ヶ月かかっ
た・・・)
データの集め方・システム構成
公式データ
(TXT 形式 )
weka
( 機械学習
ツール )
さくら VPS
ローカル PC
weka
( 機械学習
ツール )
Python で
作った変換
プログラム
MySQL
MySQL から
wek...
機械学習ツールについて
●
Weka というソフトを使いました
●
無料です ( ここ重要 )
●
ネットでツールをダウンロードできます
●
色々できるみたいです
今回識別に使ったデータ
●
コースの ID
●
ラウンド
●
ゼッケン
●
進入
●
選手の ID
●
デモタイム
●
モーター ID
●
ボート ID
●
スタートのタイミング
●
レースの時間
前処理について
●
次元数の削減
●
標準化
●
正規化
●
その他パラメータ調整
とりあえず今回は Weka を試すのが目的でし
たので、下記の処理は行っていません。
使った手法
●
ベイズ確率
●
ナイーブベイズ
●
ランダムフォレスト
●
多層パーセプトロン
●
SVM
結果 ( ベイズ確率 )
結果 ( ナイーブベイズ )
結果 ( ランダムフォレスト )
結果 ( 多層パーセプトロン )
結果 (SVM)
今回気がついたこと
●
データを収集するだけでも大変です
●
元データが悪いと何もできません!
(だからログ収集って大事なんだな)
●
きちんとした結果を得るためには、適切な
パラメータを設定する必要がありそうです
●
SVM めっちゃ遅いです...
反省点
●
データ収集プログラムの作成に満足してし
まった
●
とりあえずデフォルトの設定で Weka をい
じったので、色々と分かっていない
次回やりたいこと
●
Weka の設定周りをちゃんと理解できるよ
うにする
●
機械学習の概念や数式をきちんと理解する
次回やりたいこと
●
Weka の設定周りをちゃんと理解できるよ
うにする
●
機械学習の概念や数式をきちんと理解する
一山当てたい
終わり
ご清聴ありがとうございました
Upcoming SlideShare
Loading in …5
×

とりあえず機械学習をやってみた

4,123 views

Published on

機械学習未経験の人間が、データの収集からWeka を使用してそれらしい学習結果を得るまでの資料です

Published in: Science
  • Be the first to comment

とりあえず機械学習をやってみた

  1. 1. とりあえず 機械学習をやってみた
  2. 2. 目次 ● 今回の目的 ● 自己紹介 ● 機械学習って何? ● どういう準備をしたか ● 学習した結果 ● 気がついたこと、反省点 ● 次回やりたいこと
  3. 3. このパワポの目的 とりあえず機械学習のソフ トを触ってみた結果を報告 します
  4. 4. 自己紹介 ● 鈴木 良(すずき りょう) ● iOS アプリでご飯食べてます ● 変わった技術のつまみ食いが好きです ● 将来は山奥で仙人暮らしをしたい
  5. 5. 自己紹介 ● 鈴木 良(すずき りょう) ● iOS アプリでご飯食べてます ● 変わった技術のつまみ食いが好きです ● 将来は山奥で仙人暮らしをしたい 機械学習は完全未経験です
  6. 6. 機械学習って何? ● あるデータから規則性や特徴を見つけさせ て、色々便利なことをすること ● 昔からある分野みたいです ● 実は色々な分野で使われているみたいです ( 検索エンジン、スパムメール判定 etc...)
  7. 7. 機械学習の流れ 0.4,0.5,11... データの下処理 学習 行 1 行 2 行 3 行 4 0 2 4 6 8 10 12 学習結果 を使う データを 集める
  8. 8. 機械学習の流れ 0.4,0.5,11... データの下処理 学習 行 1 行 2 行 3 行 4 0 2 4 6 8 10 12 学習結果 を使う データを 集める ここが大事だと思いますが
  9. 9. 機械学習の流れ 0.4,0.5,11... データの下処理 学習 行 1 行 2 行 3 行 4 0 2 4 6 8 10 12 学習結果 を使う データを 集める ここに結構時間かかりました
  10. 10. 使ったデータ
  11. 11. 使ったデータ 競艇のレース結果
  12. 12. 使ったデータ 機械学習の勉強用のサンプ ルデータもあるから、それ を使ってもいいと思います (最終的にデータ集めるのに 2 ヶ月かかっ た・・・)
  13. 13. データの集め方・システム構成 公式データ (TXT 形式 ) weka ( 機械学習 ツール ) さくら VPS ローカル PC weka ( 機械学習 ツール ) Python で 作った変換 プログラム MySQL MySQL から weka 用の データを引っ 張る データを curl で 持ってくる
  14. 14. 機械学習ツールについて ● Weka というソフトを使いました ● 無料です ( ここ重要 ) ● ネットでツールをダウンロードできます ● 色々できるみたいです
  15. 15. 今回識別に使ったデータ ● コースの ID ● ラウンド ● ゼッケン ● 進入 ● 選手の ID ● デモタイム ● モーター ID ● ボート ID ● スタートのタイミング ● レースの時間
  16. 16. 前処理について ● 次元数の削減 ● 標準化 ● 正規化 ● その他パラメータ調整 とりあえず今回は Weka を試すのが目的でし たので、下記の処理は行っていません。
  17. 17. 使った手法 ● ベイズ確率 ● ナイーブベイズ ● ランダムフォレスト ● 多層パーセプトロン ● SVM
  18. 18. 結果 ( ベイズ確率 )
  19. 19. 結果 ( ナイーブベイズ )
  20. 20. 結果 ( ランダムフォレスト )
  21. 21. 結果 ( 多層パーセプトロン )
  22. 22. 結果 (SVM)
  23. 23. 今回気がついたこと ● データを収集するだけでも大変です ● 元データが悪いと何もできません! (だからログ収集って大事なんだな) ● きちんとした結果を得るためには、適切な パラメータを設定する必要がありそうです ● SVM めっちゃ遅いです。というかベイズ以 外大体実行結果が出るまで時間がかかりま す
  24. 24. 反省点 ● データ収集プログラムの作成に満足してし まった ● とりあえずデフォルトの設定で Weka をい じったので、色々と分かっていない
  25. 25. 次回やりたいこと ● Weka の設定周りをちゃんと理解できるよ うにする ● 機械学習の概念や数式をきちんと理解する
  26. 26. 次回やりたいこと ● Weka の設定周りをちゃんと理解できるよ うにする ● 機械学習の概念や数式をきちんと理解する 一山当てたい
  27. 27. 終わり ご清聴ありがとうございました

×