Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Machine Learning Nagoya 20170619

2,832 views

Published on

機械学習 名古屋 第11回勉強会の発表資料「賢いAIへの道 ~データ収集・アノテーション~」です。

Published in: Technology
  • Download this 3-step guide to generating insane amounts of media coverage for your from LinkedIn: http://bit.ly/linkedin3stepguide
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

Machine Learning Nagoya 20170619

  1. 1. 賢 い A I へ の 道 来栖川電算 取締役 山口陽平機械学習 名古屋 第11回勉強会 2017.6.19 デ ー タ 収 集 & ア ノ テ ー シ ョ ン
  2. 2. 今日話すこと 1. はじめに 2. 機械学習 3. アノテーション 4. データ収集 5. まとめ 6. 最近の取り組み 2
  3. 3. はじめに 自己紹介 & 会社紹介 3
  4. 4. 山 口 陽 平 @melleo1978 • 所属 & 経歴 – 有限会社 来栖川電算 取締役 – 名古屋工業大学大学院 博士前期課程修了 – IPA未踏ソフトウェア創造事業 採択 – Mashup Awards 9 優秀賞受賞 • 自己紹介 企画から実装まで全部やる人 – AI技術 & アルゴリズム の研究開発 • 文字認識,物体認識,動作認識,行動認識 – 言語処理系 の研究開発 • 分散DB,仮想機械,コンパイラ • 好きなサービス AWS Lambda ※実物に髪の毛はありません。 4
  5. 5. 山 口 陽 平 @melleo1978 • [実践]画像認識 を執筆 WEB+DB PRESS Vol.83 – これから画像認識をはじめる人におススメ 5 – OpenCV の使い 方や実装例 – SIFTなどの各種 アルゴリズムや 特定物体認識の しくみ – 精度改善への取 り組み方
  6. 6. 来栖川電算 設立 2003年(名古屋工業大学発ベンチャー) 従業員 40人 • SF世界の技術を実現し、社会に役立てる – 人工知能技術のライセンス販売・研究・SI • 文字認識,物体認識,動作認識,行動認識 – スマホアプリの企画・制作・運営 スマートライフ技術 NTTドコモ様との共同研究 スマートドライブ技術 大手自動車メーカー様むけ メイドさん もふくめて 6
  7. 7. 来栖川電算 様々なアルゴリズムを駆使する技術者集団 • 様々な認識技術 – 文字認識,物体認識,モーション認識 • 限界性能を引き出す優れた実装技術 – 機械学習・コンパイラ・データベース・仮想 機械などのアルゴリズムとバイナリハック • 高速化,並列化,分散化,省空間化,高精度化 • ビジネスを差別化する認識エコシステム – スケールに応じた仕組,競争力の自動強化 7
  8. 8. コミュニティ活動 おせわになってたり、スタッフしてたりする 8
  9. 9. 機械学習 名古屋 http://machine-learning.connpass.com/ 9
  10. 10. TensorFlow User Group http://tfug-tokyo.connpass.com/ 10
  11. 11. 『FP in Scala』読書会 @名古屋 http://fp-in-scala-nagoya.connpass.com/ 11
  12. 12. JAWS-UG https://jaws-ug.jp/ 12
  13. 13. 機械学習 ざっくり紹介 13
  14. 14. 機械学習 人間の学習能力や推論能力を機械に模倣させる手法 • 学習 – 与えられた現象を説明できる法則を得ること • 推論 – 法則に従って与えられた現象を説明すること 14 現象 既知のデータ 法則 モデル 現象 未知のデータ 学習 推論 モデル = プログラム + パラメータ 例:数式,論理式,ホーン節,決定木,オートマトン,確率分布,…
  15. 15. プログラマ視点 機械学習 = 自動プログラミングの一種 • 仕様(法則)が不明でも適用可能 – 具体的なデータ(現象)で仕様を雑に規定 • 不正確な推論 – データの網羅性・正確性に依存 15 現象 既知のデータ 法則 モデル 現象 未知のデータ 学習 推論 伝統的手法:モデルを直接記述 機械学習:データでモデルを間接記述
  16. 16. 応用 画像やセンサデータの解析には特に有効 16 なりきり2.0 ヒーローの動きでゲームを制御 毎朝体操 腕の動きで体操採点するアプリ 動作推定API 加速度センサで人の行動を推定 AR付箋 書籍の中身を検索するアプリ Cellars ワインラベルで情報検索するアプリ 画像認識API 賞品パッケージで情報検索するAPI タンゴチュウ 写真に写る単語を抽出するサービス 地図生成 オルソ画像から地物・交通規則を抽出 走行データ解析 周辺環境を認識し、様々な解析に活用
  17. 17. 取り組み方 精度が足りなくても使えるシステムにするのが重要 1. タスク設計 重要度:40% • システム全体のデータフローの設計 • 機械学習を適用する機能と入出力の明確化 2. データ収集・アノテーション 重要度:40% • データの質・量・時期の計画 • アノテーションルールの明確化・改良 3. 機械学習 重要度:20% • パイプライン(学習・推論)の設計・改良 • 訓練・検証・ハイパーパラメータの調整 17
  18. 18. 体制 データ入力 から アプリ開発 までワンストップ 18
  19. 19. 少し前の手法 膨大な軽量特徴 × 集団学習 ⇒ そこそこイケル • 膨大な軽量特徴 – 高速に計算できる特徴を機械的に大量生成 • 平均,Haar-like特徴,勾配ヒストグラム,… • 集団学習 – 膨大な特徴の組み合わせを効率的に探索 • BoostedTrees,RandomForest,AdaBoost,… 19 データ 特徴ベ クトル モデル 特徴 抽出 機械 学習
  20. 20. 最近の手法 深層学習 ⇒ かなりイケル • 深層学習 – 多段モデル(複雑な法則)の一気通貫学習 • 中段モデル(間接法則)の獲得 ⇒ 特徴抽出の獲得 – 新パラダイム:マルチタスク学習,転移学習 • 中段モデルの共有・転用 • 中段モデルへの情報の埋め込み 20 入力 モデル1 出力モデル2 モデル3
  21. 21. 進化の結果 以前よりもモデルがデータによく適合する • データ整備による精度改善が容易に! 21 推論の誤り データの不足・誤り データ収集・アノテーションの改善 モデルの改善
  22. 22. アノテーション 簡単そうに見えて難しい 22
  23. 23. アノテーション データに対する説明 学習や選別に利用 • タスクの内容や学習のさせ方により様々 – トレードオフ:量,正確さ,精密さ,… 23 出典: google street view出典: google street view出典: google street view 種類選択 ⇒ 識別タスク 矩形選択 ⇒ 検出タスク 画素選択 ⇒ 分割タスク
  24. 24. Q. 自動車, 歩行者 隠れ,はみだし,小さい,多い,… 24 出典: google street view
  25. 25. Q. 歩行者, 自転車 マネキン,ポスター,信号,転倒,映り込み,… 25 出典: google street view
  26. 26. Q. 看板 標識,旗,裏返り,細長い,… 26 出典: google street view
  27. 27. Q. 看板 壁や窓の文字・ロゴ・ポスター,カニ,… 27 出典: google street view
  28. 28. 悩ましさへの対処 すぐに相談できる体制 × ルールの継続的改善 • 状況の共有 & AIエンジニアによる判断 – 勝手な判断は、ばらつきを増やす。 – 似た別のタスクへの変更もありうる。 • 全員が同じ判断を下せる基準 – 迷うと時間がかかり、ばらつきも増える。 • 様子を記録するフラグ – 様子によって記録の有無を変えると漏れる。 – 悪影響を抑えつつ手間がかかるものを除外できる。 • 品質や生産性の測定 – ルール変更に伴うばらつきやペースの変化を知る。 28
  29. 29. 他の悩ましさ 悩ましいのはデータだけではない • アノテーションタスクを独り占めする人 – 一度に確保できるタスク量を制限する。 • 易しいタスクばかり選り好みする人 – タスクを選べないように制限する。 • 真面目に仕事せず報酬を得ようとする人 – クラウドソーシング(クラウド上の不特定多 数の力を借りる場合)やボットによる攻撃な ど。品質評価用のタスクを混ぜて、悪意があ る人を選別する仕組が必要となる。 29
  30. 30. AnnotationFactory 近いうちに公開予定 来栖川電算のノウハウが詰まったクラウドサービス 30
  31. 31. データ収集 地味だけど、ここで勝負が決まる 31
  32. 32. データ収集 本番環境に近いデータを収集できればOK • 本番環境からのデータ収集 – 十分に監視できないため、不適切なデータが多い が、網羅性は高く、真の分布に近い。 • 統制環境からのデータ収集 – 十分に監督できるため、不適切なデータが少ない が、網羅性が低く、真の分布とは異なる。 • データ加工(シミュレーションも含む) – 収集データを背景知識に基づいて加工することで、 不適切なデータを減らし、網羅性を高める。疑似 的に真の分布に近づける。 32
  33. 33. 量と網羅性 各法則が支配する領域から適度に収集できればOK • 桃枠:白枠(収集データ)で説明できる領域 33 単一の法則に支配される世界 領域ごとに異なる法則に支配される世界
  34. 34. データ収集の例 音楽に合わせて体操 ⇒ ユーザによる教師作成 • 教師データ = 音楽の再生開始からの秒数 – 継続している人のデータを信用 – 一見してダメなデータを除外 34 これだけやっても かなりノイジー
  35. 35. データ加工 できるだけ網羅性が高く正確なデータセットを構築 • クレンジング – データ収集・アノテーションの過程・都合で 混入する誤りの除去 • オーギュメント – データ収集・アノテーションの過程・都合で 収集できないバリエーションの水増し • リバランス – 学習を失敗させるほどの強烈な偏りの解消 35
  36. 36. データ加工の例 AIエンジニアがモデルを評価しながら何度も調整 • 例:アノテーションされていない正事例 – 正事例の付近を観察すると、問題となる現象 があまり起きていない。正事例から少し離れ た領域から負事例をサンプリングする。 • 例:正事例とセットで出現する負事例 – 楽だからと負事例しか含まれていないデータ セットから負事例をサンプリングしたら、正 事例とセットで出現する負事例が学習に使わ れなくて誤検出だらけになった。 36
  37. 37. 実験スケジューラ 深層学習の実験環境 37
  38. 38. DNNコンパイラ かなり前からモバイルでの活用実績がある 38
  39. 39. まとめ 要するにAIエンジニアが何をやっているか 39
  40. 40. まとめ アルゴリズム研究も重要だけど、主な仕事はコレ • 機械学習 – 深層学習によりモデルがデータによく適合するの でデータ整備による精度改善がやりやすくなった。 • アノテーション – ルールが成熟するまでは丸投げできる単純作業で はない。データから得た知見から、明瞭なルール を考案、よりよいタスクへ再定義することが仕事。 • データ収集 – 推論結果を観察し、データの不足や誤りを見抜き、 解消するデータ加工を高速に回すことが仕事。 40
  41. 41. 最近の取り組み あれれ?時間があまった? 41
  42. 42. KCI ObjDetect 超軽量な深層学習ベースの物体検出器 • SSDを超える精度を1/100の計算量で実現 ※SSD:2016年に速くて賢いと話題になった深 層学習ベースの手法(Faster R-CNN や YOLO の改良) • 事例:ペタバイトクラスの動画解析 – GPU 代や電気代の大幅な節約 42 手法 Precision Recall F-measure 処理時間 SSD (state-of-the-art in 2016) 82.58 % 63.87 % 72.03 % 107.90 秒 KCI ObjDetect / accurate 84.38 % 77.69 % 80.10 % 1.45 秒 KCI ObjDetect / fast 72.93 % 73.84 % 73.39 % 1.15 秒 ※各手法の計算量を比較可能にするために、同一の CPU 環境で 1 CORE のみを使用して測定
  43. 43. 毎朝体操 いつでも、どこでも、すぐできる • Android & iPhone ⇒ http://maiasa.jp/ 43
  44. 44. 210,000 DL 突破 115 ヶ国の 20 ~ 50 代女性が自宅・職場・旅先で活用 44 0.0% 10.0% 20.0% 30.0% 40.0% 18~24歳 25~34歳 35~44歳 45~54歳 55~64歳 65歳以上 男 32.7 %女 67.3 % 15053 いいね!
  45. 45. マグニチュード 4 みんなの 「消費熱量」の合計がヤバい! • ラジオ体操:軽く汗ばむほどの強度 熱量 状況 1.770 GJ 質量1kgの物体が木星の引力圏から脱出 するために必要な運動エネルギー 2.000 GJ マグニチュード3の地震のエネルギー 4.184 GJ TNT火薬1トンの爆発のエネルギー 8.532 GJ 世界の人口1人あたりの年間消費電力量 (2002年) 13.581 GJ 毎朝体操の総熱量 2014年6月22日時点 62.059 GJ 毎朝体操の総熱量 2017年6月16日時点 64.100 GJ マグニチュード4の地震のエネルギー 運動強度 状況 2.0 METS 電車の中で立っている 3.0 METS 庭仕事・野球の野手 3.5 METS 平地での自転車 4.0 METS ラジオ体操第1・ハイ キング・速足 4.5 METS ラジオ体操第2 6.0 METS 階段昇降・卓球 9.0 METS 水泳・高強度の長距離 走・筋力トレーニング 45
  46. 46. Mashup Awards 9 日本最大級のアプリコンテストで「優秀賞」獲得 46 ※引用元:http://jp.techcrunch.com/2013/11/14/mashup-award-9/
  47. 47. コンテスト以降 「風変わり」なアプリなので様々なメディアが注目 • アプリソムリエ – 【石井寛子アプリ事始】「毎 朝体操」超最先端ラジオ体操 第1!? • 週刊朝日 – 【おすすめアプリ生活】あな たの“ラジオ体操度”が測れる 「毎朝体操」 • 日経新聞 – 職場で気軽に体ほぐし ヨ ガ・体操…お助けアプリ • 文化放送 – ドコモ団塊倶楽部 アプリ紹 介コーナー(生放送) 47
  48. 48. TFUG Tokyo #1 2016.10.13 NHK「おはよう日本」で紹介 48
  49. 49. TFUG Tokyo #1 噂の「ラジオ体操する IT 勉強会」の全貌が明らかに 49
  50. 50. Google I/O 2017 TensorFlow のモバイル応用例として紹介 50 ※引用元:https://events.google.com/io/schedule/?section=may-19&sid=33fb7070-294d-4443-b651-e407c730c32f
  51. 51. 事例:アプリ化 JFE スチール株式会社『アクティブ体操®partⅡ』 • 転倒災害 – 職場の高齢化、現代人の運 動不足により深刻化 • 転倒予防体操 – コケそうな状況で踏ん張れ る足腰を作るため、股関節 を中心に下肢の筋力、柔軟 性、バランスの向上に効果 のある運動で構成 51 2016年 12月~
  52. 52. アクティブ体操®partⅡ 立ち仕事が多い業界の約 30 社が採用:工場,電力,化粧品,… 52 ※引用元:2017.6.6 NHK「おはよう日本」
  53. 53. 求人 深層学習の仕事がしたい人! まじめな研究開発がしたい人! 53
  54. 54. スタッフ募集中 学生さん、転職者さん、力を貸して! • 研究(認識技術) – 機械学習・アルゴリズム・高速化・省メモリ・画 像・センサーに関する知識,Java,C++ • 開発(サーバサイド) – プロセス・アーキテクチャ・ミドルウェア・ネッ トワークに関する知識,Scala,Java,C++ • 開発(フロントエンド) – UI/UX・Android・iOSに関する知識,JavaScript • 企画(認識アプリ・認識サービス) – 新しい習慣を考える力,普及のためのアイデア 54
  55. 55. 新オフィス 勉強会 もやってるよ! メイドさん お手製の夕食も出るよ! • 新オフィス – 移転:2016 年 6 月 – 面積:以前の 2 倍! • 最寄駅 – JR中央線 鶴舞駅 – 名古屋市営地下鉄 • 鶴舞線 鶴舞駅 • 名城線 矢場町駅 • 桜通線 新栄駅 55 いつでも 見学OK
  56. 56. 情景画像文字認識 技術紹介① 56
  57. 57. 情景画像文字認識とは スマホなどで撮影した画像から文字を読み取る 57
  58. 58. 情景画像文字認識とは 様々なパース、様々なレイアウト、様々な書体 58
  59. 59. 情景画像文字認識とは いわゆる “OCR” とは ”扱う画像” が違う • 悪環境下での文字認識 – 手書き・様々な書体・かすれ・点描・きつい パース・統一性のない並び・逆光・陰・影・ グラデーション・モアレなど • 使える場面 – 屋外でのスマホカメラを使った棚卸し – 車載カメラからの標識認識 – 商品パッケージからの成分情報抽出 – キーワードによるアルバム・ビデオの頭出し 59
  60. 60. 事例:タンゴチュウ Twitter で情景画像文字認識を体験できるサービス 60
  61. 61. 物体認識 技術紹介② 61
  62. 62. 物体認識とは 画像中の物体の種類・位置・姿勢を推定 62
  63. 63. 物体認識とは 様々な向き・ポーズを学習させ見えの多様性を獲得 • 特定物体認識は素人でも簡単に使える – どんな画像を学習に使うかを学べばOK 63
  64. 64. 物体認識とは モノをカウント、見た目で分からない情報を表示 • 使える場面 工場内で箱の仕分け 体験や評判の調査 ワインラベルで情報検索 AR付箋 集めて応募キャンペーン ARフィギュア 64
  65. 65. 事例:1000sors 誰でも簡単に使えるクラウド型物体認識エンジン • 広い適用範囲 – 照明姿勢の変化に強く、様々な撮影環境に対応 • 驚異的な精度 – 数十万種類をほぼ完ぺきに識別 • 圧倒的な性能 – たった1台のPCで100万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト 65
  66. 66. 事例:1000sors 手元の画像で精度や速度をすぐに確認可能 • ShotPreview for Android / iOS ①設定 ②撮影 ③確認 66
  67. 67. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ • きついパースも、帯による隠れも、OK 67
  68. 68. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ • よく似ていても、複数冊同時も、OK 68
  69. 69. 事例:Cellars 18万件のワインラベルを認識するアプリ • 世界で賞を獲得したアプリをダウンロード! – Asia Smartphone Apps Contest • 広告マーケティング部門 Silver Award 2位 – 立命館大学 学生ベンチャーコンテスト • 最優秀賞 NICT賞 69
  70. 70. 事例:画像認識API 画像を送るだけで写っている商品の情報を取得 • 登録商品:500 万件以上(昨年10月)の市販商品 – 書籍,DVD,CD,PCソフト,ゲームソフト, 食品パッケージ,… どんどん増加中 • 定期更新:網羅性 と 認識精度 の改善 – データ追加,パラメータ・アルゴリズム改良 70
  71. 71. 開発者は今すぐ登録! ⇒ https://dev.smt.docomo.ne.jp 事例:画像認識API だれでも、かんたんに、マッシュアップ! • docomo Developer support より提供中 画像認識 画像に写っている物体の情報を取得 環境センサー 日本全国の気温、降水量、紫外線量を取得 音声認識 話した内容を即座に文字に変換 雑談対話 自然な会話をやり取り 知識Q&A 今知りたいことをピンポイントで回答 音声合成 入力した文字を読み上げ トレンド記事抽出 今人気の話題をジャンルやキーワードで検索 文字認識 画像の文字を読み取り 発話理解 要求を理解して、適切な機能を提示 動作推定 行っていた動作の推定 71
  72. 72. 事例:運転補助 車載カメラに映る車や人などを検出・識別・追跡 • 単眼でも高精度、大きさ・距離も推定 世界中の走行データを活用 72
  73. 73. 事例:注目領域抽出 『人の視線を集めそう』な領域をヒートマップ化 • 認識の事前処理に – 交通標識・道路標示・ 信号・看板・商品パッ ケージなど • 教師作成の省力化に – 抽出領域をクラスタリ ングすることで、教師 がなくても類似物体を 検索可能 73 交通標識 がありそう German Traffic Sign Dataset
  74. 74. 事例:地図生成 株式会社トヨタマップマスター様との研究 • 自動運転に使用可能な高品質な地図(地 物・交通規則)をオルソ画像から抽出 74
  75. 75. モーション認識 技術紹介③ 75
  76. 76. モーション認識とは センサー値から動作や行動の種類や発生時刻を推定 76
  77. 77. 事例:動作推定API ドコモ と 来栖川電算 の共同研究 • 加速度データから人の動作や行動を検出 – 静止,歩き,走り,自転車,睡眠,食事 • 動作と直接対応しない行動も検出可能 • スマホ・スマートウォッチに対応 – Android,Android Wear,… • 加速度データにアクセスできる API を備えたウェアラブルデバイス – ※次の画像は画像中のデバイスに対応していることを保証するものではありません。 77
  78. 78. 開発者は今すぐ登録! ⇒ https://dev.smt.docomo.ne.jp 事例:動作推定API だれでも、かんたんに、マッシュアップ! • docomo Developer support より提供中 画像認識 画像に写っている物体の情報を取得 環境センサー 日本全国の気温、降水量、紫外線量を取得 音声認識 話した内容を即座に文字に変換 雑談対話 自然な会話をやり取り 知識Q&A 今知りたいことをピンポイントで回答 音声合成 入力した文字を読み上げ トレンド記事抽出 今人気の話題をジャンルやキーワードで検索 文字認識 画像の文字を読み取り 発話理解 要求を理解して、適切な機能を提示 動作推定 行っていた動作の推定 78
  79. 79. 事例:ライフログ ドコモの動作推定APIの応用例 79 開発者は今すぐ確認! ⇒ https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_docs_id=127
  80. 80. 事例:毎朝体操 だれでも、いつでも、どこでも、すぐできる • Android & iPhone ⇒ http://maiasa.jp/ 80
  81. 81. 事例:なりきり 2.0 ウェアラブルで現実のモノを操作する作品 • ゲームコントローラへの応用 – 格闘ゲームが遊べる程、応答が速く、精度もよ 81

×