Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

JAWS FESTA 20191102

282 views

Published on

2019年11月2日(土)にHTB北海道テレビ放送 創世スクエアスタジオで開催されるイベント「JAWS FESTA 2019 SAPPORO」の来栖川電算のサポーターセッションで使う資料です。
来栖川電算がどのようなことに取り組んでいるかが分かる資料になっています。

Published in: Technology
  • Be the first to comment

  • Be the first to like this

JAWS FESTA 20191102

  1. 1. A W S 大 好 き ♡ A I 企 業 HTB北海道テレビ放送 創成スクエアスタジオ6F 大会議室C 2019.11.2 来栖川電算 取締役 山口陽平 JAWS FESTA 2019 SAPPORO 道産子総クラウドエンジニア化計画 サポーターセッション #jft2019_c
  2. 2. 今日話すこと 1. はじめに 2. 日々の取り組み 3. さらにその先 4. 付録 2
  3. 3. はじめに 自己紹介 & 会社紹介 3
  4. 4. 山 口 陽 平 @melleo1978 • 所属 – 有限会社 来栖川電算 取締役 – 名古屋工業大学大学院博士前期課程修了 • 実績 – IPA 未踏ソフトウェア創造事業採択 – Mashup Awards 9 優秀賞受賞 • 興味 – 機械学習,強化学習,UI/UX – 高速化,省資源化,並列分散 ※実物に髪の毛はありません 4
  5. 5. 山 口 陽 平 @melleo1978 • [実践]画像認識 を執筆 WEB+DB PRESS Vol.83 – これから画像認識をはじめる人におススメ 5 – OpenCV の使い 方や実装例 – SIFTなどの各種 アルゴリズムや 特定物体認識の しくみ – 精度改善への取 り組み方
  6. 6. 来栖川電算 設立 2003年(名古屋工業大学発ベンチャー) 従業員 66人 • SF 世界の技術を実現し、社会に役立てる – AI 技術のライセンス販売・研究・SI • 文字認識,物体認識,動作認識,行動認識 – スマホアプリの企画・制作・運営 スマートライフ技術 NTTドコモ様との共同研究 スマートドライブ技術 大手自動車メーカー様むけ メイドさん もふくめて 6
  7. 7. 技術者集団 様々なアルゴリズムや知識で課題解決 • 最先端の AI 技術 – 文字認識,物体認識,モーション認識 • 限界性能を引き出す優れた実装技術 – 機械学習・コンパイラ・データベースなどの アルゴリズムやバイナリハックを駆使した高 精度化・高速化・省資源化・並列化・分散化 • 高品質なソフトウェアを実現する技術 – 言語・アーキテクチャ・プロセスに対する深 い理解に基づく設計と計画 7
  8. 8. 8 AR付箋 書籍の中身を検索するアプリ Cellars ワインラベルで情報検索するアプリ 画像認識API 商品パッケージで情報検索するAPI 生活情報調査 道路沿いの視覚情報を収集し、活用 交通情報調査 道路沿いの視覚情報を収集し、活用 研究開発支援 タンゴチュウ 写真に写る単語を抽出するサービス 走行データ解析 周辺環境を認識し、様々な解析に活用 地図生成 オルソ画像から地物・交通規則を抽出 動作推定API 加速度センサで人の行動を推定 毎朝体操 腕の動きで体操採点するアプリ ヒーローの動きでゲームを制御 なりきり2.0 ー シ ョ ン 認 識 研究開発支援 研究開発支援 AHAB 大量の実験と計算資源を効率的に管理 ANNOFAB 高品質なアノテーションを大量に生産可能 DNNコンパイラ DNNの推論を10~1000倍も効率化 GameControllerizer プログラマブル・ゲームコントローラ 研究開発支援 類似検索 類似検索 類似検索 文字認識 物体認識 物体認識 物体認識 物体認識 モーション認識 モーション認識 モーション認識物体認識 瞳孔位置推定 眼球運動を監視し、眠気の推定に活用
  9. 9. スコープ AI に関わる全てを提供 9 技術者育成 プロセス開発 ツール開発 チーム育成 データ収集 データ作成 サービス開発 アルゴリズム研究 アルゴリズム開発 サービス運営 企画
  10. 10. 体制 AI 実現のための全業務をカバー 10 AI アプリ SI インフラ AI インフラ データ モデル 研究者アノテータ デザイナ 開発者 役職 研究者 開発者 デザイナ アノテータ その他 合計 役員・正社員 19.1 % 25.2 % 0.2 % 5.2 % 3.5 % 53.0 % アルバイト/即戦力枠 4.5 % 4.5 % 1.5 % 21.2 % 3.0 % 34.8 % アルバイト/育成枠 6.1 % 4.5 % 1.5 % 0.0 % 0.0 % 12.1 % アルバイト/試用枠 0.0 % 0.0 % 0.0 % 0.0 % 0.0 % 0.0 % 合計 29.7 % 34.2 % 3.2 % 26.4 % 6.5 % 100.0 %
  11. 11. コミュニティ活動 様々な勉強会を主催 スタッフとして協力 会場提供 11
  12. 12. 日々の取り組み 機械学習を駆使した技術・サービスの研究開発 12
  13. 13. 具体例 大企業と一緒に研究開発 13
  14. 14. 走行データ解析 周辺環境を認識し、様々な解析に活用 膨大な走行データから歩行者・車両・白線・標識など を検出・追跡し、索引化。必要に応じて、CAN や Lidar なども活用し、高品質化。 14
  15. 15. 地図生成 オルソ画像から地物・交通規則を抽出 自動運転に使用可能な高品質な地図をオルソ画像から 高速に抽出できる深層学習手法を開発。株式会社トヨ タマップマスター様との応用事例。 15
  16. 16. 交通情報調査 道路沿いの視覚情報を収集し、活用 首都圏を走行する大量の車両のドラレコを解析し、視 覚情報(天候,路面状態,レーン別交通量,危険シー ン,…)を DB 化。顧客との研究事例。 16
  17. 17. 生活情報調査 道路沿いの視覚情報を収集し、活用 アスクル株式会社様の営業車のドラレコを解析し、視 覚情報(ガソリン価格,駐車場満空,渋滞,事故,行 列,…)を DB 化。ヤフー株式会社様との共同研究。 17
  18. 18. 瞳孔位置推定 眼球運動を監視し、眠気の推定に活用 スマートグラスで撮影した映像から瞳孔位置・閉眼状 態を高精度に推定。個人差・外乱に頑健。エッジで 60 fps。知の拠点あいち重点研究プロジェクト事業。 18
  19. 19. 機械学習 弱い AI を作るのに役立つ技術 19
  20. 20. 機械学習 人間の学習能力や推論能力を機械に模倣させる手法 • 学習 – 与えられた現象を説明できる法則を得ること • 推論 – 法則に従って与えられた現象を説明すること 20 現象 既知のデータ 法則 モデル 現象 未知のデータ 学習 推論 モデル = プログラム + パラメータ 例:数式,論理式,ホーン節,決定木,オートマトン,確率分布,…
  21. 21. 機械学習の特徴 データでプログラミングする手法 • 仕様(法則)が不明でも適用可能 – 具体的なデータ(現象)で仕様を雑に規定 • 不正確な推論 – データの網羅性・正確性に依存 21 現象 既知のデータ 法則 モデル 現象 未知のデータ 学習 推論 伝統的手法:モデルを直接プログラミング 機械学習:データでモデルを間接プログラミング(帰納プログラミング)
  22. 22. 機械学習の難しさ データに基づく仮説検証ができる技術者(研究者)が必要 • やってみないと分からない – 具体的な解き方が分からないが故に機械学習 を使う。そうすると、必ず問題に対する理解 の不足・誤りがある状況から出発する。デー タや実験結果を観察することで、問題に対す る理解を深め・訂正してゆく必要がある。 • 正しいデータがたくさんいる – 大抵、複数人で手分けしてデータを用意する ため、品質を管理する仕組みが必要となる。 22
  23. 23. 機械学習プロジェクト 来栖川電算ではこんな感じでやっている 23
  24. 24. 工程と重要度 機械学習は一部、それを支える周辺の工程の方が大きい • タスクの設計 40% – パイプライン(システムのフロー)の設計 – 機械学習を適用するタスクと入出力の明確化 • データ・アノテーションの生産 40% – 仕様の明確化・調整,質・量・時期の計画 – 生産・ルール調整・測定・改善 • インフラ・モデル・アプリの構築 20% – 仕様の明確化・調整,結合時期の計画・調整 – 実装・パラメータ調整・測定・改善 24
  25. 25. 進め方と成果 やってみないと分からない ⇒ 仮説検証型 • たくさんの仮説検証がよい結果に繋がる • 副産物として研究レポートもできる 25
  26. 26. 進めるための体制 AI アプリを作るには、様々なスタッフが必要 26 AI アプリ SI インフラ AI インフラ データ モデル 研究者アノテータ デザイナ 開発者 役職 研究者 開発者 デザイナ アノテータ その他 合計 役員・正社員 19.1 % 25.2 % 0.2 % 5.2 % 3.5 % 53.0 % アルバイト/即戦力枠 4.5 % 4.5 % 1.5 % 21.2 % 3.0 % 34.8 % アルバイト/育成枠 6.1 % 4.5 % 1.5 % 0.0 % 0.0 % 12.1 % アルバイト/試用枠 0.0 % 0.0 % 0.0 % 0.0 % 0.0 % 0.0 % 合計 29.7 % 34.2 % 3.2 % 26.4 % 6.5 % 100.0 %
  27. 27. 必要となるインフラ 弊社・AWS・GCP・Azure などに頼れば効率的に構築可能 • データレイク • データ収集ツール • アノテーションツール • 可視化ツール • 実験スケジューラ • 機械学習コンパイラ • 機械学習フレームワーク 27
  28. 28. ANNOFAB 高品質な教師データを大量に生産可能 品質と生産性のトレードオフ、誤り漏れの削減、きめ 細かく柔軟な仕様・課題・進捗の管理。実務で培った ノウハウが詰まったアノテーションサービス。 28
  29. 29. AHAB 大量の実験と計算資源を効率的に管理 計算資源をハイブリッドクラウド化する実験スケ ジューラ。実験のスクリプト化、信頼性や再現性の向 上、資源割り当ての効率化などを促進。 29
  30. 30. DNN コンパイラ DNNの推論を 10 ~ 1000 倍も高速化 重みや活性の量子化・スパース化、計算の共有などの 様々な手法で DNN を近似し、高速化・省資源化され た実行形式(Linux・Android・iOS)へ変換。 30
  31. 31. アノテーションツール 特に推し進めている 31
  32. 32. 32
  33. 33. 開始までたったの3分 カスタマイズされたエディタを利用可能(改修不要) ⇒ データをアップロードして、アノテーション仕様を入力するだけ 33
  34. 34. 豊富な編集機能 漏れと矛盾を防ぎ迅速で正確な作業を可能にする機能が満載 ⇒ 自動検査,入力補完,ショートカット,ガイド表示,検査コメント,… 34
  35. 35. きめ細やかな課題管理 指摘と現物を見比べながら円滑な修正が可能 ⇒ タスク一覧,エディタに統合された課題管理(前頁図) 35
  36. 36. 自動的な計測と可視化 品質・生産性の指標:差戻数,指摘数,進捗,時間,… ⇒ 遠隔拠点・海外拠点の状況をリアルタイムに把握・最適化 36
  37. 37. 自動的な計測と可視化 リアルタイムな把握と最適化 ※海外拠点の遠隔制御に有効 ⇒ 品質・生産性に関わる様々な指標:時間,完成数,差戻数,指摘数,… 37
  38. 38. その他 様々なタスクに対応 ⇒ 画像・動画・系列データ及び部分領域の属性推定,領域の分割・検出・追跡 徹底的な自動化支援 ⇒ Web API と CLI により大量一括処理や外部システムとの連携が容易 多言語対応 ⇒ 表示されるメッセージは全て日本語と英語に対応(カスタマイズ可能) プライベートストレージ対応 ⇒ セキュリティが心配な方のために社内ストレージに対応 プロフェッショナルサービス ※有料オプション ⇒ アノテーション,アルゴリズムの研究開発,これらに対するコンサルティング 38
  39. 39. さらにその先 来栖川電算の 39
  40. 40. 機械学習にまつわる課題 機械学習プロジェクトを徹底的に効率化する 40
  41. 41. 成功例が少ない AI・機械学習に疎くても検討できることをしていないから • やるべきではないパターン – 解決すべき課題ではない – より簡単な手法で解決できる • 適用方法が間違っているパターン – 誤った予測が許されない – 期待値的に得しない • 解決できな設定になっているパターン – 経験を記録・収集できない – 経験に基づいて予測できない 41
  42. 42. 失敗例1 そもそもやるべきではない事例 • 状況 – 上司からとにかく AI・機械学習をやれと言わ れ、ビジネスと無関係な画像認識の PoC をは じめた。高精度な画像認識モデルを作れたが、 どうやったらマネタイズできるか分からない。 • 対策 – ビジネスにどのように貢献するかを検討して から始める。 – AI・機械学習の技術教育であれば問題ない。 42
  43. 43. 失敗例2 機械学習の適用方法が間違っているパターン • 状況 – 検査工数削減を狙って異常検知モデルを導入 したが、モデルの判断を信用できず人による 検査を後工程に残したため、検査工数が全く 削減されない。 • 対策 – AI・機械学習が担当する工程がどのくらいの 確率で失敗してもビジネスが成り立つか/導 入効果があるかを検討する。人も失敗するの で、同程度の失敗確率なら許されるはず。 43
  44. 44. 失敗例3 機械学習で解決できない設定になっているパターン • 状況 – 200m 先の車両の位置を誤差 10cm 以内で追 跡したいと言われたが、カメラの解像度が不 足していてできない。 – 顕微鏡写真を素材ごとに塗り分けたいと言わ れたが、素人では素材を見分けられない。専 門家は忙しくて塗分けする時間がない。 • 対策 – 経験を記録・収集する過程を実施すると明ら かにできる。大きな投資をする前にやるべき。 44
  45. 45. 課題 既存のプロセスではリードタイムが長すぎる • AI 研究開発で検証すべきこと – 経験に基づいて予測できる – 経験を記録・収集できる – 誤った予測が許される – 期待値的に得をする • 既存のプロセスのリードタイム – 実現可能性・価値の検証:数ヶ月~数年 – ※基礎研究ならよいが、多くはそうではない 45
  46. 46. アノテーション駆動研究開発 機械学習プロジェクトを徹底的に効率化する 46
  47. 47. アノテーション駆動研究開発 AI を作る前に、人が AI になりきって、研究開発を進める • 肝は、早く確認し、失敗すること – 想定したデータを収集できるか? – データが想定した分布になっているか? – 人がデータだけを見て予測できるか? • メリット – 実現性の高さ・価値の大きさの順にやれる – 人でも採算とれるならビジネスをやればいい • 実際のデータが揃っている状況から始められる • AI 化を進めれば利益率が改善する 47
  48. 48. 事例・製品・サービス 付録① 48
  49. 49. 類似検索 膨大なデータの中から類似データを高速・高精度に照合できる 49
  50. 50. 画像認識 API 商品パッケージで情報検索する API 商品パッケージが写った画像を送信するだけで、膨大 な DB から瞬時に種類を特定。クロールした画像から 直接構築した DB を利用。 50
  51. 51. Cellars ワインラベルで情報検索するアプリ ワインラベルにスマホをかざすだけで、18 万件から 瞬時に種類を特定。国内外のコンテストで入賞。株式 会社 Cellars 様による弊社技術の応用事例。 51
  52. 52. AR 付箋 書籍の中身を検索するアプリ 書籍を開いてスマホをかざすだけで、膨大な DB から 瞬時にページを特定し、貼られている付箋を表示。お 客様による弊社技術の応用事例。 52
  53. 53. 物体認識 物体の位置・向き・姿勢・種類を高速・高精度に捉える 53
  54. 54. 走行データ解析 周辺環境を認識し、様々な解析に活用 膨大な走行データから歩行者・車両・白線・標識など を検出・追跡し、索引化。必要に応じて、CAN や Lidar なども活用し、高品質化。 54
  55. 55. 地図生成 オルソ画像から地物・交通規則を抽出 自動運転に使用可能な高品質な地図をオルソ画像から 高速に抽出できる深層学習手法を開発。株式会社トヨ タマップマスター様との応用事例。 55
  56. 56. 交通情報調査 道路沿いの視覚情報を収集し、活用 首都圏を走行する大量の車両のドラレコを解析し、視 覚情報(天候,路面状態,レーン別交通量,危険シー ン,…)を DB 化。顧客との研究事例。 56
  57. 57. 生活情報調査 道路沿いの視覚情報を収集し、活用 アスクル株式会社様の営業車のドラレコを解析し、視 覚情報(ガソリン価格,駐車場満空,渋滞,事故,行 列,…)を DB 化。ヤフー株式会社様との共同研究。 57
  58. 58. 瞳孔位置推定 眼球運動を監視し、眠気の推定に活用 スマートグラスで撮影した映像から瞳孔位置・閉眼状 態を高精度に推定。個人差・外乱に頑健。エッジで 60 fps。知の拠点あいち重点研究プロジェクト事業。 58
  59. 59. 文字認識 様々な書体・外乱に対応した 59
  60. 60. タンゴチュウ 写真に写る単語を抽出するサービス 情景画像(スマホで撮影した写真など)に写る単語を 抽出。様々な書体・配置・劣悪な環境(歪み・隠れ・ 擦れ・照明など)での利用を想定。 60
  61. 61. モーション認識 身体の動き・姿勢を高速・高精度に捉える 61
  62. 62. 動作推定 API 加速度センサで人の行動を推定 スマホやウォッチの動きから静止・歩行・走行・食 事・睡眠などを推定。同じ仕組みで撮影時の手振れ検 出も可能。株式会社 NTT ドコモ様との共同研究。 62
  63. 63. 毎朝体操 腕の動きで体操採点するアプリ 100 ヶ国 20 万人を超えるユーザから日々送られてく るセンサデータを学習することで体操採点の正確さが 自動改善。JFE スチール株式会社様へ導入。 63
  64. 64. なりきり 2.0 ヒーローの動きでゲームを制御 腕や脚に装着したセンサで体の動きを捉え、家庭用 ゲーム機のコマンドを生成。格闘ゲームが遊べるほど の速さと正確さをスマホ上で実現。 64
  65. 65. 研究開発支援 日々使い改良される道具による 65
  66. 66. DNN コンパイラ DNNの推論を 10 ~ 1000 倍も高速化 重みや活性の量子化・スパース化、計算の共有などの 様々な手法で DNN を近似し、高速化・省資源化され た実行形式(Linux・Android・iOS)へ変換。 66
  67. 67. AHAB 大量の実験と計算資源を効率的に管理 計算資源をハイブリッドクラウド化する実験スケ ジューラ。実験のスクリプト化、信頼性や再現性の向 上、資源割り当ての効率化などを促進。 67
  68. 68. ANNOFAB 高品質な教師データを大量に生産可能 品質と生産性のトレードオフ、誤り漏れの削減、きめ 細かく柔軟な仕様・課題・進捗の管理。実務で培った ノウハウが詰まったアノテーションサービス。 68
  69. 69. GameControllerizer プログラマブル・ゲームコントローラ ゲーム機・PC・スマホなどに接続するだけでゲーム 操作をプログラミング可能にするデバイス。ビジュア ル・プログラミング(Node-REDなど)にも対応。 69
  70. 70. 体制・設備・サポート 付録② 70
  71. 71. 体制 AI 実現のための全業務をカバー 71 AI アプリ SI インフラ AI インフラ データ モデル 研究者アノテータ デザイナ 開発者 役職 研究者 開発者 デザイナ アノテータ その他 合計 役員・正社員 19.1 % 25.2 % 0.2 % 5.2 % 3.5 % 53.0 % アルバイト/即戦力枠 4.5 % 4.5 % 1.5 % 21.2 % 3.0 % 34.8 % アルバイト/育成枠 6.1 % 4.5 % 1.5 % 0.0 % 0.0 % 12.1 % アルバイト/試用枠 0.0 % 0.0 % 0.0 % 0.0 % 0.0 % 0.0 % 合計 29.7 % 34.2 % 3.2 % 26.4 % 6.5 % 100.0 %
  72. 72. 設備 研究開発を円滑にするためにあらゆる手を尽くす • 理想的な個人設備 ※好きなものが選べる – PC,椅子,モニタ,キーボード,マウス,… • 豊富な計算資源とアノテータ ※使いやすい – Ahab:実験用ハイブリッドクラウド – ANNOFAB:アノテーションサービス • 豊富な独自データ ※世界中からどんどん集まる – 自動運転用データ,商品認識用データ,文字 認識用データ,体操採点用データ,… 72
  73. 73. サポート 技術を磨きやすくするためにあらゆる手を尽くす • 様々な働き方 – 自由な時間帯・場所,冒険者制度,… • 優秀な同僚 ※メンタリング(JEDI) – IPA 未踏ソフトウェア創造事業採択者,コン テスト入賞者,OSS コントリビュータ,… • その他 ※全て会社負担 – 自己研鑽のための書籍・機材の購入 – 勉強会・懇親会の開催・参加・移動・宿泊 – 会社の昼会・夕会・飲み会で供される飲食物 73
  74. 74. 74 募集中 研究者 開発者 デザイナ

×