Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

JAWSDAYS 2018 LUNCH SESSION

663 views

Published on

JAWSDAYS 2018 でランチサポーター枠で発表したときの資料です。
来栖川電算でどのような取り組みが行われているか分かります。

Published in: Technology
  • Be the first to comment

JAWSDAYS 2018 LUNCH SESSION

  1. 1. はじめに 自己紹介 & 会社紹介 2
  2. 2. 山 口 陽 平 @melleo1978 • 所属 & 経歴 – 有限会社 来栖川電算 取締役 – 名古屋工業大学大学院 博士前期課程修了 – IPA未踏ソフトウェア創造事業 採択 – Mashup Awards 9 優秀賞受賞 • 自己紹介 企画から実装まで全部やる人 – 人工知能技術の研究開発 • 文字認識,物体認識,動作認識 • 空間復元,シミュレーション – 言語処理系の研究開発 • 分散DB,仮想機械,コンパイラ ※実物に髪の毛はありません。 3
  3. 3. 山 口 陽 平 @melleo1978 • [実践]画像認識 を執筆 WEB+DB PRESS Vol.83 – これから画像認識をはじめる人におススメ 4 – OpenCV の使い 方や実装例 – SIFTなどの各種 アルゴリズムや 特定物体認識の しくみ – 精度改善への取 り組み方
  4. 4. 来栖川電算 設立 2003年(名古屋工業大学発ベンチャー) 従業員 45人 • SF世界の技術を実現し、社会に役立てる – AI技術のライセンス販売・研究・SI • 類似検索,物体認識,動作認識,文字認識,… – スマホアプリの企画・制作・運営 メイドさん もふくめて 5 走行データ解析 周辺環境を認識し、様々な解析に活用 動作推定API 加速度センサで人の行動を推定 車両メーカー様 NTTドコモ様
  5. 5. 6 なりきり2.0 ヒーローの動きでゲームを制御 毎朝体操 腕の動きで体操採点するアプリ 動作推定API 加速度センサで人の行動を推定 タンゴチュウ 写真に写る単語を抽出するサービス 地図生成 オルソ画像から地物・交通規則を抽出 走行データ解析 周辺環境を認識し、様々な解析に活用 AR付箋 書籍の中身を検索するアプリ Cellars ワインラベルで情報検索するアプリ 画像認識API 商品パッケージで情報検索するAPI AnnotationFactory 高品質な教師データを大量に作成可能 実験スケジューラ 大量の実験と計算資源を効率的に管理 DNNコンパイラ DNNの推論を10~1000倍も効率化
  6. 6. テクノロジー企業 様々なアルゴリズムを駆使する技術者集団 • 様々な AI 技術 – 類似検索,物体認識,動作認識,文字認識 • 限界性能を引き出す優れた実装技術 – 機械学習・コンパイラ・データベース・仮想 機械などのアルゴリズムとバイナリハック • 高速化,並列化,分散化,省空間化,高精度化 • ビジネスを差別化する認識エコシステム – スケールに応じた仕組,競争力の自動強化 7
  7. 7. 体制 データ入力 から アプリ開発 までワンストップ 8
  8. 8. コミュニティ活動 おせわになってたり、スタッフしてたりする 9
  9. 9. 機械学習 名古屋 http://machine-learning.connpass.com/ 10
  10. 10. TensorFlow User Group http://tfug-tokyo.connpass.com/ 11
  11. 11. 『FP in Scala』読書会@名古屋 http://fp-in-scala-nagoya.connpass.com/ 12
  12. 12. JAWS-UG https://jaws-ug.jp/ 13
  13. 13. 情景画像文字認識 技術紹介① 14
  14. 14. 情景画像文字認識とは スマホなどで撮影した画像から文字を読み取る 15
  15. 15. 情景画像文字認識とは 様々なパース、様々なレイアウト、様々な書体 16
  16. 16. 情景画像文字認識とは いわゆる “OCR” とは ”扱う画像” が違う • 悪環境下での文字認識 – 手書き・様々な書体・かすれ・点描・きつい パース・統一性のない並び・逆光・陰・影・ グラデーション・モアレなど • 使える場面 – 屋外でのスマホカメラを使った棚卸し – 車載カメラからの標識認識 – 商品パッケージからの成分情報抽出 – キーワードによるアルバム・ビデオの頭出し 17
  17. 17. 事例:タンゴチュウ Twitter で情景画像文字認識を体験できるサービス 18
  18. 18. 物体認識 技術紹介② 19
  19. 19. 物体認識とは 画像中の物体の種類・位置・姿勢を推定 20
  20. 20. 物体認識とは 様々な向き・ポーズを学習させ見えの多様性を獲得 • 特定物体認識は素人でも簡単に使える – どんな画像を学習に使うかを学べばOK 21
  21. 21. 物体認識とは モノをカウント、見た目で分からない情報を表示 • 使える場面 工場内で箱の仕分け 体験や評判の調査 ワインラベルで情報検索 AR付箋 集めて応募キャンペーン ARフィギュア 22
  22. 22. 事例:1000sors 誰でも簡単に使えるクラウド型物体認識エンジン • 広い適用範囲 – 照明姿勢の変化に強く、様々な撮影環境に対応 • 驚異的な精度 – 数十万種類をほぼ完ぺきに識別 • 圧倒的な性能 – たった1台のPCで100万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト 23
  23. 23. 事例:1000sors 手元の画像で精度や速度をすぐに確認可能 • ShotPreview for Android / iOS ①設定 ②撮影 ③確認 24
  24. 24. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ • きついパースも、帯による隠れも、OK 25
  25. 25. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ • よく似ていても、複数冊同時も、OK 26
  26. 26. 事例:Cellars 18万件のワインラベルを認識するアプリ • 世界で賞を獲得したアプリをダウンロード! – Asia Smartphone Apps Contest • 広告マーケティング部門 Silver Award 2位 – 立命館大学 学生ベンチャーコンテスト • 最優秀賞 NICT賞 27
  27. 27. 事例:画像認識API 画像を送るだけで写っている商品の情報を取得 • 登録商品:500 万件以上(昨年10月)の市販商品 – 書籍,DVD,CD,PCソフト,ゲームソフト, 食品パッケージ,… どんどん増加中 • 定期更新:網羅性 と 認識精度 の改善 – データ追加,パラメータ・アルゴリズム改良 28
  28. 28. 事例:画像認識API だれでも、かんたんに、マッシュアップ! • docomo Developer support より提供中 画像認識 画像に写っている物体の情報を取得 環境センサー 日本全国の気温、降水量、紫外線量を取得 音声認識 話した内容を即座に文字に変換 雑談対話 自然な会話をやり取り 知識Q&A 今知りたいことをピンポイントで回答 音声合成 入力した文字を読み上げ トレンド記事抽出 今人気の話題をジャンルやキーワードで検索 文字認識 画像の文字を読み取り 発話理解 要求を理解して、適切な機能を提示 動作推定 行っていた動作の推定 29
  29. 29. 事例:運転補助 車載カメラに映る車や人などを検出・識別・追跡 • 単眼でも高精度、大きさ・距離も推定 世界中の走行データを活用 30
  30. 30. 事例:注目領域抽出 『人の視線を集めそう』な領域をヒートマップ化 • 認識の事前処理に – 交通標識・道路標示・ 信号・看板・商品パッ ケージなど • 教師作成の省力化に – 抽出領域をクラスタリ ングすることで、教師 がなくても類似物体を 検索可能 31 交通標識 がありそう German Traffic Sign Dataset
  31. 31. 事例:地図生成 株式会社トヨタマップマスター様との研究 • 自動運転に使用可能な高品質な地図(地 物・交通規則)をオルソ画像から抽出 32
  32. 32. モーション認識 技術紹介③ 33
  33. 33. モーション認識とは センサー値から動作や行動の種類や発生時刻を推定 34
  34. 34. 事例:動作推定API ドコモ と 来栖川電算 の共同研究 • 加速度データから人の動作や行動を検出 – 静止,歩き,走り,自転車,睡眠,食事 • 動作と直接対応しない行動も検出可能 • スマホ・スマートウォッチに対応 – Android,Android Wear,… • 加速度データにアクセスできるウェアラブル機器 35
  35. 35. 事例:動作推定API だれでも、かんたんに、マッシュアップ! • docomo Developer support より提供中 画像認識 画像に写っている物体の情報を取得 環境センサー 日本全国の気温、降水量、紫外線量を取得 音声認識 話した内容を即座に文字に変換 雑談対話 自然な会話をやり取り 知識Q&A 今知りたいことをピンポイントで回答 音声合成 入力した文字を読み上げ トレンド記事抽出 今人気の話題をジャンルやキーワードで検索 文字認識 画像の文字を読み取り 発話理解 要求を理解して、適切な機能を提示 動作推定 行っていた動作の推定 36
  36. 36. 事例:ライフログ ドコモの動作推定APIの応用例 37 開発者は今すぐ確認! ⇒ https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_docs_id=127
  37. 37. 事例:毎朝体操 だれでも、いつでも、どこでも、すぐできる • Android & iPhone ⇒ http://maiasa.jp/ 38
  38. 38. 事例:なりきり 2.0 ウェアラブルで現実のモノを操作する作品 • ゲームコントローラへの応用 – 格闘ゲームが遊べる程、応答が速く、精度もよい。 39
  39. 39. 研究環境 技術紹介④ 40
  40. 40. DNNコンパイラ かなり前からモバイルでの活用実績がある 41
  41. 41. DNNコンパイラ DNN を効率的な実行形式へ変換するツール • DNN の推論計算を近似し て、高速化・省メモリ化 – 量子化,パラメータ削減, 計算順序変更,計算共有, 基底分解,確率的近似,カ スケード,… • 限界性能を引き出す実装 – アーキテクチャに最適化さ れたコード(専用命令, キャッシュ戦略),… 42
  42. 42. 配布が捗る スマホやサーバへの組み込みがスムーズに • DNN の推論計算の効率化 – スマホなどに収まるように演算量やメモリ使用量 を抑えることができる。 – 計算共有・順序変更・部分計算など応用に合わせ た実装に変更できる。 • DNN のアーキテクチャの隠蔽 – ハックやノウハウを解析しづらくできる。 • コンパクトな実装・依存関係 – 容量が小さいのでアプリにも組み込める。 – 依存物が少なく実行環境で問題が起こりにくい。 43
  43. 43. 実験スケジューラ 深層学習の実験環境 44
  44. 44. 実験スケジューラ たくさんの実験を安全かつ楽に管理する環境 • 計算資源・実験データの管理を自動化 45
  45. 45. 研究が捗る 実験サイクルが高速化 実験の再現性が向上 • 計算資源の隔離 – 実験スクリプトが他と干渉しないので、実験が失 敗したり、出力が混じったりしない。 • 計算資源の抽象化 – 計算資源(自社・お客様・クラウドなど)の変化 に頑健な実験スクリプトを作りやすい。 • 便利な機能 – 実験が自動的に永続化され、すぐに再現できる。 – テンプレートから簡単に実験をはじめられる。 46
  46. 46. どんどん拡大 実験スケジューラのハイブリッドクラウド化 • 効率的な計算資源の割当 – 個人で計算資源を専有せず、全員で共有 • 様々な計算資源への対応 – クラウドの計算資源:普段使い – 自社で購入した計算資源:上記の節約 – お客様が弊社に設置する計算資源 – お客様の敷地にある計算資源 • 大量に使わせてもらえる。ありがたや。 47
  47. 47. AnnotationFactory 近いうちに公開予定 来栖川電算のノウハウが詰まったクラウドサービス 48
  48. 48. Annotation Factory 研究者と入力者のための教師データ作成サービス 49
  49. 49. プロジェクト一覧 参加プロジェクトの確認、新規プロジェクトの作成 50
  50. 50. プロジェクトホーム プロジェクト全体の進捗状況を把握可能 51
  51. 51. メンバ一覧 自由に招待・権限付与が可能 52
  52. 52. 入力仕様 データにどのような教師付けを行うかを設定 53
  53. 53. 入力データ一覧 データをアップロードして直ぐに教師付け可能 54
  54. 54. タスク一覧 進行中のタスクや自分に関係のあるタスクを表示 55
  55. 55. タスク履歴 データごとに誰がいつ何をしたかを追跡可能 56
  56. 56. 画像教師エディタ 矩形・ポリゴン・塗りつぶしなど多彩な入力が可能 57
  57. 57. 動画教師エディタ 時刻に対して簡単に教師付け可能 58
  58. 58. Scala.js × Serverless 開発・運用・スケールアウトも容易 59
  59. 59. 求人 AIに関する技術・サービス・アプリを作りたい人! 60
  60. 60. スタッフ募集中 学生さん、転職者さん、力を貸して! • 職種 – 研究 機械学習,アルゴリズム,センサ – 開発 UI/UX,フロントエンド,サーバサイ ド,アーキテクチャ,インフラ,プロセス – 企画 新しい習慣を考える力・広める力 • よく使う技術 – 言語 Python,Scala,Java,C++,JavaScript – その他 Docker,Linux,Android,iOS,Git 61
  61. 61. オフィス 勉強会 もやってるよ! メイドさん お手製の夕食も出るよ! • 名古屋の中心 – 移転:2016 年 6 月 – 面積:以前の 2 倍! • 最寄駅 – JR中央線 鶴舞駅 – 名古屋市営地下鉄 • 鶴舞線 鶴舞駅 • 名城線 矢場町駅 • 桜通線 新栄駅 62 いつでも 見学OK

×