DevLOVE20140823

1,424 views

Published on

認識技術をやれるチームを作るための方針について書かれています。

Published in: Education
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,424
On SlideShare
0
From Embeds
0
Number of Embeds
287
Actions
Shares
0
Downloads
7
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

DevLOVE20140823

  1. 1. プログラマは にんしきぎじゅつ をおぼえた! 2014.8.23 来栖川電算 山口 陽平DevLOVE 甲子園 2014 西日本大会 ~ ラジオ体操で磨く認識技術 ~
  2. 2. 今日の話すこと • 自己紹介&会社紹介 • 毎朝体操 ← ゗ンストールしておこう! • ラジオ体操を題材に認識技術を学ぶ • これから重要になること • みんなでラジオ体操
  3. 3. 自己紹介&会社紹介 要するに技術力で開拓するタ゗プ
  4. 4. • 必要なら何でも徹底的にやる研究者 – プログラミング言語・データベース分散 – 機械学習・アルゴリズム・バイナリハック – 文字認識・物体認識・モーション認識 – 名古屋工業大学出身・未踏ソフトウェア経験 • 人を驚かせるのが好きな36歳児 – ハードリアルタイムJavaVM – 1000台越え構成のペタバイト分散DB – 秒間1000万クエリ処理できるKVS – 超多クラス対応で超高速な物体認識・モーション認識 山 口 陽 平 @melleo1978 ※あくまでも゗メージです。 実物に髪の毛はありません。
  5. 5. • 概要:10年以上 – 名古屋工業大学発ベンチャー(2003年) • 目的:ロボの頭脳を作る – 知的インターフェイスによる社会の変革 – ソフトウェアの品質・生産性の向上 • スタッフ:31人 – 役員3人〃正社員14人〃見習い7人 – データ作成6人〃家政婦1人 – IPA未踏ソフトウェア経験者多数 • 社風:難しことを楽しく – 職人〃挑戦〃自由〃昼食・夕食・飲み会は無料 来栖川電算 http://kurusugawa.jp/ 弊社が目指すロボ ※写真はあくまでも゗メージです。
  6. 6. 事業戦略 知的゗ンターフェ゗スでよりユーザの近くへ • 新領域に挑戦 – コンサルティン グ〃開発〃大規 模インフラ構築 – 技術研究・評価 – データ作成 – ライセンス提供 – コンシューマ サービスnew!
  7. 7. 情景画像文字認識 来栖川電算の
  8. 8. 情景画像文字認識とは スマホなどで撮影した画像から文字を読み取る
  9. 9. 情景画像文字認識とは 様々なパース、様々なレ゗ゕウト、様々な書体
  10. 10. 情景画像文字認識とは いわゆる “OCR” とは ”扱う画像” が違う • 悪環境下での文字認識 – 手書き・様々な書体・かすれ・点描・きつい パース・統一性のない並び・逆光・陰・影・ グラデーション・モアレなど • 使える場面 – 屋外でのスマホカメラを使った棚卸し – 車載カメラからの標識認識 – 商品パッケージからの成分情報抽出 – キーワードによるアルバム・ビデオの頭出し
  11. 11. 事例:タンゴチュウ Twitter で情景画像文字認識を体験できるサービス
  12. 12. 物体認識 来栖川電算の
  13. 13. 物体認識とは 画像中の物体の種類・位置・姿勢を推定
  14. 14. 物体認識とは 様々な向き・ポーズを学習させ見えの多様性を獲得 • 特定物体認識は素人でも簡単に使える – どんな画像を学習に使うかを学べばOK
  15. 15. 物体認識とは モノをカウント、見た目で分からない情報を表示 • 使える場面 工場内で箱の仕分け 体験や評判の調査 ワ゗ンラベルで情報検索 AR付箋 集めて応募キャンペーン ARフゖギュゕ
  16. 16. 事例:1000sors 誰でも簡単に使えるクラウド型物体認識エンジン • 広い適用範囲 – 照明姿勢の変化に強く、様々な撮影環境に対応 • 驚異的な精度 – 数十万種類をほぼ完ぺきに識別 • 圧倒的な性能 – たった1台のPCで数百万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト
  17. 17. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるゕプリ • きついパースも、帯による隠れも、OK
  18. 18. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるゕプリ • よく似ていても、複数冊同時も、OK
  19. 19. 顧客事例:Cellars 18万件のワ゗ンラベルを認識するゕプリ • 海外で賞を獲得した日本企業のゕプリ! – Asia Smartphone Apps Contest • 広告マーケテゖング部門 Silver Award 2位 – 立命館大学 学生ベンチャーコンテスト • 最優秀賞 NICT賞
  20. 20. 事例:自動運転関連 車載カメラに映る車や人などを検出・識別・追跡 • 単眼でも高精度、大きさ・距離も推定 膨大な走行データを活用
  21. 21. モーション認識 来栖川電算の
  22. 22. モーション認識とは センサー値から動作や行動の種類や位置を推定
  23. 23. 事例:ラ゗フログ NTTドコモ様との共同研究プロジェクト • リストバンドなどから行動を検出・分析 – 睡眠〃デスクワーク〃静止〃歩き〃走り〃自 転車〃乗り物〃… – 「行動 ≠ 動作」なものもいける • リゕルタ゗ム:数秒 ~ 数分で検出
  24. 24. 事例:毎朝体操 スマホを持って体操すると腕の動きを認識・採点 • みんなのデータでどんどん賢く
  25. 25. モノマネCOLLECTION ソーシャル型ジェスチャー認識 new! • まねしてみた – 仮面ライダーの変身ポーズ – 波動拳・昇竜拳 • 踊ってみたを採点してみた – プリキュアのダンス – ようかい体操第一 • これをやるには次が必須 – スマホの中でオンライン学習 – モーションデータの交換
  26. 26. 毎朝体操 モーション認識でフゖットネスを楽しくする
  27. 27. ラジオ体操ゕプリ だれでも、いつでも、どこでも、すぐできる • Android版 iOS版 ⇒ http://maiasa.jp/
  28. 28. スマホを持って体操 腕の動きを認識・採点し、素敵なレポートにするよ • 頑張りに応じてトロフゖーがもらえたり、 みんなの統計も見られるよ!
  29. 29. ユーザ数拡大中 もうすぐ10万ダウンロード • 健康&フゖットネスで常時ランク゗ン!
  30. 30. 2014年8月23日時点 13313 いいね! Facebookでは 中高年に人気。若い女性フゔン増えてほしい!
  31. 31. 67の国と地域 意外な場所で使われてる!!! • 駐在さん?旅行者? • 外国人もやってるぽい
  32. 32. マグニチュード3~4 みんなのラジオ体操の熱量を合計するとヤバい! • 13.581 GJ 2014年6月22日時点 – 実はラジオ体操は運動強度が高い! 熱量 状況 1.500 GJ 雷の平均のエネルギー 1.770 GJ 質量1kgの物体が木星の引力圏から脱出するために 必要な運動エネルギー 2.000 GJ マグニチュード3の地震のエネルギー 4.184 GJ TNT火薬1トンの爆発のエネルギー 8.532 GJ 世界の人口1人あたりの年間消費電力量(2002年) 13.581 GJ 毎朝体操の総熱量 2014年6月22日時点 64.100 GJ マグニチュード4の地震のエネルギー 運動強度 状況 2.0 METS 電車の中で立っている 3.0 METS 庭仕事・野球の野手 3.5 METS 平地での自転車 4.0 METS ハイキング・速足 4.5 METS ラジオ体操 6.0 METS 階段昇降・卓球 9.0 METS 水泳・高強度の長距離 走・筋力トレーニング
  33. 33. MA9では 「優秀賞」と「企業賞」を受賞! • TechCrunchにも 載ったよ!!! ⇒
  34. 34. 徐々に知名度UP 最近いろいろなメデゖゕに取り上げられている! • ゕプリソムリエの 石井寛子さんが! – 【石井寛子ゕプリ事始】「毎朝体 操」超最先端ラジオ体操第1!? • 日経新聞も! – 職場で気軽に体ほぐし ヨガ・体操 …お助けゕプリ • ついにラジオも! – 文化放送(1134KHz) – ドコモ団塊倶楽部 – 8月23日(土)11:00 ~ 13:00 – ゕプリ紹介コーナー(生方法) – リポーターが実演&解説してくれる
  35. 35. ラジオ体操を題材に 認識技術を学ぶ まったくの初心者が
  36. 36. 認識技術の学び方 とにかくたくさんデータを見て試した人が強い • 座学と演習 – 教わったことを自分の力で理解する。 – 実践中に必要になったらやるスタンスでよい。 • 実践 – 教わったことを現実のデータで試す。様々な 組み合わせを試す。実験量命。 – チームメンバーと協力して、認識エコシステ ムを設計・運用し、ユーザ体験の改善に最も 貢献する施策を選び出し、実施する。
  37. 37. 座学と演習 自分で調査・実装・実験して理解する • 必要な時にとっかかり易くなる情報を与える – 基本的な用語や考え方 – 機械学習アルゴリズム – 最適化アルゴリズム – 検索アルゴリズム – 特徴抽出アルゴリズム – 認識対象ドメインの知識 – 線形代数などの初歩的な数学 – 論文の読み方
  38. 38. 実践 現実世界のデータでゕルゴリズムを試し、理解する • 認識エコシステム全体を設計・運用する
  39. 39. 実践 役割をローテーションし、打てる策を理解する • ゕプリ開発者 – アプリが提供するユーザ体験を伝える。精度を求 めすぎない。 • エンジン開発者 – 精度がでる条件とデータやアルゴリズムの性質を 伝える。データの質や量を求めすぎない。 • ツール開発者 – 品質と生産性のバランスがよい条件を伝える。 • データ入力者 – 実際に入力し、品質と生産性を測定する。
  40. 40. 実践に適した題材 ラジオ体操は認識技術を学ぶのに適している • 複雑な認識システムにならない – 採点問題を分類問題に落とし込める。 – 動きの種類が明確に定義できる。 • データを調達しやすい – 音楽に合わせて体操するだけで教師が付く。 – ユーザが毎日増やしてくれる。 • 理解しやすい – 体を動かしてデータの変化を調べられる。 – センサー値から最終結果までが近い。
  41. 41. 実践に適した題材 ラジオ体操は認識技術を学ぶのに適している • いろいろな実験ができる – 装着部位・デバイス・人の違いによる精度の 違いを理解することで、手法の良し悪しを評 価できる。どのように評価すべきかも学べる。 • データ量を徐々に増やすことで、課題や 使える手法が変わることを学べる – データからの特徴の獲得〃次元圧縮〃高度な 検索〃様々な種類の近似〃データの品質保証 方法
  42. 42. 実践に適した題材 ラジオ体操は認識技術を学ぶのに適している • 価値提供のための全プロセスに関われる – 精度よりユーザ体験の改善が重要なことを学べる。 • 試験のたび、気晴らしに体操する – 運動不足を解消でき、肩こりにも効く。 – 残念ながら数回ではダイエット効果はない。 • デモの゗ンパクトがすごい – 客先で技術解説のために体操するとウケる。 – 一緒にやるとかなり盛り上がる。 – コンテストで入賞できる。
  43. 43. 続けた結果 SIの会社 から 認識技術の会社 へ進化 • 売上の大半は認識系 – 大企業の認識サービスの開発 – 大企業からの研究委託 – 大企業との共同研究 – 認識エンジンのライセンス販売 • ストックビジネスの割合が拡大 – 認識エンジンのライセンス販売 – コンシューマビジネス
  44. 44. これから重要になること さらに学ばなければならないこと
  45. 45. 認識エコシステム 安く高品質なデータを調達できるサービス設計 • ユーザに教師を生成させる技術
  46. 46. 量と質の追及 エンジン開発・ツール開発・データ入力の連携 • 作りやすく効果が高いデータを発見する ためのより緊密な連携 – 言葉で表すのはブレが大きく、言葉選びに迷 いが生じ時間がかかるが、画像の領域選択な らそこそこ正確でブレない。 • ツール開発とセットになったクラウド ソーシング – 既存のクラウドソーシングでは分析が進んで いないタスクのデータは調達しづらい。
  47. 47. 計算資源の設計 エッジコンピューテゖング × オンラ゗ン学習 • できるだけユーザの計算資源を利用 – サーバ費用の節約:スマホの計算能力は高い – 機敏なユーザ体験:リアルタイム > 精度 – オフライン利用:待機時間の削減 • できるだけパーソナラ゗ズ – 計算資源の節約:本人のみのモデルは小さい – 高品質なユーザ体験:本人のみだと賢い
  48. 48. みんなでラジオ体操 時間ですよ!そろそろ準備はいいですか?
  49. 49. やりますよね! ご清聴ありがとうございました
  50. 50. スタッフ募集中 プロデューサ、UI・UXエンジニゕ、すぐ来て! • 気軽にオフゖスへ遊びに来てね! – 見学できて、ご飯も食べれて、泊まれる。 名古屋本社(2013年フロゕ増設) ゗オン千種・名大病院・名工大の近く 上野支社(2012年開設) 入谷駅・鶯谷駅・上野駅の近く

×