Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

10

Share

Download to read offline

DevLove20141206

Download to read offline

初心者を育てて認識技術を使えるようにするために取り組んでいることを紹介します。

あと、毎朝体操杯2014を勝手に開催します。
みなさん、毎朝体操をインストールしてラジオ体操をしましょう。

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all

DevLove20141206

  1. 1. プログラマは にんしきぎじゅつ をおぼえた! 2014.12.6 来栖川電算 山口 陽平 DevLOVE 甲子園 2014 日本シリーズ編 ~ ラジオ体操で磨く認識技術 ~
  2. 2. ラジオ体操すると エンジニアの健康が守られ チームが活気付く @melleo1978 肉体を “LEAN” に
  3. 3. 今日話すこと •自己紹介 & 会社紹介 •毎朝体操 ← インストールしておこう! •認識技術を学ぶ •実践に適した題材 •続けた結果 •これから重要になること •毎朝体操杯2014 ← 勝手に開催
  4. 4. 自己紹介 & 会社紹介 要するに技術力で開拓するタイプ
  5. 5. •必要なら何でも徹底的にやる研究者 –プログラミング言語・分散データベース –機械学習・アルゴリズム・バイナリハック –文字認識・物体認識・モーション認識 –名古屋工業大学出身・未踏ソフトウェア経験 •人を驚かせるのが好きな36歳児 –ハードリアルタイムJavaVM –1000台越え構成のペタバイト分散DB –秒間1000万クエリ処理できるKVS –超多クラス対応で超高速な物体認識・モーション認識 山 口 陽 平 @melleo1978 ※あくまでもイメージです。 実物に髪の毛はありません。
  6. 6. 山 口 陽 平 @melleo1978 •WEB+DB PRESS Vol.83 にて [実践]画像認識 を執筆 –OpenCV を使えば、初心 者でも特定物体認識が簡 単に試せるよという内容 –SIFT の説明や他のアルゴ リズムの紹介 –これから画像認識を始め てみたい人におススメ
  7. 7. 来栖川電算 設立 2003年(名古屋工業大学発ベンチャー) 従業員 30人 •SF世界の技術を実現し、社会に役立てる –人工知能技術の研究・ライセンス販売・SI •文字認識〃物体認識〃行動認識〃モーション認識 –スマホアプリの企画・制作・運営 スマートライフ技術 NTTドコモ様との共同研究 スマートドライブ技術 大手自動車メーカー様むけ メイドさん もふくめて
  8. 8. 情景画像文字認識 来栖川電算の
  9. 9. 情景画像文字認識とは スマホなどで撮影した画像から文字を読み取る
  10. 10. 情景画像文字認識とは 様々なパース、様々なレイアウト、様々な書体
  11. 11. 情景画像文字認識とは いわゆる “OCR” とは ”扱う画像” が違う •悪環境下での文字認識 –手書き・様々な書体・かすれ・点描・きつい パース・統一性のない並び・逆光・陰・影・ グラデーション・モアレなど •使える場面 –屋外でのスマホカメラを使った棚卸し –車載カメラからの標識認識 –商品パッケージからの成分情報抽出 –キーワードによるアルバム・ビデオの頭出し
  12. 12. 事例:タンゴチュウ Twitter で情景画像文字認識を体験できるサービス
  13. 13. 物体認識 来栖川電算の
  14. 14. 物体認識とは 画像中の物体の種類・位置・姿勢を推定
  15. 15. 物体認識とは 様々な向き・ポーズを学習させ見えの多様性を獲得 •特定物体認識は素人でも簡単に使える –どんな画像を学習に使うかを学べばOK
  16. 16. 物体認識とは モノをカウント、見た目で分からない情報を表示 •使える場面 工場内で箱の仕分け 体験や評判の調査 ワインラベルで情報検索 AR付箋 集めて応募キャンペーン ARフィギュア
  17. 17. 事例:1000sors 誰でも簡単に使えるクラウド型物体認識エンジン •広い適用範囲 –照明姿勢の変化に強く、様々な撮影環境に対応 •驚異的な精度 –数十万種類をほぼ完ぺきに識別 •圧倒的な性能 –たった1台のPCで数百万種類を瞬時に識別 –台数を増やせばリニアにスケールアウト
  18. 18. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ •きついパースも、帯による隠れも、OK
  19. 19. 事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるアプリ •よく似ていても、複数冊同時も、OK
  20. 20. 顧客事例:Cellars 18万件のワインラベルを認識するアプリ •海外で賞を獲得した日本企業のアプリ! –Asia Smartphone Apps Contest •広告マーケティング部門 Silver Award 2位 –立命館大学 学生ベンチャーコンテスト •最優秀賞 NICT賞
  21. 21. 事例:自動運転関連 車載カメラに映る車や人などを検出・識別・追跡 •単眼でも高精度、大きさ・距離も推定 世界中の走行データを活用
  22. 22. モーション認識 来栖川電算の
  23. 23. モーション認識とは センサー値から動作や行動の種類や位置を推定
  24. 24. 事例:ライフログ NTTドコモ様との共同研究プロジェクト •リストバンドなどから行動を検出・分析 –睡眠〃デスクワーク〃静止〃歩き〃走り〃自 転車〃乗り物〃食事〃… –「行動 ≠ 動作」なものもいける •リアルタイム:数秒 ~ 数分で検出 •低消費電力:数日
  25. 25. 事例:毎朝体操 スマホを持って体操すると腕の動きを認識・採点 •みんなのデータでどんどん賢く
  26. 26. 毎朝体操 モーション認識でフィットネスを楽しくする
  27. 27. ラジオ体操アプリ だれでも、いつでも、どこでも、すぐできる •Android & iPhone ⇒ http://maiasa.jp/
  28. 28. スマホを持って体操 腕の動きを認識・採点し、素敵なレポートを作成 •頑張りに応じてトロフィーがもらえる •みんなの頑張り(統計)を見ることができる
  29. 29. 80,000DL 人突破 86ヶ国で 都市部の 30~50 代に人気 まだまだ増加中 14352 いいね!
  30. 30. マグニチュード3~4 みんなのラジオ体操の熱量を合計するとヤバい! •13.581 GJ 2014年6月22日時点 –実はラジオ体操は運動強度が高い! 熱量 状況 1.500 GJ 雷の平均のエネルギー 1.770 GJ 質量1kgの物体が木星の引力圏から脱出するために 必要な運動エネルギー 2.000 GJ マグニチュード3の地震のエネルギー 4.184 GJ TNT火薬1トンの爆発のエネルギー 8.532 GJ 世界の人口1人あたりの年間消費電力量(2002年) 13.581 GJ 毎朝体操の総熱量 2014年6月22日時点 64.100 GJ マグニチュード4の地震のエネルギー 運動強度 状況 2.0 METS 電車の中で立っている 3.0 METS 庭仕事・野球の野手 3.5 METS 平地での自転車 4.0 METS ハイキング・速足 4.5 METS ラジオ体操 6.0 METS 階段昇降・卓球 9.0 METS 水泳・高強度の長距離 走・筋力トレーニング
  31. 31. 知名度上昇中 ”風変わり” なアプリなので様々なメディアが注目 •Mashup Award 9 –日本最大のアプリコンテストで優秀賞 •アプリソムリエ –【石井寛子アプリ事始】「毎朝体操」 超最先端ラジオ体操第1!? •週刊朝日 –【おすすめアプリ生活】あなたの“ラジ オ体操度”が測れる「毎朝体操」 •日経新聞 –職場で気軽に体ほぐし ヨガ・体操… お助けアプリ •文化放送 –ドコモ団塊倶楽部 –8月23日(土)11:00 ~ 13:00 –アプリ紹介コーナー(生放送)
  32. 32. 認識技術を学ぶ まったくの初心者が
  33. 33. まったくの初心者 長年 SI をやってきたプログラマ •理解力や実装能力はあるが –お客様と話し合い要件をすり合わせられる –大規模な開発案件であってもこなせる •知らないことに抵抗がある –数学や英語に対する苦手意識 –機械学習に対する難しいという先入観 –成果がでない可能性に対する不安
  34. 34. 認識技術の学び方 プログラマの得意分野に合わせ、回数をこなす •座学と演習 –詳しい人が実装レベルまで噛み砕いて教える。 –実装・実験・説明することで理解を深める。 •実践 –教わったことを現実のデータで試す。様々な 組み合わせを試す。実験量命。 –チームメンバーと協力して、認識エコシステ ムを設計・運用し、ユーザ体験の改善に最も 貢献する施策を選び出し、実施する。
  35. 35. 座学 とっかかりを与え、調査・実装・議論できるように •基本的な用語や考え方 •機械学習アルゴリズム •最適化アルゴリズム •検索アルゴリズム •特徴抽出アルゴリズム •認識対象ドメインの知識 •線形代数などの初歩的な数学 •論文の読み方
  36. 36. 演習 実装・実験により理解、性質を説明・比較 •教師あり学習 –AdaBoost, RandomForest, SGD, Back Propergation, Convolutional Neural Network, Bayesian Network •表現学習・クラスタリング・ロバスト推定 –Autoencoder, PCA, K-means, Mean-Shift, RANSAC •近似近傍探索・簡潔データ構造 –LSH, MinHash, rank/select辞書 •特徴抽出 –フーリエ, ウェーブレット, Haar Like, HoG, SIFT, SURF, FAST, BRIEF, AKAZE, D-BRIEF, BinBoost
  37. 37. 狙い アレンジする力(タスクへフィットさせる力) •要件にあったアルゴリズムの選択 •データの分析方法 •効果的な組み合わせ •効率的な実装方法 •スケーラブルな実装方法 •共通するアイデア •数学的な捉え方・考え方
  38. 38. 実践 現実世界のデータでアルゴリズムを試し、理解する •認識エコシステム全体を設計・運用する
  39. 39. 実践 役割をローテーションし、打てる策を理解する •アプリ開発者 –アプリが提供するユーザ体験を伝える。精度を求 めすぎない。 •エンジン開発者 –精度がでる条件とデータやアルゴリズムの性質を 伝える。データの質や量を求めすぎない。 •ツール開発者 –品質と生産性のバランスがよい条件を伝える。 •データ入力者 –実際に入力し、品質と生産性を測定する。
  40. 40. 狙い 結果へのコミット力 •落とし込み方の良し悪し –どんなデータから何を予測するか –アルゴリズムの組み合わせ –どんなデータを作成するか –認識せずに解決できないか •可視化による理解 –ある仮説の検証に有効な可視化方法の考案 –分からないときはとにかく可視化
  41. 41. 実践に適した題材 ラジオ体操は
  42. 42. 実践に適した題材 ラジオ体操のよいところ① •複雑な認識システムにならない –採点問題を分類問題に落とし込める。 –動きの種類が明確に定義できる。 •データを調達しやすい –音楽に合わせて体操するだけで教師が付く。 –ユーザが毎日増やしてくれる。 •理解しやすい –体を動かしてデータの変化を調べられる。 –センサー値から最終結果までが近い。
  43. 43. 実践に適した題材 ラジオ体操はのよいところ② •いろいろな実験ができる –装着部位・デバイス・人の違いによる精度の 違いを理解することで、手法の良し悪しを評 価できる。どのように評価すべきかも学べる。 •データ量を徐々に増やすことで、課題や 使える手法が変わることを学べる –データからの特徴の獲得〃次元圧縮〃高度な 検索〃様々な種類の近似〃データの品質保証 方法
  44. 44. 実践に適した題材 ラジオ体操のよいところ③ •価値提供のための全プロセスに関われる –精度よりユーザ体験の改善が重要なことを学べる。 •試験のたび、気晴らしに体操する –運動不足を解消でき、肩こりにも効く。 –残念ながら数回ではダイエット効果はない。 •デモのインパクトがすごい –客先で技術解説のために体操するとウケる。 –一緒にやるとかなり盛り上がる。 –コンテストで入賞できる。
  45. 45. 続けた結果 数年間
  46. 46. 続けた結果 SIの会社 から 認識技術の会社 へ進化 •売上の大半は認識系 –大企業の認識サービスの開発 –大企業からの研究委託 –大企業との共同研究 –認識エンジンのライセンス販売 •ストックビジネスの割合が拡大 –認識エンジンのライセンス販売 –コンシューマビジネス
  47. 47. これから重要になること さらに学ばなければならないこと
  48. 48. 認識エコシステム 安く高品質なデータを調達できるサービス設計 •ユーザに教師を生成させる技術
  49. 49. 量と質の追及 エンジン開発・ツール開発・データ入力の連携 •作りやすく効果が高いデータを発見する ためのより緊密な連携 –言葉で表すのはブレが大きく、言葉選びに迷 いが生じ時間がかかるが、画像の領域選択な らそこそこ正確でブレない。 •ツール開発とセットになったクラウド ソーシング –既存のクラウドソーシングでは分析が進んで いないタスクのデータは調達しづらい。
  50. 50. 計算資源の設計 エッジコンピューティング × オンライン学習 •できるだけユーザの計算資源を利用 –サーバ費用の節約:スマホの計算能力は高い –機敏なユーザ体験:リアルタイム > 精度 –オフライン利用:待機時間の削減 •できるだけパーソナライズ –計算資源の節約:本人のみのモデルは小さい –高品質なユーザ体験:本人のみだと賢い
  51. 51. 毎朝体操杯2014 in DevLOVE 現場甲子園 時間ですよ!そろそろ準備はいいですか?
  52. 52. 毎朝体操杯2014 1位 毎朝体操Tシャツ •ラジオ体操第1を選んで「再生ボタン」 •音なし を選んで「体操を始める」
  53. 53. お疲れ様でした Twitter でレポートを共有するのを忘れずに •結果 ⇒ http://maiasa.jp/event/devlove2014/ ハ ッ シ ュ タ グ #devlove2014 を追加し、つぶやく
  54. 54. 毎朝体操杯2014本戦 みなさんは自動的にエントリーされました •ラジオ体操してGETしよう! –12月1日 ~ 12月14日 –誰でも参加可能 –上位10名 東海名物(3000~4000円) •カゴメ •味仙 •まるは食堂 •CoCo壱番屋 •オリエンタル •その他交渉中
  55. 55. おしまい 結果がでるまで質疑応答
  56. 56. スタッフ募集中 プロデューサ、UI・UXエンジニア、すぐ来て! •気軽にオフィスへ遊びに来てね! –見学できて、ご飯も食べれて、泊まれる。 名古屋本社(2013年フロア増設) イオン千種・名大病院・名工大の近く 上野支社(2012年開設) 入谷駅・鶯谷駅・上野駅の近く
  • ssuser0272f4

    Apr. 5, 2015
  • masayukisakuma75

    Jan. 17, 2015
  • nobuhirofujimaki

    Dec. 13, 2014
  • tetsuoyutani

    Dec. 9, 2014
  • imaimasahiro

    Dec. 8, 2014
  • eikoishizuka3

    Dec. 7, 2014
  • hideakisuzuki71697

    Dec. 6, 2014
  • DaisukeWatanabe1

    Dec. 6, 2014
  • ShuntaroHara

    Dec. 6, 2014
  • HiroshiShiobara

    Dec. 5, 2014

初心者を育てて認識技術を使えるようにするために取り組んでいることを紹介します。 あと、毎朝体操杯2014を勝手に開催します。 みなさん、毎朝体操をインストールしてラジオ体操をしましょう。

Views

Total views

4,999

On Slideshare

0

From embeds

0

Number of embeds

2,680

Actions

Downloads

10

Shares

0

Comments

0

Likes

10

×