nagoya IT nomikai 20130927

2,363 views

Published on

名古屋IT飲み会2013.9.27の発表で使う資料です。

「来栖川電算の認識技術がラジオ体操で鍛えられるわけがない。」というへんてこなタイトルですが、要するにラジオ体操アプリ「毎朝体操」の宣伝を兼ねた弊社の取り組みの紹介です。

Published in: Technology
0 Comments
7 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,363
On SlideShare
0
From Embeds
0
Number of Embeds
1,040
Actions
Shares
0
Downloads
3
Comments
0
Likes
7
Embeds 0
No embeds

No notes for slide

nagoya IT nomikai 20130927

  1. 1. 来栖川電算の認識技術が ラジオ体操で鍛えられるわけがない。 有限会社 来栖川電算 山口陽平 名古屋IT飲み会 2013.9.27
  2. 2. 「毎朝体操」知ってる? 今すぐダウンロード ⇒ http://maiasa.jp いつでもどこでもラジオ体操できるアプリ
  3. 3. • GooglePlay: 健康&フィットネス 60位 • Facebook: 7384いいね! 人気上昇中! もうすぐ10000ダウンロード突破!!!
  4. 4. • 中高年に人気(若者カモン) – 夏休みが終わっても減らない。 むしろ増えた。ドワンゴさん? • 朝と夜に使われることが多い – 放送時刻でなくてもできる! 各地で使われてる 都会だけじゃない!離島でも!海外でも!
  5. 5. かるく実演 • スマホを持ってラ ジオ体操⇒採点! • 認識したモーショ ンがアニメに • 統計が見られる • ラジオ体操第2も ダウンロードして発 表の終わりを待て! http://maiasa.jp
  6. 6. 自己紹介&会社紹介 要するに技術力で開拓するタイプ
  7. 7. • 必要なら何でも徹底的にやる研究者 – プログラミング言語・データベース分散 – アルゴリズム・機械学習・CV・自然言語 – 名古屋工業大学出身・未踏ソフトウェア経験 – 世界を美しく記述することを夢見る35歳 • 人を驚かせるのが好き – ハードリアルタイムJavaVM – 1000台越え構成のペタバイト分散DB – 秒間1000万クエリ処理できるKVS – 超多クラス対応の超高速物体認識エンジン 山 口 陽 平 @melleo1978 ※あくまでもイメージです。 実物に髪の毛はありません。
  8. 8. • 概要:10周年! – 名古屋工業大学発ベンチャー(2003年) • 目的:ロボの頭脳を作る – 知的インターフェイスによる社会の変革 – ソフトウェアの品質・生産性の向上 • スタッフ:30人 – 役員3人,正社員10人,見習い10人 – データ作成6人,家政婦1人 – IPA未踏ソフトウェア経験者多数 • 社風:難しことを楽しく – 職人,挑戦,自由,昼食・夕食・飲み会は無料 来栖川電算 http://kurusugawa.jp/ 弊社が目指すロボ ※写真はあくまでもイメージです。
  9. 9. 事業戦略 • 知的インターフェイスでユーザの近くへ SI・コンサルティング コンシューマサービス ライセンス提供 技術研究・データ作成 大規模インフラ構築 拡 大 中
  10. 10. 情景画像文字認識技術 来栖川電算の
  11. 11. 情景画像文字認識とは?
  12. 12. 情景画像文字認識とは?
  13. 13. 情景画像文字認識とは? • 従来のOCRとは戦場が違う – 悪環境下での文字認識 • 手書き・様々な書体・かすれ・点描・きついパー ス・統一性のない並び・逆光・陰・影・グラデー ション・モアレなど SF世界の技術
  14. 14. 洗練された仕組 • 深いパイプライン – 各フェーズで機械学習によるノイズ除去 • 統計的な特徴選択 – 大量のデータで大量の特徴を自動的に選択 • 高度なアルゴリズム – コンパクトなメモリ表現・近似的な探索 平 滑 化 断 片 抽 出 行 抽 出 断 片 抽 出 文 字 抽 出 文 字 認 識 行 認 識 単 語 認 識
  15. 15. 緻密で膨大なデータ • 文字レベルの教師 – 文字・位置・形・歪みなどの様々な情報 – 内製ツールによる高度な入力支援により実現 • 人海戦術によるゴリ押し – 大規模サービスから収集した画像に対して、 東北の方たちが毎日教師作成
  16. 16. 事例:タンゴチュウ • 写真をつぶやくと文字認識するサービス 葛の葉宛(@tcfox)につぶやこう!
  17. 17. 事例:モバイル版 • evernoteへ写真をアップロードするつい でに文字認識するアプリ(Android)
  18. 18. 物体認識技術 来栖川電算の
  19. 19. 物体認識とは? ①画像に写る物体の名称・姿勢を推定する
  20. 20. 物体認識とは? ②物体が写った画像をたくさん覚えさせる
  21. 21. 競合とココが違う! • 広い適用範囲 照明・姿勢の変化に強く、様々な撮影環境に対応 • 驚異的な認識精度 – 数十万種類の物体をほぼ完ぺきに識別 • 圧倒的な処理速度 – たった1台のPCで百万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト • 簡単な操作 – 画像と教師をアップロードするだけ
  22. 22. 事例:ShotSearch • 表紙を撮影して発売日や口コミなどを チェックできるアプリ(Android/iOS)
  23. 23. 事例:ShotSearch • 絵柄や構図がよく似ていてもイケル!
  24. 24. 事例:1000sors.com • 誰でも簡単に物体認識アプリが作れる – 様々な企業で活躍中!!!
  25. 25. その他の事例 • かなりいろいろな場面で使える 工場内で箱の仕分け 体験や評判の調査 ワインラベルで情報検索 AR付箋 集めて応募キャンペーン ARフィギュア
  26. 26. モーション認識技術 活動量推定技術 来栖川電算の
  27. 27. モーション認識とは? • 各種センサーから動作の種類を推定する – (例)ライフログ・体操採点・危険検知
  28. 28. 活動量推定とは? • 各種センサーから活動量を推定する – (例)心拍数,カロリー,歩数
  29. 29. 洗練された仕組 • 統計的な特徴選択 – 大量のデータで大量の特徴を自動的に選択 – 加速度センサーだけでも非常に高精度 • 高度なアルゴリズム – スマホ内で動作するレベル • 自動的な教師収集 – 勝手に賢くなる
  30. 30. 事例:毎朝体操 • スマホを手に持ってラジオ体操すると採 点し、レポート化してくれるアプリ – Android 2.3.3以降
  31. 31. データマイニング技術 来栖川電算の
  32. 32. 事例:大学病院 • Hadoopによる冗長化で高アベイラビリティ • Pig+UDFにより手軽で自由な分析をサポート
  33. 33. 事例:広告企業 • 最新手法で分析し、ニーズ・施策を発掘 • 分析期間・分析対象は何十倍にも増える予定
  34. 34. 事例:組込企業 • 並列計算に対応した最新の手法を活用 • クラウドをスポットで活用して経費節約
  35. 35. 事例:ECサイト • Hadoopによる冗長化で高アベイラビリティ • Pig・hBase・MapReduceによるリアルタ イム集計
  36. 36. 事例:大規模試験 • クラウドをスポットで活用し、期間と経 費を大幅削減
  37. 37. 事例:大規模学習 • 文字認識のための大規模機械学習 – 30タスク(8段) – 4~5日/回(普通のcore i7マシン) – cc2.8xlargeのSPOTで節約(時間:1/4,費用:1/2) • ※1時間以内にセーブポイントまで進める工夫が必要
  38. 38. 来栖川電算の認識技術がラジオ 体操で鍛えられるわけがない。 来栖川電算内で行っているトレーニング
  39. 39. 目次 • データ分析が仕事になるケース • 機械学習 • だからトレーニング • トレーニング:応用 • トレーニング:風景 • トレーニング:結果
  40. 40. データ分析が仕事になるケース • 直感でパッと判断できない – データが多い,データの粒度が細かい,データの 並びに意味がある,データから意味を取り出す方 法が分かっていない • こういうのを依頼される – 行動履歴からのユーザ属性の推定 – 音声からのテキスト認識 – 画像からの文字認識 – 動画からの物体認識・物体追跡 – 加速度からのモーション認識
  41. 41. 機械学習 • データに隠された法則を取り出す技 – 職人技を明文化 – データでプログラミング • データを効率的に処理する技 – 複雑な計算を単純な計算の組み合わせで近似 – 良く似たデータを同一視
  42. 42. だからトレーニング • 基礎:座学 – 機械学習に関する基礎知識の習得 – 学習アルゴリズムを実装し、実験 • 応用:モーション認識 – データ採取アプリを実装し、データを採取 – データを分析し、特徴を実装 – 実装した特徴を使って性能測定 – 結果を分析し、対策をうち、性能を改善
  43. 43. トレーニング:応用 • データに関する包括的な取り組みから 様々なことを学ぶ データ採取 ・偏り・ノイズ 知識表現&アル ゴリズム ・データ量 ・組み合わせ数 評価方法 ・観点・尺度
  44. 44. トレーニング:風景 • オフィスや公園や駅で、スマホを持って – 止まる、歩く、走る、スキップ、ジャンプ、 階段、自転車、バス、電車、ラジオ体操など • 不審者ではないので通報しないで!!
  45. 45. トレーニング:結果 • そして毎朝体操が生まれた! – 呼び水となり行動推定の依頼急増 • 大手キャリア・大手メーカーなどと既に開始
  46. 46. トレーニング:結果 • そして毎朝体操が生まれた! – 呼び水となり行動推定の依頼急増 • 大手キャリア・大手メーカーなどと既に開始 準備はいいですか?
  47. 47. 宣伝 時間があれば
  48. 48. • ビッグデータに関するアンカンファレンスするよ! • 名古屋からも多数参加!(来栖川電算の名前が!) JAWS FESTA Kansai 2013
  49. 49. • 使いたい人は問い合わせてね! 物体認識クラウドサービス 1000sors.com
  50. 50. • 気軽にオフィスへ遊びに来てね! – 連絡があれば、見学できて、ご飯も食べれて、 泊まれる。 スタッフ募集中! UI・UXが分かる人、今すぐ来て! 名古屋本社(2013年フロア増設) イオン千種・名大病院・名工大の近く 上野支社(2012年開設) 入谷駅・鶯谷駅・上野駅の近く
  51. 51. 参考文献 リンクとか
  52. 52. • 来栖川電算 – http://kurusugawa.jp/ • タンゴチュウ(情景画像文字認識)のキャラ – http://tangochu.jp/ • 1000sors.com(物体認識) – http://1000sors.com/ • 毎朝体操(モーション認識) – https://play.google.com/store/app s/details?id=jp.kurusugawa.team R.maiasa • 株式会社簡保生命保険 – http://www.jp-life.japanpost.jp/ 参考文献
  53. 53. • 天候アイコン – http://wunderground.com/ • 変ゼミのロゴジェネレータ – http://bkaclub.web.fc2.com/henzemi_gen .html • ICON HOIHOI – http://iconhoihoi.oops.jp/ 素材たち 使わせて頂き、ありがとうございます!
  54. 54. ご清聴ありがとうございました

×