DeNAにおける
先端AI技術活用のチャレンジ
内田祐介
AIシステム部
株式会社ディー・エヌ・エー
1
自己紹介
• 内田祐介(株式会社ディー・エヌ・エー AIシステム部 副部長)
• 〜2017年:通信キャリアの研究所で画像認識・検索の研究に従事
• 2016年 :社会人学生として博士号を取得(情報理工学)
• 2017年〜:DeNA中途入社、深層学習を中心とした
コンピュータビジョン技術の研究開発に従事
• 電子情報通信学会学術奨励賞、FITヤングリサーチャー賞、
映像情報メディア学会技術振興賞受賞、PRMU研究会学術奨励賞、
国際学術会議にてBest Paper Awardを2度受賞
2
Twitter: https://twitter.com/yu4u
GitHub: https://github.com/yu4u
Qiita: https://qiita.com/yu4u
やっていること
• メインプロジェクトでプレイヤー兼落ち穂拾い
• 部としての研究開発計画方針検討
• 新規案件の要件定義からPMまで
• 中途・新卒採用活動
• イベント企画、運営
• 組織マネジメント
• 学会活動
• (Kaggle, SIGNATE)
3
アジェンダ
• AI研究開発を支える組織体制と仕組み
• 技術蓄積のための取り組み
• DeNAにおけるKagglerたち
• DeNAにおけるAI活用事例紹介
4
5
AI研究開発を支える組織体制と仕組み
DeNA 事業ポートフォリオ
• 多種多様な事業領域でのビジネス・サービス展開
• パートナー企業と共に社会影響の大きなサービス創出
• 大規模インターネットサービスプラットフォームの構築
6
ゲーム
エンター
テイメント 新領域スポーツ ヘルスケア
オート
モーティブ
eコマース・
その他
ソーシャル
LIVE
+他社IP利用の
タイトル多数
DeNAのAI技術活用の考え方
• 先端 AI 技術を活用し、価値あるサービスを提供・洗練する
7
大規模
データ
サービス
AI技術
最新研究を
ベースに研究開発
AI活用した
新たな価値ある
サービス設計・実装
サービス・データのサイクルから生まれる
強固なビジネス構造
価値あるサービス提供への継続的な挑戦
AI技術の蓄積と活用
8
実用系
実験系
スピード
パートナーシップ案件 自社サービス
基礎技術開発
実用価値提供
実証実験
実用価値提供
サービス内実験
最新論文の実装・実験
研究成果の外部発信
最新研究を自社
サービスデータを
活用して実験
先端技術の適用実績を
スピーディーに蓄積
確度の高い技術を
活用した価値を提供
自社サービスでは
獲得できないデー
タを活用した、
実験的取組みによ
る技術力の向上と、
新しい価値の探求
AI技術の蓄積と活用
9
実用系
実験系
スピード
パートナーシップ案件 自社サービス
基礎技術開発
実用価値提供
実証実験
実用価値提供
サービス内実験
最新論文の実装・実験
研究成果の外部発信
最新研究を自社
サービスデータを
活用して実験
先端技術の適用実績を
スピーディーに蓄積
確度の高い技術を
活用した価値を提供
自社サービスでは
獲得できないデー
タを活用した、
実験的取組みによ
る技術力の向上と、
新しい価値の探求• 多種多様な事業ドメインに対し
実サービスに直結した技術開発を
様々なスピード感で行う必要がある
DeNAのAI組織体制
• 全社横断部門であるAI システム部が、DeNAの全サービスを
対象に先端AI技術を活用したサービス提供・改善を実現
• ビジネス部隊(AI戦略推進室)と新規事業開拓も検討
10
ゲーム・エンタメ
AIシステム部(共通部門)
オートモーティブ ヘルスケア スポーツ
AI戦略推進室
BizDev
AI研究開発エンジニア
データサイエンティスト
MLエンジニア
インフラエンジニア
…
AIサービス応用を実現するための組織体制
• AI研究開発エンジニア
• コンピュータビジョン/音声/強化学習等の専門技術を保有
• 先端研究を追いながら専門技術を活用して事業貢献
• データサイエンティスト
• 事業の抱える分析課題を解くことに燃えるスペシャリスト集団
• 手段を問わず最高の精度を出すことに泥臭くコミット
• MLエンジニア
• AI技術をサービス上に実装して安定運用を実現
• データの収集、前処理やAPIの提供
• インフラエンジニア
• 膨大なデータを取り扱うためのインフラ基盤構築・セキュリティ整備
• 各エンジニアの運用サポート・コスト管理 11
AIサービス応用を実現するための組織体制
• AI研究開発エンジニア
• コンピュータビジョン/音声/強化学習等の専門技術を保有
• 先端研究を追いながら専門技術を活用して事業貢献
• データサイエンティスト
• 事業の抱える分析課題を解くことに燃えるスペシャリスト集団
• 手段を問わず最高の精度を出すことに泥臭くコミット
• MLエンジニア
• AI技術をサービス上に実装して安定運用を実現
• データの収集、前処理やAPIの提供
• インフラエンジニア
• 膨大なデータを取り扱うためのインフラ基盤構築・セキュリティ整備
• 各エンジニアの運用サポート・コスト管理 12
• それぞれの専門性を相補的に生かし
効率的な研究開発・実応用を目指す
• プロジェクトに応じて適切なメンバーアサイン
事業貢献のアプローチ
• 大企業的な関係:
13
研究部門 事業部門
こんな技術
できましたけど…
じゃあまずは
PoCから…
技術
DeNAのAIプロジェクト
• 研究エンジニアがプロジェクトの立ち上げ時期から参画
• 想定される技術的課題・解決方針を洗い出し
• データの取得方法等について企画段階から検討
• プロジェクトの中で技術開発・技術確立を行う
14
AIシステム部(共通部門)
AI研究開発エンジニア
データサイエンティスト
MLエンジニア
インフラエンジニア
事業部門
プロジェクト
Join!
DeNAのAIプロジェクト
• 研究エンジニアがプロジェクトの立ち上げ時期から参画
• 想定される技術的課題・解決方針を洗い出し
• データの取得方法等について企画段階から検討
• プロジェクトの中で技術開発・技術確立を行う
15
AIシステム部(共通部門)
AI研究開発エンジニア
データサイエンティスト
MLエンジニア
インフラエンジニア
事業部門
プロジェクト
Join!
AI研究開発エンジニア
DeNAのAIプロジェクト
• 研究エンジニアがプロジェクトの立ち上げ時期から参画
• 想定される技術的課題・解決方針を洗い出し
• データの取得方法等について企画段階から検討
• プロジェクトの中で技術開発・技術確立を行う
16
AIシステム部(共通部門)
AI研究開発エンジニア
データサイエンティスト
MLエンジニア
インフラエンジニア
事業部門
プロジェクト
Join!
データサイエンティスト
DeNAのAIプロジェクト
• 研究エンジニアがプロジェクトの立ち上げ時期から参画
• 想定される技術的課題・解決方針を洗い出し
• データの取得方法等について企画段階から検討
• プロジェクトの中で技術開発・技術確立を行う
17
AIシステム部(共通部門)
AI研究開発エンジニア
データサイエンティスト
MLエンジニア
インフラエンジニア
事業部門
プロジェクト
Join!
AI研究開発エンジニア
データサイエンティスト
MLエンジニア
インフラエンジニア
技術蓄積のための取り組み
18
社内勉強会の開催
• 週次で技術トピック(40分x2本)を社内プレゼン
• 社内プロジェクトの技術解説、論文紹介等持ち回り
• 全員に技術発信の習慣を意識付け
• 秘匿プロジェクトで無ければ社外にも積極公開
19
社内勉強会の開催
• 週次で技術トピック(40分x2本)を社内プレゼン
• 社内プロジェクトの技術解説、論文紹介等持ち回り
• 全員に技術発信の習慣を意識付け
• 秘匿プロジェクトで無ければ社外にも積極公開
20
• より深いディスカッションを行うため、
コンピュータビジョン系と
データサイエンス系の輪講も隔週で開催
• Kaggle反省会とかもあります
国際学会派遣
• 年1回、無条件で好きな国際学会に行って良い
• 先端研究の動向把握
• 優秀な研究者とのネットワークづくり
• 主な参加学会
• CVPR, ICCV, ECCV, ICML, NIPS, ICLR, KDD,
AAAI, ICASSP等
• AWS re:Invent、Google Cloud Next、NVIDIA GTC等も
21
勉強会主催・支援
• NeurIPS2018読み会@PFN(共催)
• ICML2018読み会@DeNA(PFN共催)
• CV勉強会CVPR2018読み会@DeNA(会場提供)
• ICLR2018読み会@PFN(共催)
• Deep Learning Acceleration勉強会@DeNA(会場提供)
• ICLR2017読み会@DeNA(主催)
22
OSS公開
• PyTorch_YOLOv3
• YOLOv3のPyTorch学習再現実装
https://github.com/DeNA/PyTorch_YOLOv3
• ChainerPruner
• Chainer向けpruiningライブラリ
https://github.com/DeNA/ChainerPruner
• Chainer_Mask_R-CNN
• Mask R-CNNのChainer実装
https://github.com/DeNA/Chainer_Mask_R-CNN
• Chainer_Realtime_Multi-Person_Pose_Estimation
• OpenPoseのChainer実装
https://github.com/DeNA/Chainer_Realtime_Multi-Person_Pose_Estimation
23
24
DeNAにおけるKagglerたち
DeNAにおけるKagglerたち
• AIシステム部データサイエンスグループに生息する
データサイエンティスト
• スキルセット:
25
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
Kaggle
• 機械学習モデルを構築するコンペティションのプラットフォーム
26
Kaggler
Kaggle支援
• データサイエンティストは、社内手続きを経た上で、
業務として会社のサーバ資源を使ってKaggleに取り組める
• 目安として30%の工数はKaggleに取り組める負荷でアサイン
• Kaggle実績は分析者としての実力の証明
• 会社としてのメリット
• 社外の様々な分析問題と解法に対する知見を広げ
社内の分析問題にも展開可能とする
• 著名なKaggle Masterを抱えることによるブランディング
27
Kaggler募集中です
• 目指すはKagglerにとって世界で最高の職場!
• Kaggleで圧倒的な成果を出し続ける
• データサイエンス案件でスピード感を持って
質の高いアウトプットを出す
28
Kagglerのこれまでの実績
29
DeNAのKagglerである小野寺和樹と
加納龍一を含むチームが、過去最大の
Kaggleコンペである"Home Credit
Default Risk"にて、7198チーム(参加
者数8572名)中2位に入賞しました。今
年4月からのKaggle社内ランク制度開
始以来の、大きな成果となりました!
Kagglerが関わった案件例
• 関西電力とDeNAが、石炭火力発電所の燃料運用最適化を行う
AIソリューションの共同開発等に関して基本合意
30
(プレスリリースより)
関西電力とDeNAは、熟練技術者による
燃料運用のスケジューリング作業の自動
化を目指し、関西電力が設定した課題や
運用条件に基づいて、DeNAが一般的に
ゲームAIに用いられる、膨大な組合せの
中から最適なものを探索する技術を導入
し、アルゴリズムを構築しました。
Kaggleと実業務(個人の感想です)
• 1つの案件を擬似的に体験することができる
• 探索的データ解析 (EDA) からチューニングまで
• DiscussionとKernelの存在
• 失敗しても大丈夫!
• つよいKagglerは1つのコンペでその分野の専門家になる
31
32
DeNAにおけるAI活用事例紹介
DeNAのAI活用
• 多種多様な事業を展開しているDeNAでは、
実活用前提での多種多様なAI応用のチャレンジをしています
33
ゲーム
エンター
テイメント 新領域スポーツ ヘルスケア
オート
モーティブ
eコマース・
その他
ソーシャル
LIVE
+他社IP利用の
タイトル多数
34
交通事故低減に向けた
AI技術活用の取り組み
オート
モーティブ
コンピュータビジョン
データサイエンス
×
• 講演では下記の内容のショートバージョンを紹介しました
是非下記のフルバージョンをご参照ください
• 深層学習を用いたコンピュータビジョン技術と
運転行動モニタリングへの応用
https://www.slideshare.net/ren4yu/ss-87520443AI/
• MLシステムにおけるビッグデータとの付き合い方
https://www.slideshare.net/ShotaSuzuki2/aiml-133183890
35
36
車載カメラからの
高精度地図作成技術
オート
モーティブ
コンピュータビジョン×
• 講演では下記の内容のショートバージョンを紹介しました
是非下記のフルバージョンをご参照ください
• Building HD maps with dashcams
https://www.slideshare.net/KousukeKuzuoka/building-hd-maps-with-dashcams
37
38
ゲーム事業における
AI技術の取り組み
ゲーム
データサイエンス
ゲームAI
×
• 講演では下記の内容のショートバージョンを紹介しました
是非下記のフルバージョンをご参照ください
• 運用中のゲームにAIを導入するには
〜プロジェクト推進・ユースケース・運用〜
https://www.slideshare.net/dena_tech/ai-dena-techcon-2019
39
40
アニメ生成技術への取り組み
Structure-aware
Generative Learning
×
エンター
テイメント
• 講演では下記の内容のショートバージョンを紹介しました
是非下記のフルバージョンをご参照ください
41
• 技術詳細
https://www.slideshare.net/hamadakoichi/anime-generation
生成アニメ
https://youtu.be/tOZW_KWb8b0
AIによるアニメ生成の挑戦 AIによるアニメ中割生成結果
まとめ
• AI研究開発を支える組織体制と仕組み
• 実サービス中で技術確立
• 技術蓄積のための取り組み
• DeNAにおけるKagglerたち
• DeNAにおけるAI活用事例紹介
42
43

DeNAにおける先端AI技術活用のチャレンジ

Editor's Notes

  • #2 本日はDeNAにおけるAI分野における技術活用チャレンジについてご紹介させていただきます
  • #3 まず簡単に自己紹介をさせていただきます。 DeNAにてAI技術を担当しているAIシステム部という部署の副部長をしている内田と申します。 新卒で入社した通信キャリアの研究所で画像認識や検索に関する研究開発をしていましたが、 2年ほど前に、サービスに直結した環境で、エンジニアリングを重視した研究開発を行いたいということでDeNAに中途入社いたしました 今はマネージャーの肩書がついていますが、心はプレイヤーで、優秀な若手に置いていかれないように技術キャッチアップは続けています このあたりのアカウントで深層学習についての技術記事を書いたり、実装を公開をしているのでよろしければ御覧ください
  • #4 よく何やっているの?Twitterで遊んでいるんでしょ?と言われるのですが、色々やっているので何をやっているのと言われるとなかなか答えづらいです 一応メインのプロジェクトが1つあります。これは入社当時の立ち上げからずっと関わっていて、最初は2〜3人で始まったプロジェクトなのですが、人数が増えた関係で一時期はプロマネみたいなこともやっていましたが、今は昔からいて全体像がわかるということで、ポテンヒットを拾うような動き方をしています 3番めはよくある、こういうことができませんかという案件の要件定義を行ったり、実際にプロジェクトになった場合には、小規模であればPMをやったりもします。たいてい初期検討で終わるんですけどね。ただ、そういう初期検討時に色々アイディアを出すのは好きなので楽しいです。 あとは、この時代非常に重要な採用活動にも関わっていて、特に新卒インターンとかは力を入れています 採用活動の一環みたいなものですが、イベント企画とかもやっています あと、いわゆるピープルケア的なマネジメントも行っています そして深夜にこっそりKaggle等のコンペをやっていたりします。マネジメントをやっているとなかなか技術キャッチアップが難しいのですが、なんとKaggleをやることで技術キャッチアップをしていたりします
  • #5 さて、本題の今日の話なのですが、社会実装のためのAIの最新事例ということですが、なかなか詳細をお話できない案件も多いため、 ちょっとメタな、AIを実活用につなげるためのDeNAにおけるための組織体制や、仕組みづくりについてお話し、 後半に活用事例をご紹介する流れとなっております
  • #6 まず、AI研究開発を効率的に行うための組織体制についてお話いたします
  • #7 まず、DeNAという会社の事業ポートフォリオについてご紹介致します。 DeNAといえばゲームの会社というイメージがあますが、立ち上げ中の事業も含めて、多岐にわたる事業ドメインを持っています MOVというタクシー配車サービスや日産さんと一緒に検討を進めているEasy Rideというサービスがあるオートモーティブ事業や、 遺伝子検査のmycode、健康保険組合向けの健康管理アプリkencomといったサービスを展開しているヘルスケア事業があります
  • #8 もともと、私の所属するAIシステム部は分析推進部という名前で、DeNAの各事業ドメインのアナリストが活用する分析基盤を構築していました その時からある考え方として、良いサービスを提供することで、良質なデータが得られ、そこから新しい価値創造につながるような技術開発ができるというサイクルを重視しています
  • #9 AI案件においても、様々なケースが存在していて、それによってどのくらいのチャレンジができるかやスピード感が変わってきます 主に大別すると、他社さんと一緒に検討を進めていくパートナーシップ案件と、自社サービスにAI技術を導入するケースがあります。 例えば、自社サービスであれば、データの取得や活用がスムーズで、更によりチャレンジングな課題にも挑戦していくことができます 逆に、他社さんと協業で進めるような案件では、なるべく自社サービスで培った確度の高い技術を活用していくことが多くなります
  • #10 このように、DeNAでは、多種多様な事業ドメインに対し 実サービスに直結した技術開発を 様々なスピード感で行う必要がある
  • #11 では、そのようなニーズに答えるための組織体制についてお話致します。 AIシステム部は、前述の通り、様々な事業ドメインに対して、横断的にAI技術活用の役割を担っています また、社長直下のAI戦略推進室という部署とともに、新規事業開拓の検討も進めています そして、このAIシステム部には、大別して〜の4種類のエンジニアが所属しています
  • #12 AI研究開発エンジニアは、いわゆる研究よりのエンジニアで、例えば大企業の研究開発組織は、ほとんどこのAI研究開発エンジニアに相当する 役割のメンバーで占められていることが多いのではないでしょうか。 実際の業務の進め方も、各プロジェクトにおける研究開発を進めながらも、日々arXiv等に上がる論文を読んだり、GitHubの実装を読んだりしています 次にデータサイエンティストです。AIシステム部に所属するデータサイエンティストはほとんど後述するKagglerです。 彼らは、解くべきビジネス的な課題の明確化を行い、あらゆる手段を用いてその課題の解決に取り組みます。 このKagglerについてと、AI研究開発エンジニアとの役割分担については後述します MLエンジニアは、AI研究開発エンジニアやデータサイエンティストが開発したAI技術をいかにサービス上に安定的に展開できるかを常に考えており、 いわゆるDev OpsやML Opsに取り組んでいます インフラエンジニアは、上記すべてのエンジニアが活用するクラウド環境の基盤構築やセキュリティ担保を担っています。 弊社での研究開発はほぼ全てGCPかAWS上のクラウドで行われており、何をするにも環境構築が必要となりますが、 各プロジェクトにおいて必要なインフラやマネージドサービス、及びそれらを簡単に取り扱うためのツールをインフラエンジニアが担保してくれるため 研究開発エンジニアは研究開発に集中することが出います
  • #13 このように、様々な専門性を持ったメンバーが有機的にプロジェクトに関わることで、 多岐にわたる事業ドメインにおいて、様々なフェーズの、異なるスピード感を持ったプロジェクトに対応することができるようになっています
  • #14 では次に、実際のプロジェクトとの関わり方についてお話します いわゆる大企業の研究部門における事業部門との関わり方は、事業部門のニーズに基づき研究部門が技術を開発し、それを事業部門が活用するという関係が多いかと思います この体制は、分野においては非常に有効に働くと思うのですが、現在のディープラーニングに代表されるようなAI技術の開発においてはいくつかの問題があります 一番大きいのは、実サービスから得られたデータではないデータを元に開発された技術を、実サービスに適用する際のギャップが大きいことです。 大抵そこに新たな技術開発を行わなければ実用に足る精度が出なかったり、あるいはそもそもそのサービスにおいていちばん重要な技術ではないといったオチが待っていたりします。
  • #15 これに対し、DeNAでは、AIシステム部単体で技術開発を行うのではなく、実際の事業部門のプロジェクトに参画しながら、その中で、実データを用いていきなり技術確立をしてしまいます。 特に、新規プロジェクトでは、立ち上げ時期からどのような技術課題が想定されるかを検討したり、必要となるデータの取得方法についても検討を進めます。 これにより、二度手間のようなことがなくなり、必要十分な技術開発をスピーディに実現することができます。 当然ある種一足飛びに技術開発を行うので難易度は高いですが、前述のように様々なエキスパートを適切にアサインすることでこの課題にチャレンジしています そして、そのプロジェクトの難易度や規模、求められる要件によってアサインするメンバーは変わります
  • #19 次に、技術蓄積のための取り組みについて紹介致します
  • #20 前述の通り、AIシステム部では、様々な事業ドメインに対して技術貢献をする必要があり、その技術分野も多岐にわたります。 当然各メンバーの専門はありますが、そのナレッジシェアと全体的な技術力向上のために社内勉強会を定期的に開催しています 具体的には、 基本的には各プロジェクトで必要な要素技術についてですが、当然社内だけに閉じてしまってはもったいないため 秘匿情報に当たらないような形でまとめ、社外にも積極公開することが多いです 社外勉強会の発表前の練習のような形で発表を行うこともできます
  • #22 また、国際学会への調査も積極的に支援しています ここでの調査内容は当然先程の社内勉強会にて報告が行われるほか、社外勉強会でも報告を積極的に行っています
  • #23 社外勉強会の主催や支援も積極的に行っています。 主にトップカンファレンスの読み会を実施しています どうせ調査に行って報告するのであれば、こういう形のほうがモチベーションもあがり、ハードルも上がる
  • #24 また、最近の深層学習に関連するOSSの公開も行っています 技術力の底上げという観点と、プレゼンス向上という観点で公開を推奨しています
  • #26 こちらはデータサイエンティスト協会におけるデータサイエンティストに求められるスキルセット
  • #28 AIシステム部では、Kaggleの取り組みに対して支援を行っています。具体的には、AIシステム部のデータサイエンティストは、〜
  • #32 最初から最後まで処理を行うコードがシェアされる それを実際に動かすことができる また、Kaggleに取り組んでいると、うまくいくと思ったアプローチがうまくいかないケースによく直面します。このあたりは、自分自身の肌感を鍛えるという大きなメリットがあります
  • #34 今回のお話は、活用といいつつ、現在進行系でチャレンジをしているものが多く、AIでこんなに儲かった、という話ではないのでご容赦ください
  • #41 最後に、より技術的なチャレンジを行っている取り組みの紹介を致します
  • #43 AIシステム部自体の立ち上げはまだ2年位で、組織課題も多い 組織の強化や立ち上げについて課題をお持ちの方がいらっしゃいましたら是非ディスカッションさせてください