AIが生み出す
価値の最大化
一般社団法人リテールAI研究会
テクニカルアドバイザー 今村修一郎
自己紹介
• 高校在学中の16歳に、マイクロソフト認定システ
ムエンジニアの資格を、日本最年少で取得。高校
に通いながら個人事業主としてIT業界でのキャリア
をスタート。
• 慶應義塾大学環境情報学部へソースコードを提出
して、AO入試に合格。1年生秋学期より清木研にて
メタデータベースの研究に参加。
• 卒業後、P&Gジャパンに入社し、ビックデータ分析
や機械学習関連の開発に従事。現在もディレク
ターとして日本のデータサイエンス部門を統括。
• 2017年に一般社団法人リテールAI研究会に参画し、
テクニカルアドバイザーとして、IT技術を駆使した
小売流通業の改革に取り組んでいる。
Agenda
AIビジネスの現状と問題点
Return on Modelという考え方
成功例と失敗例の共有
今後起こること
87%
AIビジネスの現状
• 87%のAIプロジェクトが本番環
境に移行できてない。
• Experimentをやめて、実際に使
う必要がある。
• 使いはじめることができても、
使い続けるのさらに難しい。
• 1年以上運用されることはまれ。
https://venturebeat.com/2019/07/19/why-do-87-of-data-science-projects-never-make-it-into-production/
データ
• 大企業が多くを保有し、日々
のビジネスプロセスから生成。
• 非テクノロジー部門のドメイ
ン知識により成立している。
• データオーナーのテクノロ
ジーに関する知識は乏しい。
サイエンス
• 主戦場はアカデミアで常に新
しい手法が生み出されている。
• リサーチ部隊中心のスペシャ
リスト集団。
• ビジネスプロセスからは遠く
データの解釈は苦手。
なぜデータサイエンスは難しい?
コロナの影響
• 刻々と状況が変化するため、
モデルの精度も安定しない。
• 過去データを前提としてよい
のか非常に怪しい。
• データを蓄積している間に状
況も変わってしまう。
• ずっとExperimentから抜け出せ
ない状況に拍車がかかる。
https://bizzine.jp/article/detail/4653#week
How to Stop Experiment?
AIビジネスにおける最重要課題
Return on Modelという考え方
モデルが生み出す価値を最大化するアイディア
Return on Modelとは?
Return on Investment(費用対効
果)をAIプロジェクトに適用
学習コストを最小化し、素早く
推論へ移行する。
推論からのアウトプットを最大
化して継続する。
Accuracy至上主義からの脱却
• モデルが生み出す価値に着目できるかどうか?
• 推論したあとに、なにをするのか?
• データや特徴量の解釈はできているのか?
• 学習はコスト、推論が利益。
• 推論環境を考慮できているか?
• 再学習やGPUコストについて、推論した価値とみあっているか?
• 学習に1か月かかれば、その分ビジネス価値は先送りになる。
• チューニングにより、精度はよいが寿命が短いモデルと、精度はそこそこで長く
使えるモデルを、比較しているか?
Return on Model
成功例と失敗例
リテールAI研究会のPoC事例から学ぶ
リテールAI
研究会とは?
https://retail-ai.or.jp
¥1200000
00000000
主要参加企業
PoCを推進する分科会活動
• 最初から複数社でPoCを実施することにより、設計を汎用化。
PoC後には業界標準として水平展開可能。
• 社会実装を目指すDeep Learning Labと共同で事例を創出。
リテールAIの
よくある失敗談
• 個社で進めるためフルカスタマイズ仕様に
• 他社への水平展開ができなくなる
• ひたすらPoCが終わらない
• ビジネス側とエンジニア側の興味の違い
• いろんな手法が次々登場してくるのでエンジニアの興味はつきない
• ビジネス側は推論したあとになにができるかに興味がある
• 工数がかかるのはデータ整備や学習だが、利益を生み出すのは推論
• 推論した後にどんなアクションをとるのかが議論されない
実例
棚割り カメラ データコンペ
ビジネス部門が
初めて機械学習
をやってみた
• ユニ・チャームが生理用品で欠品を削減
• SKU数が多すぎることにより陳列量が確保でき
ず欠品が多発しているので、SKU数を削減して
売れ筋の在庫を増やしたい。
• Azure Databricksを使用して機械学習のモデルを
作成し、店頭実験を行い9割近い欠品を削減。
• https://news.mynavi.jp/kikaku/azure_case_td-98/
成功した理由の考察
• 棚割という高度なドメイン知識が要求され
る事案については、非エンジニアが圧倒的
に強い。
• 推論したい内容が明確なのと、推論後にア
クションまで落とされる。
カメラと
画像認識を
活用した
商品検知
• 問題は商品を画像で認識すること
ではなかった。欠品の場合、カメ
ラをつけたところで商品が補充さ
れるわけではない。
• 実際のところ、足らないのは補充
の人員だった。
• 推論した後のアクションを考えた
上で、精度や推論頻度、本当に画
像認識が必要かを議論するべき。
• 新商品やパッケージ変更が行われ
るごとに発生するラベル付けと再
学習のコストの高さの障壁に。
ポイントカードデータを活用した
日本初?のデータコンペ
• テックな人にリテール業界に興味を持ってもらう
• Atma社にコーディネーションを依頼し80名を超
える現役データサイエンティストが集結
• True Data社のマスキングされたデータを業界標
準として採用しAzureの各種環境を提供して実施
• https://atma.connpass.com/event/167739/
精度以外にもAIの
価値を高めた事例
• 上位チームの特徴量を考察することにより、ビジネス価
値の高いインサイトが抽出できた。
• SHAP等のModel Explainabilityもモデルの解釈自体に価値を
持つ場合もあり、精度が低くても貢献は可能。
コロナ禍でも
できること
データとサイエンスをつなぐための人材育成
Azure Databricksを使った
非エンジニア向け研修
• 会員社のビジネス部門のユーザーをスキルアップ
• 50社100人以上に対して実施済み
• 一部有償にて研修事業として開始
• はじめてのクラウド、はじめての機械学習というレベル感
• 非会員の一般向けにも有料で提供開始
• https://r-kentei.com/
結果と考察
• 共通で使えるノートブックを開発し、実質的に
デファクト。
• データのみ自社に差し替えられる仕組みをAzure
上に構築。
• 推論後にすぐアクションがとれるビジネス部門
は強いし、クラウドとも相性が良い。
エンドユーザー研修
• サブタイトル
https://r-kentei.com/
リテールのドメイン知識と
Azure Databricksのハンズオンを
一般向けに提供
最速でプロダクションに移すことを
ゴールに設定
Return on Modelを
高めるためのヒント
• 学習はコスト、推論が利益。精度以外の視点から議論を深めることができるか。
• ビジネスユーザーのスキルアップを行い、推論後のアクションを明確にする。
• 学習環境ではなく、推論環境から構築をはじめる。
• リテール業界においてはAzure Databricksがベストプラクティス。
• テクニカルな実装などはDLLのセミナーにて追加講演を予定。
これからおこること
• ニューノーマル時代、DXは進み、
既存のプロセスは再構築される。
• 過去データの価値も少なくなっ
た今、新規参入には最適なタイ
ミング。
• 価値を生み出し続けることで、
AIは生き残る。
AIの社会実装が当たり前になる世界へ
Return on Modelの考え方

[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック