ベイジアンネットワーク技術と	       サービス工学におけるビッグデータ活用技術	            最近の応用事例から 	  (独)産業技術総合研究所	     サービス工学研究センター 副研究センター長,	     デジタルヒューマ...
行動履歴系ビッグデータ 	          からのモデリング               	•  状況依存性のある行動の履歴データ[購買・移動など]	  •  一人十色の複雑化した生活者の多様性[非一様・混合]	  •  変動する外的環境のも...
大規模データ活用技術	     •  ID付POSデータなど大量データが蓄積	       •  数千人規模のアンケートも容易に実施可能	       •  ただし、データ分析、データマイニングだけでは、結        果の活用が限定的(従来...
人間の認知評価構造・                                         生活行動モデル�                                          楽しい�日常の              ...
例:顧客接点におけるダイナミクスの例    (消費者行動選択とプロセスモデル)                    	                               デジタル	  店頭での会員勧誘	 メルマガクーポン	     ...
大規模データに基づくサービスの最適設計ループ	  •  要素として顧客を含んだ包括的な系	    •  顧客の反応を通じたフィードバックループ	Short range	                                    設計...
サービス工学:サービス(価値共創)システム     (サービス場面の人々の活動を対象としたシステム)  「モノの伝達」から「コトの伝達」へのパラダイムシフト	                        顧客接点	     提供者(企業)	 ...
サービスの特性	l 無形性:手に取ったり、見たりできない	  l 消滅性:保存しておくことができない	  l 同時性:サービスの提供と消費が同時	  l 異質性:サービスの価値は均一ではなく、	     標準化できない	  こうした特質...
The unified service theory                         	The unified service theory(Sampson 2006)	 Service can be characterized...
サービスシステムダイナミクスの計算モデル化  サービスデザイン	                                        生活者の計算モデル化と	           最適化	                       ...
生活中の履歴データなどの大規模
  データから再利用可能な計算モデルへ	従来の統計(母集団依存性大)	   l 各事例の保存と検索(データベース)	   l 単独の頻度、集計、統計	   l 複数の変数の間の関係(相関、独立性)	   l...
ベイジアンネット	和文書籍	ベイジアンネットワーク技術:東京電機大学出版局(本村・岩崎)	ベイジアンネットワーク概説:培風館(繁桝・植野・本村)	   条件付確率:	 P(目的変数| 説明変数)     条件付確率 P(X3|X1,X2)	  ...
ベイジアンネットの
            ベイズ的世界観	•    ドメインを全て確率変数として表現	•    ドメインの状態は各確率変数の同時分布	•    観測可能、決定的な場合を包含	•    末端の変数は事前確率分布を仮定	•  目的...
ベイジアンネットの学習(モデル構築)	 	  確率変数の選択	   情報量の高い、重要な変数の抽出	      グラフ構造の学習	 情報量基準による(局所)モデル選択	      条件付確率(パラメータ)の学習	 	   離散確率変数: CPT...
条件付確率表	        X1      Y	          Ex.                        P1   0.3                        P2   0.4        X2          ...
ベイジアンネットの学習(グラフ構造の探索)	      X	        Y 	     ?	    OR           X	            Y 	   ?	Y	                     Ex.         ...
確率推論(belief	  propaga4on)	                                                   Observation e+                               ...
Belief	  propaga4onアルゴリズム	Pr( X = x) = αλ ( x)π ( x).                                U1      ……       Uiπ ( x) = ∑ P( X | ...
ベイジアンネットワーク構築・推論ソフト BayoNet	  	        (1998:IBIS、AI学会などにて発表)
 (2003∼:商用ソフトとして販売, COMDEX出展)
(2005∼ 本格的実用化によりソリューションビジネスも提供)
ベイジアンネット技術とその深化	•  大規模実データの中から、	     ・非線形・交互作用を含むゆるやかな因果的連鎖構造   を自動的に抽出し、	     ・計算機上のモデルとして作成し、	     ・推論やシミュレーション、制御などに活用で...
大規模データモデリング技術	サービス工学における最適設計ループの実現のための	  •  大規模データ(ID-­‐POS,	  アンケート,	  操作履歴,	  テキスト)	  •  カテゴリセット抽出(PLSA,	  クラスタリング,	  質的...
対象:モデル と 進め方:ダイナミクス  生活と技術のデザイン	                                      生活者の計算モデル化と	        最適化	                            ...
大規模データ活用技術	     •  ID付POSデータなど大量データが蓄積	       •  数千人規模のアンケートも容易に実施可能	       •  ただし、データ分析、データマイニングだけでは、結        果の活用が限定的(従来...
大規模データモデリング技術	•  カテゴリマイニング:小売商材−顧客の自動分類	       –  ライフスタイルや価値観に関するアンケート結果から、利        用者視点の商品カテゴリ初期値を作成	       –  ID-­‐POSデー...
ニーズ分析と計算モデル化アプローチ		  大規模なID-­‐POSデータ、全てを用いた分析コスト、手間	    –  データの件数約数十億トランザクション	                 データイメージ	                   ...
pLSIによる顧客ー商品の同時分類
                                     (Ishigaki, Takenaka, Motomura, IEEE ICDM 2010
                     ...
大規模データモデリング技術	  POSデータ	                   アンケート・インタ                                                      商品データベース	        ...
生活者の計算モデル化	【PLSI+Bayesian networkの統合モデリング】① 生活者視点での顧客と商品のカテゴリ分類(確率的潜在意味解析)数千∼数万の顧客や商品を数個から十数個のカテゴリに次元圧縮できる                ...
ダイレクトメールを用いた	              大規模なライフスタイルアンケートの実施 	      • 2009年12月にコープこうべの組合員約1万7千人へ,DMハガキを用いてアン      ケートを送付.約4000名の回答を得た.  ...
ライフスタイルアンケート結果の分析による	           6つの消費・生活因子の抽出	                             因子分析から,特長のある6つの                             因子が...
ライフスタイルアンケート結果の分析による	                  6つの消費・生活因子の抽出	 各顧客に対して6軸の因子に対する得点を付与できる	  <例>	            こだわり消費派のAさん	             ...
大規模ID-POSとアンケート結果の統合1
            (各クラスタに属する顧客の心理特性の可視化)	各クラスタに対して6軸の因子に対する得点を計算⇒	各クラスタに分類された顧客のパーソナリティの傾向を可視化可能に	(分類された顧客...
大規模ID-POSとアンケート結果の統合(計算モデル化)	  顧客パーソナリティ因子と商品群の関係をPOSデータからベイジアンネット化	  (青い線:各ライフスタイルカテゴリーに対して全商品カテゴリーで得点が高い3商品カテゴリー)	  (赤い線...
利用者の特徴を表すベイジアンネットモデル	顧客特徴データベースを用いて、カテゴリ分類、ID-POS解析、
アンケートデータ解析の結果を統合した、ベイジアンネットワークモデルを構築した。	ベイジアンネットワーク:関係の強い変数間の関係を自動的に発...
利用者の心理特性(アンケート結果)をモデル化したベイジアンネットの例            各商品カテゴリを購入している利用者の解釈 (アンケート回答との関係性)	Class06	  おやつ的	Class07	  洋風朝食的
利用者の購買行動を表すベイジアンネットモデル	対象ジャーナルデータを用いて、カテゴリ分類、ID-POS解析、
アンケートデータ解析の結果を統合した、ベイジアンネットワークモデルを構築した。	         ジャーナルデータについてのベイジアン...
ベイジアンネットを用いたシミュレーション	作成したモデルを用いて状況依存性についての確率推論を行った。		P(回答 家庭生活充実してない | お手軽夕食商品, 夕方に購入) → 高い確率	        0.3	                ...
来店行動予測モデル→ 需要予測への応用                                   	   非対称な分散の構造をモデル化したベイジアンネットによる予測結果の補正   ・ベースモデルの予測残差に対しベイジアンネットモデル(...
非対称分散構造モデルによる需要予測補正効果	  条件付層別差分モデル(ベイジアンネット)による予測結果の補正  ・補正が必要なブレの大きい日についてのみ、限定的に補正する	    ・下ブレ、上ブレの判定→ 符号関数ξ(x)をBNでモデル化したも...
ベイジアンネットによる   大規模データ�からのモデリングと情報サービス�       アプリケーション�            Web, 携帯、カーナビ�          様々な状況・ユーザ� レストラン情報� ネット配信音楽�     シ...
リコメンデーションの例(CFからBN)	・協調フィルタリング(CF)	(ex. アマゾン、アスクル):P(X) ∝∑類似度(u) 購入経験(u,X)	                            u 			             ...
人間の心理的特性のモデル化	U:ユーザの特徴を表すベクトル	 (年齢や所得など)	X: コンテンツ(レストラン情報)の属性ベクトル	 (客層や平均予算など)	E: ユーザUがXをどのくらい「好き」だと思うか	 (例えば1から5までの5段階評価)...
ユーザ・状況属性の追加	         X1	          X2	       対象	                   P(E|X , U , S)           X3	       の特徴	            X4	  ...
ユーザ適応型カーナビ(レストラン推薦)
(本村・岩崎「ベイジアンネットワーク技術」東京電機大出版局)	  コンテンツプロバイダ                     車両用情報システムジャンル                         ...
例:カーナビでのレストラン選択のモデル	  (デンソーITLとの共同研究、iPhoneアプリ化)	                                                                   年齢層   ...
携帯電話によるユーザ適応型知的情報サービス:
   小野(KDDI研究所)・本村・麻生:User	  Modeling	  2007など	2700人へのアンケート結果からモデルを構築、デモサービスを実演 à プレス発表・NHK放映
•  映画推薦サービスにより集積する大規模データをマーケティングに活用	     (KDDI研究所、松竹との共同研究)	  観測・モデル化(状況を入力)	                       auOneラボのサービス	手段→映画館	  ...
映画宣伝支援システムの利用例	                   どんな顧客?	   どんな映画?
予測結果	                             「実話に基づいている」という	                             具体的な点をアピールすることにより、	                         ...
予測結果を基に、ストーリーのリード部分を修正し、	            実話が基になっていることを強調した	  (落合,	  下角,	  小野,	  麻生,	  本村,	  人工知能学会全国大会2009)
20代と30代では、同じ映画であっても	                訴求ポイントが明確に異なる	     20代の結果	                 30代の結果	   20代向けの雑誌には、	            30代向けの雑誌に...
例:通信販売支援へのベイジアンネット活用 	      既存データからは推測できない顧客のニーズやCSRの販売ノウハウをモデル化して活用	                                                     ...
ベテラン社員の知識と販売データから	                現場の知識をモデル化し組織全体で活用	  売り上個数	                                 ベイジアンネットとし                  ...
利用者計算モデル活用技術	      	      デジタルサイネージへの応用シナリオ	          デジタルサイネージ�            店舗内キオスク端末、  ライフスタイル    提案�     携帯、インターネット�    ...
店頭端末:POSEIDON                                               全国30店舗、利用総数約4000件  小売現場での活用事例                                 ...
小売サービスにおける支援技術パッケージ                                               顧              従業員報告(従業員アンケート・店舗レポート等)	   基本DB関連        ...
生活中の履歴データなどの大規模データから                                 再利用できる知識(因果的構造)の獲得	                                従来の統計(母集団依存性大)	   ...
因果的知識の例	                                  事故が発生したという事象から過去に遡る。	                                  つくば市立の保育所での調査アンケートの例	  ...
事故の分析:保育園でのひやりはっと事例	                                	                                     状況	            モノ	              ...
日常生活における因果的構造とは?	                                例:個人の認知・評価構造	                                  「なぜ」を繰り返すインタビューによる気づき	   ...
運転中の走行シーンの認知構造	                                (画像提供:トヨタ自動車)	Digital Human Research Center                                ...
Digital Human Research Center安全�危険�                                 初心者(運転は年一回位)の認知構造の例
初心者の回答例	                                  「注意を引くものがある、多いと怖い」	                                  「バスやトラックなどの大きな車が気になる」	   ...
Digital Human Research Center   熟練者(運転歴15年、週5回以上)の認知構造の例	                                       安全�      危険�
熟練者の回答例	                                  「自転車は後ろを見てないので危険」	                                  「こっちを見ている相手は大丈夫」	         ...
危険性の評価・認知構造	                                走行シーンの認知・評価の因果的階層構造には下図のような                                個人差がある。	           ...
事前知識を活用して、統計データの情報を補う                                認知・評価構造の定量的モデリング	                                 Y.Motomura, T.Kanad...
[事故事例を知識化し、制御するために]	                                事故予防のための行動と状況を含んだ因果構造をモデル化�                                           ...
日常生活を知識化する	                                  例:子どもの事故予防の場合                                  事故(unusual)の因果的関係をモデル化      ...
事故履歴データ(受診200事例)からの
                                子供の事故状況のモデル化	                                                 Location...
事故の関係モデルを使った確率推論	                                              Set: 	                                              女児, 1歳 ...
ベイジアンネットによる大規模データからのモデリ                                ング:子供の事故データ(約200件/月)の例                                
            ...
事例:事故データを計算論的にモデル化することで                                                 将来の事故予測・予防に活用	                                子どもの...
事故履歴データからの知識化	                                1.  使用データ:国立成育医療センター子供の事故	                                 n  使用データ件数:1,791...
自由記述テキストデータの加工	                                 1.  自由記述テキストデータの構文解析	                                         n  文章を単語に分割...
自由記述テキストデータの加工	                                2.  類義語辞書	                                  n  表記ゆれやターミノロジーの問題の解消のため,     ...
自由記述テキストデータの加工	                                n  モノ・行動はたくさんあり,それをすべて用いて                                    確率・因果的構造モデルを構...
自由記述テキストデータの加工	                                                 表5 作成した特徴辞書	                                              ...
Digital Human Research Center   事故データのモデル化
確率・因果的構造のモデル化	                                                男の子,1歳以上6歳未満が多い	                                 n 「転落」の場合	...
子どもの危険行動シミュレーション	Digital Human Research Center                                                      140万人の会員を有する企業(ベネッ   ...
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
Upcoming SlideShare
Loading in...5
×

ベイジアンネット技術とサービス工学におけるビッグデータ活用技術

8,104

Published on

ベイジアンネット技術とサービス工学におけるビッグデータ活用技術に関する2012年の講演スライド集

Published in: Technology
0 Comments
40 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
8,104
On Slideshare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
0
Comments
0
Likes
40
Embeds 0
No embeds

No notes for slide

ベイジアンネット技術とサービス工学におけるビッグデータ活用技術

  1. 1. ベイジアンネットワーク技術と   サービス工学におけるビッグデータ活用技術   最近の応用事例から   (独)産業技術総合研究所 サービス工学研究センター 副研究センター長, デジタルヒューマン工学研究センター 兼務 統計数理研究所客員教授&東京工業大学連携准教授              本村 陽一
  2. 2. 行動履歴系ビッグデータ   からのモデリング •  状況依存性のある行動の履歴データ[購買・移動など]  •  一人十色の複雑化した生活者の多様性[非一様・混合]  •  変動する外的環境のもとでの大きな不確実性  •  他人の影響、相互作用による社会的行動  以上のような特性を反映したビッグデータへの対応   2
  3. 3. 大規模データ活用技術 •  ID付POSデータなど大量データが蓄積   •  数千人規模のアンケートも容易に実施可能   •  ただし、データ分析、データマイニングだけでは、結 果の活用が限定的(従来通りの施策の実施のため )飛躍的生産性向上に結び付きにくい。   •  そこで、大規模データを計算モデル化し、その結果を ITで活用できるようにする。   •  「顧客の見える化」「生活者起点」を促進するために   大規模データからの顧客モデル構築と活用技術 Center  for  Service  Research,  AIST  
  4. 4. 人間の認知評価構造・ 生活行動モデル� 楽しい�日常の 時間・空間的に展開し� 統計的学習�大量データ� 認識モデル� 動きが� だから� 好き・嫌い�センサ統合� 場所が� PLSI 怖い・危険�データー統合 SQL DB, etc… だから� アンケート 状況が�・インタビュー だから� 笑い・怒り� 生成モデル� 欲しい・� 買いたい� サービス適用�� モノが� Web, 携帯電話 だから� SNS, etc…� 快適・安心� 確率分布を出力� 実サービス� 再利用可能な計算モデル
  5. 5. 例:顧客接点におけるダイナミクスの例 (消費者行動選択とプロセスモデル) デジタル  店頭での会員勧誘 メルマガクーポン サイネージ 接客支援ツール 興味ドライバー 来店ドライバー 入店ドライバー 購買ドライバー 実物を見たい   実物を見たい   実感(似合う、機能)   商品情報   買い物の日   フィッティング   揃える(色・デザイン)   ノベルティ   イベント   素材感   安心(保有・確保)   話題   同行者として   時間がある   接客に惹かれて   季節感   なんとなく   ディスプレイに     :   :   : 惹かれて     : 購買 入店・閲覧 会員入会 メルマガ受信 来店 リピート ロイヤリティ向上
  6. 6. 大規模データに基づくサービスの最適設計ループ •  要素として顧客を含んだ包括的な系   •  顧客の反応を通じたフィードバックループ Short range 設計 適用 サービスプロセスモデル 顧客の評価構造・行動モデル (バリューチェーン) 分析 観測 Long range 需要 興味 行動 喚起 サービス要素の適応・修正 顧客接点最適化 顧客への情報推奨技術(プ 顧客の心理・行動分析・理 ロモーション) 解技術 既存サービスの評価・改良 動的商品管理・顧客情報管 大規模データ理解技術(心理・ 理(カテゴリ抽出)技術 行動マイニング) 新規サービスの設計・提供 プロセス最適化 生活密着型の地域活性化 と生活価値向上 生活連携・地域活性 生活者理解技術の共有 ・異種サービス連携 大規模データを活用した サービス最適化
  7. 7. サービス工学:サービス(価値共創)システム (サービス場面の人々の活動を対象としたシステム) 「モノの伝達」から「コトの伝達」へのパラダイムシフト 顧客接点 提供者(企業) Point of Service 受容者(顧客) 製品設計 製品利用 サービス利用 サービス設計 バックヤード フロントヤード 購買行動 日常生活 価値・評価・ライフスタイル サービス現場(顧客接点)での相互作用(ダイナミクス) を観測・予測・制御するために大規模データを活用する 大規模データを通じた人々の活動:社会のシステムダイナミクス(オートポイエーシス)
  8. 8. サービスの特性 l 無形性:手に取ったり、見たりできない  l 消滅性:保存しておくことができない  l 同時性:サービスの提供と消費が同時  l 異質性:サービスの価値は均一ではなく、   標準化できない  こうした特質から、バリューチェーンをシステム化  することが難しく、顧客の価値評価モデルを用いた  予測・制御・最適化が必要 8
  9. 9. The unified service theory The unified service theory(Sampson 2006) Service can be characterized by Users’ feedback サービス現場利用者 Inputs 提供者 実社会 経営者 Produc4on  Suppliers users 日常生活 process inputs outputs How can we realize input from users ?
  10. 10. サービスシステムダイナミクスの計算モデル化 サービスデザイン 生活者の計算モデル化と   最適化 情報サービス   シミュレーション To  be 支援技術 大規模・大量   のデータ   POSデータ   As  is アンケートなど   からのモデル化 サービス現場 サービス活動中に 実社会 利用者 人間行動 取得できるよう実験 提供者 観測技術 計画されたデータ 日常生活 経営者 データ収集
  11. 11. 生活中の履歴データなどの大規模
 データから再利用可能な計算モデルへ 従来の統計(母集団依存性大) l 各事例の保存と検索(データベース) l 単独の頻度、集計、統計 l 複数の変数の間の関係(相関、独立性) l ある変数を説明するルール、予測モデル l 変数群の依存関係の条件付確率(確率的知識)   l 因果的構造のネットワーク(計算モデル) 有用な知識(再利用性大) 集めたデータの説明から、そのデータ以外にも成り立つ知識、 すなわち過去の経験から、『次』に活かせる知識へ!!
  12. 12. ベイジアンネット 和文書籍 ベイジアンネットワーク技術:東京電機大学出版局(本村・岩崎) ベイジアンネットワーク概説:培風館(繁桝・植野・本村) 条件付確率: P(目的変数| 説明変数) 条件付確率 P(X3|X1,X2) X1 X3 X5 条件付確率 P(X4|X2) X2 X4 X2 0 1 X4 0 0.8 0.4 1 0.2 0.6
  13. 13. ベイジアンネットの
 ベイズ的世界観 •  ドメインを全て確率変数として表現 •  ドメインの状態は各確率変数の同時分布 •  観測可能、決定的な場合を包含 •  末端の変数は事前確率分布を仮定 •  目的:知りたい対象の変数の事後確率分布を計算 •  この時、主要な依存関係のみをグラフとして表し、モ デル化することで記述量、計算量を劇的に削減。 P(X1,X2,…,Xn)  =  P(X1|X2)P(X2|…)P(Xn)  
  14. 14. ベイジアンネットの学習(モデル構築)  確率変数の選択 情報量の高い、重要な変数の抽出 グラフ構造の学習 情報量基準による(局所)モデル選択 条件付確率(パラメータ)の学習   離散確率変数: CPT (cond prob table) 連続変数:パラメトリックモデル 事例の頻度から確率化 のパラメータ学習 or 離散化 P P B B A A {P1 (a1|b1), P2 (a2|b2), …}
  15. 15. 条件付確率表 X1 Y Ex. P1 0.3 P2 0.4 X2 P3 : Y P4 P5 条件付確率表 : P6 P(Y|X) = p I j : X ベイジアンネットの条件付確率表 Xn 完全データの場合:  n クロス集計表の正規化で最尤推定量が得られる。
  16. 16. ベイジアンネットの学習(グラフ構造の探索) X Y ? OR X Y ? Y Ex. Y Ex. n1 3 P1 0.3 n2 4 n3 P2 0.4 : P3 n4 : n5 クロス集計表 P4 P5 条件付確率表 n6 度数|Y, X| = n X xy P6 P(Y|X) = p xy XX,Yに関するクロス集計表 ベイジアンネットの条件付確率表 カイ二乗検定により変数間の 条件付依存性を情報量基準(AIC, MDL)独立・従属性を判定 により判定しモデルを選択(ベイズ比検定) この検定を一つの子ノード毎に、複数の親ノードに対して繰り返し行う。
  17. 17. 確率推論(belief  propaga4on) Observation e+ X1 P(X1|e+) CPT:P(X2|X1) X1 0 1 X2 もっとも単純な場合(基本系) 0 0.8 0.4 Belief(X2) P(X2|X1) 1 0.2 0.6= P(X2|e+, e-)=P(X2|X1) P(X1|e+) ・ P(X2|X3) P(X3|e-) X2 P(X2|X3) P(X3|e-) X3 Observation e-
  18. 18. Belief  propaga4onアルゴリズム Pr( X = x) = αλ ( x)π ( x). U1 …… Uiπ ( x) = ∑ P( X | U = u)∏π u UiX (Ui), Ui π UX (u) Xからの出力 λ ( x) = ∏ λ λXU (u) YjX ( x), Yj Xへの入力 π (x) X λ (x)π XYj ( x) = π ( x)∏ λYkX ( x), k≠ j π XY (x) Xへの入力 λYX (x)λ XUi (u ) = ∑ λ ( x )∑ P ( x | U )∏π UkX (u k ). Xからの出力 x k ≠i k ≠i Y1 …… Yj
  19. 19. ベイジアンネットワーク構築・推論ソフト BayoNet     (1998:IBIS、AI学会などにて発表)
 (2003∼:商用ソフトとして販売, COMDEX出展)
(2005∼ 本格的実用化によりソリューションビジネスも提供)
  20. 20. ベイジアンネット技術とその深化 •  大規模実データの中から、   ・非線形・交互作用を含むゆるやかな因果的連鎖構造 を自動的に抽出し、   ・計算機上のモデルとして作成し、   ・推論やシミュレーション、制御などに活用できる  •  表形式の離散変数(SQL-­‐DB)だけでなく、   ・ センサ、画像、テキスト、電子カルテ、ID-­‐POSデータ など、日常で集積されつつある大規模データを適用可 能にする技術研究   BN  +  テキストマイニング/  潜在クラス分析  /  特徴抽出     ・ 応用による社会問題解決の同時遂行が重要   20  
  21. 21. 大規模データモデリング技術 サービス工学における最適設計ループの実現のための  •  大規模データ(ID-­‐POS,  アンケート,  操作履歴,  テキスト)  •  カテゴリセット抽出(PLSA,  クラスタリング,  質的調査)  •  構造・関係モデル構築(BN,  情報量基準)  •  Man-­‐Machine  Lifelong  Learning(IT+コミュニティの学習)   Trident/POSEIDON APOSTOOL/BayoNet ID-­‐POS 主 アンケート 時 客 Log 場 動 テキスト IT+コミュニティ 顧客セグメント・潜在クラス 計算モデル → ダイナミクス etc 機能・情緒ベネフィット ベイジアンネット (サービスシステム)
  22. 22. 対象:モデル と 進め方:ダイナミクス 生活と技術のデザイン 生活者の計算モデル化と   最適化 情報サービス   モデル:制御対象 To  be 導入と振り返り 大規模データ モデル化 対象:生活 As  is サービス活動中に 人間行動 取得できるよう実験 観測技術 計画されたデータ 客観的なデータの観測
  23. 23. 大規模データ活用技術 •  ID付POSデータなど大量データが蓄積   •  数千人規模のアンケートも容易に実施可能   •  ただし、データ分析、データマイニングだけでは、結 果の活用が限定的(従来通りの施策の実施のため )飛躍的生産性向上に結び付きにくい。   •  そこで、大規模データを計算モデル化し、その結果を ITで活用できるようにする。   •  「顧客の見える化」「生活者起点」を促進するために   大規模データからの計算モデル化の事例紹介 Center  for  Service  Research,  AIST  
  24. 24. 大規模データモデリング技術 •  カテゴリマイニング:小売商材−顧客の自動分類   –  ライフスタイルや価値観に関するアンケート結果から、利 用者視点の商品カテゴリ初期値を作成   –  ID-­‐POSデータから、商品カテゴリに対して、似たような購買   行動をとる顧   客カテゴリを   作成   –  商品−顧客カ   テゴリの機械   学習(ベイジ   アンネット)を   繰り返す  24
  25. 25. ニーズ分析と計算モデル化アプローチ  大規模なID-­‐POSデータ、全てを用いた分析コスト、手間   –  データの件数約数十億トランザクション   データイメージ ** 「商品」を「いつ買ったか」というレベルの表現にとどまる    •  そこで、自動的に大規模データを処理するとと もに、「誰が」「どういう理由で」購買したかを 推定し、「もしもこうしたら、どうなる」というシミ ュレーションにも活用できる計算モデルを構築す る  
  26. 26. pLSIによる顧客ー商品の同時分類
 (Ishigaki, Takenaka, Motomura, IEEE ICDM 2010
 人工知能学会論文誌vol.26, No.6D, 2011他) ID-POSデータに基づく購買履歴から顧客と商品群を自動で同時に分類 ・2008年9月から2009年9月までの12カ月分のID-POSデータ ・アンケート対象者3981人と購買回数上位1000商品に関して同時分類 ・確率的潜在意味解析法(PLSI法)の適用により自動的に分類 属 計算結果 属 計算結果 カテゴリ数は情報量規準により 商品1 確 率 ・・・ 20カテゴリと自動的に決定 確 率 ・・・ 顧客1 
 
 カテゴリ1 属 属 商品2 確 確 ・・・ ・・・ 顧客2 率 率 
 
 
 
 ・・・ 属 属 商品3 確 確 顧客3 率 ・・・ カテゴリ20 率 ・・・ 
 
 属 属 商品4 顧客4 確 率 顧客と商品を
 確 率 ・・・ ・・・ 
 
 ・・・ 各カテゴリへ分類 ・・・ 推定結果:顧客がある意味カテゴリに属する確率 推定結果:商品がある意味カテゴリに属する確率 推定されたカテゴリ所属確率が最大となったカテゴリへ分類
  27. 27. 大規模データモデリング技術 POSデータ   アンケート・インタ 商品データベース ・・・ 大規模・大量データ ビューデータ 大規模データモデリング技術 【大規模実データに基づいた自動カテゴリ分類】   顧客 × 商品 顧客 × コンテンツ 顧客 × 注文 顧客 × 志向 家族構成 × コンテンツ 利用状況 × 注文 ・・・ ・・・ ・・・ 生活品質・生活価値を計算するための変数とパラメータの設計・抽出   生活品質・生活価値を計算可能なモデルへ
  28. 28. 生活者の計算モデル化 【PLSI+Bayesian networkの統合モデリング】① 生活者視点での顧客と商品のカテゴリ分類(確率的潜在意味解析)数千∼数万の顧客や商品を数個から十数個のカテゴリに次元圧縮できる 顧客 意味カテゴリ 商品 料理好き ・・・ 健康志向 顧客と商品を購買履歴から潜在意味カテゴリに同時クラスタリング② 離散確率変数間の確率的依存関係構造を表す計算モデルを構築⇒個人性、状況依存性を因果的にモデル化し、確率推論によりシミュレーションが可能 状況   商品属性   1   購買行動の 確率シミュレーション 0.8   時 顧客属性  曜 曜 間 ・・・   魚 意味カテゴリ   惣 肉 ・・・   0.6   日 日 類 菜 類 帯 0.4   ス ブ こ 低 年 家 タ ラ だ 0.2   ・・・   価 ・・・   齢 族 イ ン わ 格 0   ル ド り 変数群
  29. 29. ダイレクトメールを用いた   大規模なライフスタイルアンケートの実施 • 2009年12月にコープこうべの組合員約1万7千人へ,DMハガキを用いてアン ケートを送付.約4000名の回答を得た. アンケート項目:35問 • デモグラ:年齢・性別・家族構成・家族人数・職業 • 生活時間:来店頻度(スーパー,ドラッグストア),        家事時間,テレビ視聴時間 • 食生活:家庭での朝食,夕食頻度,お弁当 • 健康への不安:病気,ダイエット • 食に対する意識:料理志向,ダイエット,国産品 • 消費傾向:無駄遣い,家計簿,新商品への関心 • パーソナリティ:ビッグ5法を利用 消費者のライフスタイルや価値観に着目し, 様々な先行研究をもとに質問項目を構築 した. 29
  30. 30. ライフスタイルアンケート結果の分析による   6つの消費・生活因子の抽出 因子分析から,特長のある6つの 因子が抽出できた.ベイジアン ネットワークによっても同様の傾 向が検出された.   (因子の妥当性を確認)     ⇒これらの因子の組み合わせと して消費者の分類を行う  第1因子:こだわり消費派:高くても健康に良いものを選び,産地への関心,こだわりのブランドがある  第2因子:家庭生活充実派:料理が好きで食事も生活も充実している.気分も安定している  第3因子:アクティブ消費派:外向的で,新商品や話題の商品は試しに買ってみる.ただ無駄遣いは多い  第4因子:節約消費派:チラシを見てお得な商品を買う.安ければ少々遠い店にも行く.高い商品は買わない  第5因子:堅実生活派:几帳面で家計簿をつけ,無駄遣いはしない.毎日の献立はスーパーに行く前に決める  第6因子:パパっと消費派:スーパーでの買い物はできるだけ早くすませたい.お弁当を作ることがある
  31. 31. ライフスタイルアンケート結果の分析による   6つの消費・生活因子の抽出 各顧客に対して6軸の因子に対する得点を付与できる <例> こだわり消費派のAさん 節約消費派のBさん 4.5   5   4   4   3.5   3   3   2.5   2   2   1.5   1   1   0.5   0   0   こだわり 家庭生 アクティ 節約消 堅実生 パパっ こだわ 家庭生 アクティ 節約消 堅実生 パパっ 消費 活充実 ブ 費 活 と消費 り消費 活充実 ブ 費 活 と消費 各因子に属するアンケート項目の4段階回答を合計し、項目数で正規化した得点 最大4点、最小1点 第1因子:こだわり消費派:高くても健康に良いものを選び,産地への関心,こだわりのブランドがある  第2因子:家庭生活充実派:料理が好きで食事も生活も充実している.気分も安定している  第3因子:アクティブ消費派:外向的で,新商品や話題の商品は試しに買ってみる.ただ無駄遣いは多い  第4因子:節約消費派:チラシを見てお得な商品を買う.安ければ少々遠い店にも行く.高い商品は買わない  第5因子:堅実生活派:几帳面で家計簿をつけ,無駄遣いはしない.毎日の献立はスーパーに行く前に決める  第6因子:パパっと消費派:スーパーでの買い物はできるだけ早くすませたい.お弁当を作ることがある
  32. 32. 大規模ID-POSとアンケート結果の統合1
 (各クラスタに属する顧客の心理特性の可視化) 各クラスタに対して6軸の因子に対する得点を計算⇒ 各クラスタに分類された顧客のパーソナリティの傾向を可視化可能に (分類された顧客が持つ得点を合計、0が平均値となるように正規化) 0.1   0.06   0.04   0.05   0.02   0   こだわり 家庭生活 アクティブ 節約消費 堅実生活 パパっと 0   -­‐0.05   消費 充実 消費 こだわり 家庭生活 アクティブ 節約消費 堅実生活 パパっと -­‐0.02   -­‐0.1   消費 充実 消費 -­‐0.04   -­‐0.15   -­‐0.06   -­‐0.2   クラスタ番号11(お手軽栄養派) クラスタ番号28(自炊系(肉・パン)) バナナ、ヨーグルト 鶏肉、食パン 0.15   0.1   ID-­‐POSに基づき分類された商品クラスタ 0.05   と、アンケートに基づき算出された顧客 0   こだわり 家庭生活 アクティ 節約消費 堅実生活 パっと パ パーソナリティ因子の関係を計算可能 -­‐0.05   消費 充実 ブ 消費 に   -­‐0.1   クラスタ番号31(格安派) 野菜見切り品、果物見切り品
  33. 33. 大規模ID-POSとアンケート結果の統合(計算モデル化) 顧客パーソナリティ因子と商品群の関係をPOSデータからベイジアンネット化 (青い線:各ライフスタイルカテゴリーに対して全商品カテゴリーで得点が高い3商品カテゴリー) (赤い線:各商品カテゴリー内で1番得点が高いライフスタイルカテゴリー) ライフスタイルカテゴリー   既存の   新しい商品カテゴリー   商品分類 アンケート (アンケートから抽出) (ID-­‐POSから抽出) 項目 果物自炊的 健康飲料的 野菜 デモグラ   お手軽夕食的 菓子のお伴的 こだわり消費派 日常行 動・生活 酒飲み健康的 お手軽栄養的 肉・ 時間   家庭生活充実派 魚・卵 パン食的 肉不使用自炊的 健康意 冷凍・ 識   アクティブ派 野菜自炊的 しっかり野菜的 レトル 食に対 ト   する意 節約消費派 おやつ的 和風朝食的 総菜 識   飲料 洋風朝食的 おかずもう一品的 消費傾 水・酒 向   堅実生活派 類 牛乳・清涼飲料的 見切り品的 パーソナ リティ   パパっと消費派 しっかり自炊的 日用品的 日用 雑貨 PB的 肉自炊的
  34. 34. 利用者の特徴を表すベイジアンネットモデル 顧客特徴データベースを用いて、カテゴリ分類、ID-POS解析、
アンケートデータ解析の結果を統合した、ベイジアンネットワークモデルを構築した。 ベイジアンネットワーク:関係の強い変数間の関係を自動的に発見することができる方法論。また、全体や各変数の確率も効率的に計算可能。 顧客の特徴についてのベイジアンネットワーク (データ数3695件、計算時間約1分、Greedy サーチ、構造探索スコア:AIC)
  35. 35. 利用者の心理特性(アンケート結果)をモデル化したベイジアンネットの例 各商品カテゴリを購入している利用者の解釈 (アンケート回答との関係性) Class06  おやつ的 Class07  洋風朝食的
  36. 36. 利用者の購買行動を表すベイジアンネットモデル 対象ジャーナルデータを用いて、カテゴリ分類、ID-POS解析、
アンケートデータ解析の結果を統合した、ベイジアンネットワークモデルを構築した。 ジャーナルデータについてのベイジアンネットワーク (データ数420万件、計算時間約48時間、Greedy サーチ、構造探索スコア:AIC )
  37. 37. ベイジアンネットを用いたシミュレーション 作成したモデルを用いて状況依存性についての確率推論を行った。 P(回答 家庭生活充実してない | お手軽夕食商品, 夕方に購入) → 高い確率 0.3   家庭生活充実していない それ以外 0.25   0.2   0.15   0.1   0.05   0   夕方 0 0 1 1 夏 0 1 0 1 お手軽夕食的クラスタ商品
  38. 38. 来店行動予測モデル→ 需要予測への応用 非対称な分散の構造をモデル化したベイジアンネットによる予測結果の補正 ・ベースモデルの予測残差に対しベイジアンネットモデル(BNモデル)を作成   ・予測外れが大きい変数に対して、予測結果を補正       外れの大きい値に対して   事後確率の期待値を   ベイジアンネット構築 予測結果に加算 下ブレ外れの 上ブレ外れの 大きい範囲 大きい範囲 ①上ブレ、下ブレ、両者の内 (-2σ, -1σ以下) (1σ, 2σ以上) 使用する補正の有無を判定 ↓ 30 ②各日の説明変数をBNへ ↓ 20 ③大きな予測外れが起こる 10 事後確率を推論 ↓ 0 -200 0 200 400 ④事後確率の期待値により 外れの値 予測結果を補正 残差のヒストグラム 外れ方の構造 (ベイジアンネットモデル)
  39. 39. 非対称分散構造モデルによる需要予測補正効果 条件付層別差分モデル(ベイジアンネット)による予測結果の補正 ・補正が必要なブレの大きい日についてのみ、限定的に補正する   ・下ブレ、上ブレの判定→ 符号関数ξ(x)をBNでモデル化したものを用いる   上ブレ残差 下ブレ残差 σup σlow 10 20 30 y ! z = diff (x) " # ! (x)k" P(! (x)k" | x) k=1,2 0 -200 0 200 400 符号関数ξ(x)は上ブレ(y-z>σ)の時+1, 下ブレ(y-z<σ)の時-1それ以外では0 セグメント毎予測+BN残差モデル補正 による予測結果の改善率 ①前年同月同曜日 ②線形予測 ③セグメント毎 ④線形+BN補正 ⑤セ+BN補正 ①からの改善 ②からの改善平均予測再現率 92.7% 96.2% 96.4% 96.4% 96.4% - - 残差合計 -2835人 -762人 -516人 -555人 -141人 2694人 621人 絶対残差合計 3285人 1599人 1542人 1549人 1501人 1784人 98人
  40. 40. ベイジアンネットによる 大規模データ�からのモデリングと情報サービス� アプリケーション� Web, 携帯、カーナビ� 様々な状況・ユーザ� レストラン情報� ネット配信音楽� システムなど� 操作履歴 � ユーザの好みを予測し、� 履歴・属性� フィードバック� データベース� 最適なコンテンツを推奨� 頻度データから条件�嗜好性を表す� 付確率を求め� 確率モデル� 依存関係の強さに従い� ベイジアンネットを自動的に構築� GUIベイジアンネット構築・推論ソフト� モデルの分析、データマイニング�
  41. 41. リコメンデーションの例(CFからBN) ・協調フィルタリング(CF) (ex. アマゾン、アスクル):P(X) ∝∑類似度(u) 購入経験(u,X)                             u 購買履歴 類似度 他の コンテンツ   ユーザ       ユーザu x        ・アスペクトモデル:P(X)= ∑P(X|H)P(H|U) H 関心 ユーザ アスペクト H 内容 コンテンツ x 構造を持つ確率モデル=  ユーザが対象が興味深いと評価する確率を推定して、 その確率の高いコンテンツ(X)を推奨。 より複雑な依存関係(選択理由、個人属性など)を取り込めばよい。
  42. 42. 人間の心理的特性のモデル化 U:ユーザの特徴を表すベクトル (年齢や所得など) X: コンテンツ(レストラン情報)の属性ベクトル (客層や平均予算など) E: ユーザUがXをどのくらい「好き」だと思うか (例えば1から5までの5段階評価) U、XからEを予測する確率モデル P(E=5|U=u, X=x)=80% : アンケートデータ P(E=1|U=u, X=x)=5% (統計)
  43. 43. ユーザ・状況属性の追加 X1  X2 対象 P(E|X , U , S)   X3 の特徴    X4 E(好き) U1  U2 年齢などの   U3 ユーザ属性    U4     U5 S(状況) •  ユーザUにXを評価させた統計データから条件付確率を獲得。 •  情報量の高い属性、特徴ベクトルを抽出。 n  意味のある状況Sを導入した「状況依存モデル」の状況の発見。
  44. 44. ユーザ適応型カーナビ(レストラン推薦)
(本村・岩崎「ベイジアンネットワーク技術」東京電機大出版局) コンテンツプロバイダ 車両用情報システムジャンル ベイジアンネットワーク 提案コンテンツコスト レストラン 音楽 推論 提案候補 /スコア 距離 情報 センター コンテンツデータ C H1 A 推論結果 ステーキXY店 1 60 季節 CBカレー 状況データ 年齢 S H2 2 40 時間 性別 ユーザ嗜好モデル ビストロAB ユーザデータ 3 U 30 履歴 学習 ステーキ店 同乗者 現在地 :
  45. 45. 例:カーナビでのレストラン選択のモデル  (デンソーITLとの共同研究、iPhoneアプリ化) 年齢層 自動車 運転歴 ユーザ層 可処分 食事の好み 所得 ユーザー属性 (休日夜) 主客層 メイン レストラン属性 ディッシュ 平均 予算 高級感 フランチャイズ レストラン カテゴリ 状況 気温 急ぐ 時間 状況
  46. 46. 携帯電話によるユーザ適応型知的情報サービス:
 小野(KDDI研究所)・本村・麻生:User  Modeling  2007など 2700人へのアンケート結果からモデルを構築、デモサービスを実演 à プレス発表・NHK放映
  47. 47. •  映画推薦サービスにより集積する大規模データをマーケティングに活用   (KDDI研究所、松竹との共同研究)  観測・モデル化(状況を入力) auOneラボのサービス 手段→映画館 状況 誰と→恋人と 気分→感動したい 状況 誰と TPOに応じた 「恋人と、 コンテンツ  映画館で、 どんな気分 推薦エンジン  感動したい」 (嗜好性モデル) 感じ方 評価 プロフィール 推薦 感動した 結果 性別 年齢 癒された 好む 確率 デートにぴったりの 映画でうれしい★ 「30代、男性、
 コンテンツ情報 ストーリー重視」 ジャンル 製作国 個人プロファイル(年齢、性別等) 過去の履歴情報(視聴、購買等) 数万コンテンツ 数千人アンケート、過去の視聴履歴 (パートナー企業提供) 映画DB など大規模データ収集・嗜好性モデル構築 利用しながらモデル更新(連続・動的最適化) 水平展開 他のサービスにも利用できる再利用可能な計算モデル(知的基盤)
  48. 48. 映画宣伝支援システムの利用例 どんな顧客? どんな映画?
  49. 49. 予測結果 「実話に基づいている」という   具体的な点をアピールすることにより、   ユーザーの鑑賞意欲を   効果的に増加できると推測できる。 ※差分=P(UI|C(U), V=positive) – P(UI|V=positive)
  50. 50. 予測結果を基に、ストーリーのリード部分を修正し、   実話が基になっていることを強調した  (落合,  下角,  小野,  麻生,  本村,  人工知能学会全国大会2009)
  51. 51. 20代と30代では、同じ映画であっても   訴求ポイントが明確に異なる 20代の結果 30代の結果 20代向けの雑誌には、   30代向けの雑誌には、  ハリウッドナンバー1ビューティー、 「シャーロット・グレイ」の実力派女流キャサリン・ゼタ=ジョーンズ主演 監督、ジリアン・アームストロング最 最新作という切り口で紹介 新作という切り口で紹介
  52. 52. 例:通信販売支援へのベイジアンネット活用  既存データからは推測できない顧客のニーズやCSRの販売ノウハウをモデル化して活用  顧客全体  従 顧客データ  新たな購買履歴データによるモデルの改良  CSRによる売込結果  来 商品データ 購買履歴データ ベイジアン・アプローチ  分 お薦め商品潜在顧客 析  既存データベース  行 行 センターの画面に 約500万件/月 動 予 動 予 抽出 ・勧める商品 ・理由 の大量データ 測 測 ・売込フレーズ * ー を応答時に表示     顧客ニーズ知識   ベイジアンネット  商品知識 分析 モデライズ社 ー カスタマーサポートセンター * : クロスセル以外の様々な分析  や予測にも共通的に活用可能
  53. 53. ベテラン社員の知識と販売データから   現場の知識をモデル化し組織全体で活用 売り上個数 ベイジアンネットとし てモデル構築 上位オペレータの 知識をシステム化 げ 底上 下位オペレータを システムが底上げ 平均 0 50 100 150 200 250 オペレータ数
  54. 54. 利用者計算モデル活用技術     デジタルサイネージへの応用シナリオ   デジタルサイネージ� 店舗内キオスク端末、 ライフスタイル 提案� 携帯、インターネット� � 生活コミュニケーション促進   大規模� ID-POSデータ データベース� (生活満足度向上)� と連携�生活品質評価� 顧客セグメント推定・ 認知・興味喚起を行う コンテンツ選択 カテゴリマイニング技術 オン ラ イン分 析 ベイジアンネット技術� 顧客理解・サービス品質の評価�
  55. 55. 店頭端末:POSEIDON 全国30店舗、利用総数約4000件 小売現場での活用事例 購買回数向上, 会員誘導効果が大 (2011.5 ) 顧客 POS 商品 POS メルマガ   クーポンに   店頭 よる再来店  POSデー 全店舗集計 タ 独自のDB イベント、 入力 天気など レシートデータ 店頭端末   状況パラメータ 顧客行動履歴 (POSEIDON) 全国30店舗導入   最適クーポン 分析エンジン 履歴データ 購買傾向の基本統計量 レコメンド 顧客モデル化 予測モデル フィードバック ベイジアンネット   カテゴリー 勤怠管理 生産管理 マイニング (PLSI) キャンペーン APOSTOOL 企画 店舗間比較  活用 商品企画 店舗施策
  56. 56. 小売サービスにおける支援技術パッケージ 顧 従業員報告(従業員アンケート・店舗レポート等)   基本DB関連 客 顧客行動(閲覧履歴・アンケート等)   商品情報データ   接 店舗情報データ   点 POSEIDON 商品 店舗 レコメンド・   データ データ 支 アンケート結果 援 POSインタラクション 実店舗   データ メルマガクーポン ECサイト POSデータ   CRMデータ   時空間意味統合   データベース マージ済みデータ   加工済みデータ   APOSTOOL   店舗フィードバック ECサイト 時空間意味DB (分析サーバー) 売上関連分析結果   店舗比較情報   データ 顧客動向・売れ筋 等 オフィスフィードバック APOSTOOL 業務日誌・ブログ 各種分析結果 EC系データ    売上データ   レベル別閲覧   会員データ   自動レポート閲覧 経営層向け   配送データ  楽天データ   マネージャ向け Amazonデータ   手動レポート 一般社員向け 生産管理 従業員支援 最適化 在庫管理 経営者支援
  57. 57. 生活中の履歴データなどの大規模データから 再利用できる知識(因果的構造)の獲得 従来の統計(母集団依存性大) l 各事例の保存と検索(データベース) l 単独の頻度、集計、統計 Digital Human Research Center l 複数の変数の間の関係(相関、独立性) l ある変数を説明するルール、予測モデル l 変数群の依存関係の条件付確率(確率的知識) l 因果的構造のネットワーク(因果的知識) 有用な知識(再利用性大) 集めたデータの説明から、そのデータ以外にも成り立つ知識、 すなわち過去の経験から、『次』に活かせる知識へ!!
  58. 58. 因果的知識の例   事故が発生したという事象から過去に遡る。   つくば市立の保育所での調査アンケートの例 Q1:その事故が起きたのは直接には何が原因ですか? Digital Human Research Center Q2: Q1の出来事が起きたのはなぜですか?関連するもの を全て挙げてください。 Q3: Q2の出来事が起きたのは、それぞれなぜですか?関 連するものを全て挙げてください。
  59. 59. 事故の分析:保育園でのひやりはっと事例 状況 モノ 前の日に コンクリの 掃除する 雨 上に砂 Digital Human Research Center 滑る 外で遊びたい 行動 はしゃぐ 事故=high 事故=low 児童 活発な性格 そそっかしい 注意する 12/10/21 61
  60. 60. 日常生活における因果的構造とは? 例:個人の認知・評価構造   「なぜ」を繰り返すインタビューによる気づき   無意識的な行動の背景にある動機が明らかに クッションが
 背もたれが高いから Digital Human Research Center よさそうだから 体によさそうだから それはなぜ
 なぜこちらを
 よいのですか? 気分が良いか 選びましたか? ブランド ら 安いから インタビューから選択理由を挙げ、対象の属 性から評価に至る認知構造
  61. 61. 運転中の走行シーンの認知構造 (画像提供:トヨタ自動車) Digital Human Research Center どちらが危険と判断するか? より危険と認識するのは何が原因か(コンストラクト)? それはなぜか(理由・原因)? もしそうであれば、どんなことが起こるか(因果的結果)?
  62. 62. Digital Human Research Center安全�危険� 初心者(運転は年一回位)の認知構造の例
  63. 63. 初心者の回答例   「注意を引くものがある、多いと怖い」   「バスやトラックなどの大きな車が気になる」   「ぶつかりそう、よけにくそうだと危険」 Digital Human Research Center   「相手が動くとよりぶつかりそう」
  64. 64. Digital Human Research Center 熟練者(運転歴15年、週5回以上)の認知構造の例 安全� 危険�
  65. 65. 熟練者の回答例   「自転車は後ろを見てないので危険」   「こっちを見ている相手は大丈夫」   「自分が止まるだけで良いのは安心」 Digital Human Research Center   「操作が忙しいときは回避できず危険」   「次の状態が予測できるときは安心」
  66. 66. 危険性の評価・認知構造 走行シーンの認知・評価の因果的階層構造には下図のような 個人差がある。 ・運転者の初心者/熟練者の識別 ・熟練者:危険 初心者:安全 となるシーンについて初心者に 危険であることを伝える支援システムへ Digital Human Research Center 相手の動き が不明 ベテランドライバー(15年): 次の場面が 予測できない 運転は週5回くらい 初心者である 対処 先が ことを運転操 走行 見えない できない 作から識別し、 シーン やるべき ベテランと異 カーブ 動作が多い 危険 なる状況判断 スピードが 出ていそう について支 ぶつかる 援・教育を可 能に! 障害物が ある 初心者ドライバー(3年):
  67. 67. 事前知識を活用して、統計データの情報を補う 認知・評価構造の定量的モデリング Y.Motomura, T.Kanade :Probabilistic Human Modeling based on Personal Construct Theory”, J.Robot&Mechatronics, 17/6, (2005). 統計的学習(頻度データ) 欠損(未回答)データの場合 定量調査 →EMアルゴリズム Digital Human Research Center アンケート 統計的言語処理 評価グリッド Bayesian network 認知・評価構造モデル 初期構造(潜在変数)
  68. 68. [事故事例を知識化し、制御するために] 事故予防のための行動と状況を含んだ因果構造をモデル化� A • 重症事故の数 制御したい対象 • 事故死の数 多くの場合、 そのままでは制御困難 事故制御理論�Digital Human Research Center • A,B,Cの因果構造の解明 • Bを用いてAを制御する理論� B C 制御可能な対象 制御不能な対象 • モノの設計(メーカー) 子どもの月齢・天候・発達・季節 • 保護者の意識・環境調整 ・時間
  69. 69. 日常生活を知識化する   例:子どもの事故予防の場合   事故(unusual)の因果的関係をモデル化   個々のケースの原因(行動、モノ)を知り、制御することで事故を 予防可能にDigital Human Research Center 事故発生 その子の 予防すべき事故原因 日常 ∼が∼した ので ∼が∼して ケガ それぞれの日常生活の理解 }  平常状態(usual)から異常(unusual)までを定量的に評価 }  起きても仕方ない事故と特殊な事故を見分けていく }  許容できる日常と危険状態のボーダーを制御していく
  70. 70. 事故履歴データ(受診200事例)からの
 子供の事故状況のモデル化 Location Object Digital Human Research Center Time Injury Size Season Age Body part Gender Behavior Intension
  71. 71. 事故の関係モデルを使った確率推論 Set: 女児, 1歳 , 冬, 器具による事故 Digital Human Research Center Results (highest): ヤケド 94% 不注意 67% 腕 90% リビング 62% 日中 67%
  72. 72. ベイジアンネットによる大規模データからのモデリ ング:子供の事故データ(約200件/月)の例 
 Digital Human Research Center 事故サーベイランスシステム 国立成育医療センター 事故調査表・テキスト 電子カルテ
  73. 73. 事例:事故データを計算論的にモデル化することで                将来の事故予測・予防に活用 子どもの事故データ(約200件/月) 子供の属性、生活時間 事故サーベイ ランスシステム 子供の日常生活行動 環境要因 Digital Human Research Center カルテ 事故調査表 ベイジアンネット 事故の程度・確率
  74. 74. 事故履歴データからの知識化 1.  使用データ:国立成育医療センター子供の事故 n  使用データ件数:1,791件(2,430件中) n  事故の種類を6種類に限定 n  事故に関係したモノと事故直前の行動のどちらも空欄の場 合は用いていない 800Digital Human Research Center 700 600 使用データ 500 400 300 200 100 0 はさむ 刺される 噛まれる おぼれる 転落 転倒 衝突 やけど 誤飲 誤嚥 窒息 その他 交通事故
  75. 75. 自由記述テキストデータの加工 1.  自由記述テキストデータの構文解析 n  文章を単語に分割 n  単語の原文を表示 n  品詞タグ Digital Human Research Center 表3 構文解析結果 行ID 文章ID 単語ID 見出し語 原形 置換語 品詞 係り先 1 1 1 自宅の 自宅 自宅 名詞 2 1 1 2 家具 家具 家具 名詞 -1 2 2 3 木製の 木製 木製 名詞 4 2 2 4 ローテーブル ローテーブル ローテーブル 名詞 -1               … … … …    …  …   … …
  76. 76. 自由記述テキストデータの加工 2.  類義語辞書 n  表記ゆれやターミノロジーの問題の解消のため, 類義語辞書を作成 n  表記ゆれは,同音・同意味の単語で文字表記が異 なること Digital Human Research Center n  ターミノロジーの問題は,同じ意味を有する単語が 別の言い回しで呼ばれるような問題のこと 表4 作成した類義語辞書(一部) 代表語 品詞 単語 遊ぶ 動詞 遊ぶ あそぶ いじる つかまり立ち 動詞 つかまり立ち 掴まり立ち 掴まりたち つかまり立つ           …   … …  …  …  … 
  77. 77. 自由記述テキストデータの加工 n  モノ・行動はたくさんあり,それをすべて用いて 確率・因果的構造モデルを構築すれば,膨大 な情報量となり,理解するのが困難である 3.  モノ・行動の特徴辞書 Digital Human Research Center n  モノ・行動には事故に関係する特徴がある 例)ストーブ,加湿器,コタツ→熱いモノ    ボタン電池,タバコ    →口に入れられるか モノや行動の特徴を項目とし, 確率・因果的構造モデルで 事故との関係を推論する!
  78. 78. 自由記述テキストデータの加工 表5 作成した特徴辞書 上 下 全 頭 上 水 静 半 半 身 部 下 平 止 身 身作 触 動 取 動 動 作 動 動 動 動 動 ー ー ー 作 作 作 作 作Digital Human Research Center 作 作 動 大 中 小 後 飲 触 走 触 立 走 飲 走 飲 立 立 立 起 起 触 噛 開 跳 開 飲 跳 触 寝 跳 n 作成した類義語辞書,特徴辞書をもとに構文 解析した事故データを離散変数に変換した
  79. 79. Digital Human Research Center 事故データのモデル化
  80. 80. 確率・因果的構造のモデル化 男の子,1歳以上6歳未満が多い n 「転落」の場合 11歳以上はほとんどない 起きている時間帯が多い 寝ている(深夜)はほとんどない こども 時間帯 Digital Human Research Center モノ 行動 乗れるモノ,物の高さ, 静止動作,全身動作, 身体を支えられるモノが多い 上下動作が多い
  81. 81. 子どもの危険行動シミュレーション Digital Human Research Center   140万人の会員を有する企業(ベネッ セコーポレーション)と共同で開発と 評価. 2005年12月12日より会員向けサービス開始 2007年3月より一般向け英語版・日本語版公開� 83

×