SlideShare a Scribd company logo
位置情報SNSのチェックインデータを用いたユーザの傾向
の分析と位置予測
株式会社トライディア 代表取締役 西岡賢一郎
2018/03/31
1
自己紹介
• 名前: 西岡 賢一郎
• 所属: 株式会社トライディア 代表取締役
• 経歴:
• 鹿児島出身
• 東京大学、東京大学大学院にてPageRank, 順序を考慮したレ
コメンドシステム, SNSデータからのユーザの位置予測を研究
し、博士 (学術)を取得
• 博士課程在籍中の2012年に研究者仲間と株式会社トライディ
アを設立
• 企業との解析業務の提携や企業内のデータサイエンティストの
育成に従事
2
本日の発表内容
• なぜ位置情報?
• 一昔前の位置情報データの研究
• 位置情報SNS
• チェックインデータの性質
• チェックインデータを活用するためのモデル
• チェックインデータを用いた傾向分析及び予測
• 位置情報のこれから
3
なぜ位置情報?
4
なぜ位置情報?
• 時間的制約・空間的制約などの影響が大きく、これ
らを考慮しながらの解析が困難ではあるが、オフラ
インサービスに生きるデータである
• データ自体を集めることが難しく、限定的な研究自
体が少なかった
5
なぜ位置情報?
6
位置情報に限らずもともとログを取ることが趣味
→ 大学院での研究へ
位置情報を解析から生まれる可能性があるビジネスの例
• 目的1(傾向抽出): ユーザがどういう動きの傾向を持
っているか
→ 街づくりの計画や観光の分析
• 目的2(位置予測): ユーザが将来的にどこに行くか
→ 位置情報を用いた広告の配信
7
一昔前の位置情報データの研究
8
GPSトラッカー
9
被験者にGPSトラッカーを持ってもらいデータを取得していた
個別にGPSトラッカーを持って貰う必要があり、データ数が不足しがちであった
よくある手法
10
A B C D
E F G H
I J K L
M N O P
Q R S T
R -> N -> J -> I -> E -> A
L -> H -> C -> G -> J -> N -> R -> Q
M -> N -> K -> G -> D
メッシュ化して、どこに行ったかをシーケンスとして表した研究が多かった。
よく使われていた手法を2つほど紹介
• 頻出パターン: シーケンシャルパターンマイニング
• 軌跡類似度: シーケンスアラインメント
シーケンシャルパターンマイニング
• 一定頻度で現れるパターンを抽出
• PrefixSpanなど
11
A -> B -> C
A -> C -> D
B -> A -> C
A -> C: 3回
B -> C: 2回
シーケンスアラインメント
• 類似したシーケンスを定義
• Needleman–Wunschアルゴリズムなど
12
引用: https://bi.biopapyrus.jp/seq/alignment/needleman%E2%80%93wunsch.html
位置情報データにおける問題点
13
メッシュの切り方によりパターンが変わってしま
う。
(階層的な構造でこれを解決している手法もある
が今回は割愛)
位置情報SNS
14
抑えておいてほしい内容
時間の制限上駆け足での発表となりますが、とにかく
伝えておきたいこと
• チェックインデータのスパース性とその解決方法
• ユーザの動きのパターン抽出方法
• 位置予測モデル
15
位置情報SNS
16
ユーザがチェックインすることによって自分の言った場所を保存・共有できる
サービス。GPSトラッカーを被験者が持たずとも多くのユーザが位置情報デー
タを残す(チェックインと呼ぶ)時代に。
位置情報を残せる代表的なアプリ: Facebook, Twitter, Instagram, Swarm
Swarmのデータの取得
SwarmのAPIは制限されており十分なデータが取れない
ため, Twitter Streaming APIを利用してデータを収集
17
api制限(回数, 繋がりの範囲)
共有
streaming api
大量に取得可能
Swarmのチェックインデータ
18
特定の時刻にユーザがどこにいたかしか分からない
スパース性の非常に高いデータとなっている
離散的なチェックインから分布を推定するモデル
チェックインの間のユーザの行動分布を推定
19
時間軸
? ?
あるユーザの行動
抑えておくべきモデルの条件
- ユーザが行動できる範囲は時間によって広がっていく
- チェックイン時刻に必ずチェックインした場所にいる
ユーザ行動分布の推定
• 仮定: ユーザは拡散方程式に基づいて行動
• xt: 時刻tに場所xにチェックイン
• yu: 時刻uに場所yにチェックイン
• λは時間におけるスケールパラメータ
20
xt yu
ユーザの行動分布をチェックインから推定
• ベイズの定理により計算
21
xtx_i,t_i x_{i+1},t_{i+1}
スケールパラメータの推定1
• 最尤法によりスケールパラメータを推定
22
x_{i-1}t_{i-1} x_{i}t_{i} x_{i+1}t_{i+1}
スケールパラメータの推定1の問題点
• チェックインの時間が近い場合に二点間のユーザの
速度が発散
23
短い時間での複数チェックインの影響が大きくなる
スケールパラメータの推定2
• チェックインのデータは以下の様な性質を満たす
• チェックインの時間差( )は常に正である。突然過去に戻って
チェックインすることはない
• チェックインは短時間で連続する事が多い。チェックインの時
間差ピークは0に近い
• チェックインの時間差はかなり長いLongTailとなっている
24
P( )の事前分布として逆ガンマ分布を使用
スケールパラメータの推定2
• α、βは解析的には解けないが最適解は出せる
• これにより, 逆ガンマ分布を用いた最尤推定は以下
の式を解けば良いこととなる。Dは二点のチェック
インの距離
25
スケールパラメータの推定の違い
5-fold cross validationの結果、単純な推定より事前分布
を用いた推定のほうが尤度が高いことが確認できた。以
降、スケールパラメータはこの推定方法を用いて計算
26
ユーザのモデルはできたが、これをどう活用するか
• 全体的な傾向より似ているユーザの傾向を知りたい
→ メッシュを使わないユーザの類似度を定義しクラ
スタリング (目的1)
• ユーザの未来位置を予測したい
→ ユーザ個人のデータでは外れ値の影響をうけやす
いため、似たユーザを集めて予測モデルを構築 (目的
2)
27
クラスタリング
• Hellinger距離でユーザの距離を定義([0, 1]の範囲で
長さが定義され、距離が無限になることはない)
• 計算された距離はユークリッド空間に乗るため、k-
means, 重心法, 最近法, 最遠法, ward法などのクラ
スタリング手法が適応可能
• 今回はクラスタリングで比較的よく使われるward法
を使用
28
ward法
• 2つのクラスタを結合した時に新しいクラスタの重
心からの二乗和が最小になるように結合
29
重心
ユーザの行動分布
ユーザの行動分布からクラスタごとの分布を計算
30
特定の時間におけるユーザ全体の存在分布を定義
ユーザ分布の表現式
• パターンを抽出するために、時間軸(無限), 空間軸(無
限)のままでは扱えないため、1時間毎に切った離散
行列Yを定義
• 値: 存在確率
• Y’Y: 共分散行列
31
Y=
time(N dimensions, discrete)
place
(∞)
ユーザの存在確率の共分散行列
離散行列から共分散行列を計算
32
Y^TY(t,t’)=
共分散行列が計算できたのでPCAを用いて
時空間パターンを抽出できる
チェックインデータからの流れ
33
スパースな
チェックインデータ
ユーザを存在確率を
使ったモデルで表現
ユーザの類似度
を定義
ユーザを
クラスタリング
クラスタ毎に、PCAを用いて
時間成分・空間成分を分解
抽出パターン例 (時間の都合で抜粋)
34
地域に関係した定常的なパターン・周期的パターン・突発的パターンなどが抽出
できた
時間軸と空間軸に別れたパターンからモデルに位置予測モデルへ
35
・・・
・・
・
time
チェックイン後の問題
36
time
チェックイン後は分布が広がり続けてしまう
最後のチェックイン 広がり続ける
ユーザの周期性をモデルに適用
37
9am
1pm
8pm
DPMU (Diffusion-type Periodic Model with similar Users)
• 同じ時間帯の分布を平均することで特定時刻にどこにいるか
を確率で表すモデルを構築
• 予測するにあたって予測対象ユーザと近いユーザの分布も利
用
38
time
・・
・
k+1(1day) k+2(1day)k(1day)
予測結果
39
• 横軸は集めたユーザの数
• ベースラインは赤と緑。
• log-likelihood, MRRではベースライン
より上にあれば性能が高く、Rankで
は逆でしたにあれば性能が高い
• 評価指標によりユーザを似たユーザ
を集めたことで精度が上がるものと
下がるものがあった
位置情報のこれから
40
位置情報のこれから
• 最近ではgoogle map, trip advisorなど位置を常にト
ラッキングし続けているサービスも増えているが、
位置情報SNSではGPSだけでは分からない情報(例
えばビルの何階のどの店にいたかなど)が分かるた
め、まだまだ解析の余地はある
• 未来位置などは人の行動の自由度の高さからサービ
スにすぐに適用することは難しいかもしれないが、
特定の絞り(例えば特定場所からの数時間後の動き
など)を加えることで、精度の高い予測が可能があ
る
41

More Related Content

Similar to 位置情報SNSのチェックインデータを用いたユーザの傾向の分析と位置予測

Jaws Festa 11/03 - Mobingi
Jaws Festa 11/03 - Mobingi Jaws Festa 11/03 - Mobingi
Jaws Festa 11/03 - Mobingi
Zui Ou
 
220427-pydata 統計・データ分析 特集
220427-pydata 統計・データ分析 特集220427-pydata 統計・データ分析 特集
220427-pydata 統計・データ分析 特集
Takuya Nishimoto
 
大規模案件でデータサイエンスチームを活躍させる取り組み
大規模案件でデータサイエンスチームを活躍させる取り組み大規模案件でデータサイエンスチームを活躍させる取り組み
大規模案件でデータサイエンスチームを活躍させる取り組み
Recruit Lifestyle Co., Ltd.
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
Rakuten Group, Inc.
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Takanori Kawahara
 
In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性
Satoshi Nagayasu
 
データプランナーによるデータ系施策について
データプランナーによるデータ系施策についてデータプランナーによるデータ系施策について
データプランナーによるデータ系施策について
Recruit Lifestyle Co., Ltd.
 
20120622 data conference
20120622 data conference20120622 data conference
20120622 data conferencemanagami
 
「R」による従業員満足度調査(ES)事例
「R」による従業員満足度調査(ES)事例「R」による従業員満足度調査(ES)事例
「R」による従業員満足度調査(ES)事例
良治 富田
 
20230610ビジネス実務学会_基調講演.pdf
20230610ビジネス実務学会_基調講演.pdf20230610ビジネス実務学会_基調講演.pdf
20230610ビジネス実務学会_基調講演.pdf
東京工業大学
 
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
Google Cloud Platform - Japan
 
[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック
[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック
[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック
Deep Learning Lab(ディープラーニング・ラボ)
 
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
Rakuten Group, Inc.
 
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションいじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
cyberagent
 
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
Takafumi Nakanishi
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
cyberagent
 
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
junji kumooka
 
モノタロウが トレジャーデータを使う理由と、 データを活かす企業文化
モノタロウがトレジャーデータを使う理由と、データを活かす企業文化モノタロウがトレジャーデータを使う理由と、データを活かす企業文化
モノタロウが トレジャーデータを使う理由と、 データを活かす企業文化
株式会社MonotaRO Tech Team
 
スマホアプリハンズオン(Lightning Network)を 始めた理由
スマホアプリハンズオン(Lightning Network)を 始めた理由スマホアプリハンズオン(Lightning Network)を 始めた理由
スマホアプリハンズオン(Lightning Network)を 始めた理由
takayaimai
 
このIRのグラフがすごい!上場企業2021
このIRのグラフがすごい!上場企業2021このIRのグラフがすごい!上場企業2021
このIRのグラフがすごい!上場企業2021
itoyan110
 

Similar to 位置情報SNSのチェックインデータを用いたユーザの傾向の分析と位置予測 (20)

Jaws Festa 11/03 - Mobingi
Jaws Festa 11/03 - Mobingi Jaws Festa 11/03 - Mobingi
Jaws Festa 11/03 - Mobingi
 
220427-pydata 統計・データ分析 特集
220427-pydata 統計・データ分析 特集220427-pydata 統計・データ分析 特集
220427-pydata 統計・データ分析 特集
 
大規模案件でデータサイエンスチームを活躍させる取り組み
大規模案件でデータサイエンスチームを活躍させる取り組み大規模案件でデータサイエンスチームを活躍させる取り組み
大規模案件でデータサイエンスチームを活躍させる取り組み
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
 
In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性
 
データプランナーによるデータ系施策について
データプランナーによるデータ系施策についてデータプランナーによるデータ系施策について
データプランナーによるデータ系施策について
 
20120622 data conference
20120622 data conference20120622 data conference
20120622 data conference
 
「R」による従業員満足度調査(ES)事例
「R」による従業員満足度調査(ES)事例「R」による従業員満足度調査(ES)事例
「R」による従業員満足度調査(ES)事例
 
20230610ビジネス実務学会_基調講演.pdf
20230610ビジネス実務学会_基調講演.pdf20230610ビジネス実務学会_基調講演.pdf
20230610ビジネス実務学会_基調講演.pdf
 
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
[INEVITABLE ja night] 2019 年 3 月 1 日 - データでカスタマーエクスペリエンスを どう捉えるか
 
[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック
[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック
[Keynote-2] リターン・オン・モデル(ROM)で価値の最大化を目指す、社会実装されるための機械学習テクニック
 
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
人工知能に任せないと難しい時代、何をどうやるべきか~楽天のAI技術活用から人材育成まで~
 
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションいじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
 
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
ビッグデータ・オープンデータ活用の現状〜ビッグデータ活用概要編〜
 
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
 
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
 
モノタロウが トレジャーデータを使う理由と、 データを活かす企業文化
モノタロウがトレジャーデータを使う理由と、データを活かす企業文化モノタロウがトレジャーデータを使う理由と、データを活かす企業文化
モノタロウが トレジャーデータを使う理由と、 データを活かす企業文化
 
スマホアプリハンズオン(Lightning Network)を 始めた理由
スマホアプリハンズオン(Lightning Network)を 始めた理由スマホアプリハンズオン(Lightning Network)を 始めた理由
スマホアプリハンズオン(Lightning Network)を 始めた理由
 
このIRのグラフがすごい!上場企業2021
このIRのグラフがすごい!上場企業2021このIRのグラフがすごい!上場企業2021
このIRのグラフがすごい!上場企業2021
 

More from 西岡 賢一郎

Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用するAmazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
西岡 賢一郎
 
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化するAmazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
西岡 賢一郎
 
Amazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成するAmazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成する
西岡 賢一郎
 
リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待
西岡 賢一郎
 
リモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのことリモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのこと
西岡 賢一郎
 
Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介
西岡 賢一郎
 
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解するFeature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
西岡 賢一郎
 
機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store
西岡 賢一郎
 
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
西岡 賢一郎
 
Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習
西岡 賢一郎
 
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
西岡 賢一郎
 
Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論
西岡 賢一郎
 
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
西岡 賢一郎
 
未来のカタチ x AI
未来のカタチ x AI未来のカタチ x AI
未来のカタチ x AI
西岡 賢一郎
 
TorchDataチュートリアル解説
TorchDataチュートリアル解説TorchDataチュートリアル解説
TorchDataチュートリアル解説
西岡 賢一郎
 
Amazon SageMaker JumpStart
Amazon SageMaker JumpStartAmazon SageMaker JumpStart
Amazon SageMaker JumpStart
西岡 賢一郎
 
Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介
西岡 賢一郎
 
Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習
西岡 賢一郎
 
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきことPMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
西岡 賢一郎
 
H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門
西岡 賢一郎
 

More from 西岡 賢一郎 (20)

Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用するAmazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
 
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化するAmazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
 
Amazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成するAmazon SageMakerのNotebookからJobを作成する
Amazon SageMakerのNotebookからJobを作成する
 
リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待リモートワークで知っておきたい コミュニケーション時の過大な期待
リモートワークで知っておきたい コミュニケーション時の過大な期待
 
リモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのことリモートワークで意識すべき7つのこと
リモートワークで意識すべき7つのこと
 
Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介Amazon SageMaker ML Governance 3つの機能紹介
Amazon SageMaker ML Governance 3つの機能紹介
 
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解するFeature StoreのOnline StoreとOffline Storeの違いについて理解する
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
 
機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store機械学習の特徴量を管理するAmazon SageMaker Feature Store
機械学習の特徴量を管理するAmazon SageMaker Feature Store
 
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
 
Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習Amazon SageMakerでカスタムコンテナを使った学習
Amazon SageMakerでカスタムコンテナを使った学習
 
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
 
Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論Amazon AthenaでSageMakerを使った推論
Amazon AthenaでSageMakerを使った推論
 
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
 
未来のカタチ x AI
未来のカタチ x AI未来のカタチ x AI
未来のカタチ x AI
 
TorchDataチュートリアル解説
TorchDataチュートリアル解説TorchDataチュートリアル解説
TorchDataチュートリアル解説
 
Amazon SageMaker JumpStart
Amazon SageMaker JumpStartAmazon SageMaker JumpStart
Amazon SageMaker JumpStart
 
Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介Amazon SageMaker Studio Lab紹介
Amazon SageMaker Studio Lab紹介
 
Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習Amazon SageMaker Canvasを使ったノーコード機械学習
Amazon SageMaker Canvasを使ったノーコード機械学習
 
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきことPMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
 
H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門H2O Waveを使ったAIアプリケーション作成入門
H2O Waveを使ったAIアプリケーション作成入門
 

位置情報SNSのチェックインデータを用いたユーザの傾向の分析と位置予測

Editor's Notes

  1. In the result, we changed checkin sequence to the probability distribution of user location. This distribution is defined in continuous time. I don’t have much time today, let me skip the detail of previous research. Let me move on how to predict users’ location from the user distribution.
  2. From now on, I’ll explain why our previous methods doesn’t suit to prediction and how to improve it. As we defined, expansion of user distribution is limited between checkins. But, after last checkin, the distribution is expanding as time advances because it moves like a free particle. There is no constraint after last checkin. In other word, the distribution becomes close to uniform eventually. Prediction model predicts users’ future locations. We have to predict user’s location after last checkin. So, the distribution is not adequate to predict user location. We can’t use the model for prediction model as it is.
  3. Some previous researches found that users’ check-ins appears regularly. Especially, daily regularity is prominently observable. So, we use daily regularity in our prediction model.
  4. This is how to create the prediction model with users’ daily regularity. We discretized the distribution into hours. We grouped the distribution by days and average the probability distributions. As the results, we have 24 spatial distributions for each user.