SlideShare a Scribd company logo










( ) ( )
: 𝐾
𝑡 = 1,2, … , 𝑇
𝐼(𝑡) ∈
{1, . . , 𝐾}
𝑋𝐼 𝑡 𝑡
𝑡=1
𝑇
𝑋𝐼 𝑡 (𝑡)
(image from
http://www.directgamesroom.com )
arm




Bernoulli: 1= ,
0= )
 𝑖 𝜈𝑖

𝑋𝐼 𝑡 𝑡 ∼ 𝜈𝐼(𝑡)
 𝜈𝑖

Bernoulli(𝜇𝑖)
 {𝜇𝑖

𝜇𝑖
𝜇1 > 𝜇2 > 𝜇3 > ⋯ > 𝜇 𝐾
{𝜇𝑖}𝑖∈[𝐾]
 𝜇1
 𝑇 𝜇1 𝑇

 𝜇1, … . , 𝜇 𝐾
 𝜇𝑖
argmaxi 𝜇𝑖
 argmaxi 𝜇𝑖 = argmaxi 𝜇𝑖 =: 𝜇1
𝜇1
Regret 𝑇 = 𝜇1 𝑇 −
𝑖
𝐾
𝜇𝑖 𝑁 𝑇 (𝑖)
𝑁 𝑇(𝑖) 𝑇
𝑖
 𝑖 𝜇1 − 𝜇𝑖
 𝐸 Regret 𝑇
𝐸[𝑁𝑖(𝑇)]


•

•
•
•
•
∈


2



: 𝐾 L (< 𝐾)
: 𝑇
𝑡 L 𝐼(𝑡)
{𝑋𝑖 𝑡 } (𝑖 ∈ 𝐼 𝑡 ) .
𝑋𝑖 𝑡 ∼ 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝜇𝑖)
Regret(T) =
𝑡=1
𝑇
𝑖∈ 𝐿
𝜇𝑖 𝑡 −
𝑖∈𝐼 𝑡
𝜇𝑖 𝑡
{𝐿 + 1, 𝐿 + 2, … , 𝐾}
𝐼 𝑡 = {1, … , 𝐿}
単数選択で最適 複数選択で最適
単数選択で最適 複数選択で最適
本研究

Regret 𝑇 ≥
𝑖∈{𝐿+1,…,𝐾}
𝜇 𝐿 − 𝜇𝑖 log 𝑇
𝐷 𝐾𝐿 𝜇𝑖, 𝜇 𝐿
− 𝑜 log 𝑇


3
L-2
L-1
i>L
j>L
𝐼(𝑡)
2
L


•
•




𝑖
𝛼𝑖(1) = 1, 𝛽𝑖(1) = 1
𝜃𝑖(𝑡) ∼ Beta(𝛼𝑖 𝑡 , 𝛽𝑖(𝑡)) 𝐼 𝑡 = 𝜃𝑖(𝑡)
𝑋𝐼 𝑡 𝑡 𝛼𝐼(𝑡) 𝛼𝐼(𝑡)(𝑡)
𝛽𝐼(𝑡) 𝛽𝐼(𝑡)(𝑡)
𝜃𝑖(𝑡) ∼ 𝐵𝑒𝑡𝑎(𝛼𝑖(𝑡), 𝛽𝑖(𝑡)) 𝐼 𝑡 =
𝜃𝑖(𝑡)
𝑖 ∈ 𝐼 𝑡
𝑋𝑖 𝑡 𝛼𝑖 𝛼𝑖(𝑡)
𝛽𝑖 𝛽𝑖




𝑂(
log 𝑡
𝑡
)
𝑂(
log 𝑡
𝑡
2
)
𝑡 = 1, … , 𝑇 𝑂(1)





More Related Content

What's hot

Editando ecuaciones en Word
Editando ecuaciones en WordEditando ecuaciones en Word
Editando ecuaciones en WordCyn_008
 
Trabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBA
Trabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBATrabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBA
Trabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBA
prueba 88
 
クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height
クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height
クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height
Junpei Tsuji
 
Tugas matematika kalkulus
Tugas matematika kalkulusTugas matematika kalkulus
Tugas matematika kalkulus
fdjouhana
 
Asignacion de Calculo4 Carlos gonzalez Saia E
Asignacion de Calculo4 Carlos gonzalez Saia EAsignacion de Calculo4 Carlos gonzalez Saia E
Asignacion de Calculo4 Carlos gonzalez Saia E
uftcar
 
Soal dan Penyelesaian tugas Kalkulus
Soal dan Penyelesaian tugas KalkulusSoal dan Penyelesaian tugas Kalkulus
Soal dan Penyelesaian tugas Kalkulus
fauz1
 
ゲーム理論BASIC 演習27 -シュタッケルベルク競争-
ゲーム理論BASIC 演習27 -シュタッケルベルク競争-ゲーム理論BASIC 演習27 -シュタッケルベルク競争-
ゲーム理論BASIC 演習27 -シュタッケルベルク競争-
ssusere0a682
 
امتحان حساب للصف
امتحان حساب للصفامتحان حساب للصف
امتحان حساب للصفhranhosam
 
Punto 6
Punto 6Punto 6
Ejercicios de Calculo. Grupo 2.
Ejercicios de Calculo. Grupo 2.Ejercicios de Calculo. Grupo 2.
Ejercicios de Calculo. Grupo 2.
VANESSAPNFSCA
 
Integrador calculo vectoria
Integrador calculo vectoriaIntegrador calculo vectoria
Integrador calculo vectoria
Fernando Arcos Koronel
 
Universidad Fermín toro
Universidad Fermín toro Universidad Fermín toro
Universidad Fermín toro
manuel franco
 
Soal uts 1415_i
Soal uts 1415_iSoal uts 1415_i
Soal uts 1415_i
rosid tamami tamami
 
회귀모델의 종류와 특징
회귀모델의 종류와 특징회귀모델의 종류와 특징
회귀모델의 종류와 특징
Eun-Jo Lee
 
Todo simbolos-giorgina-ekermann
Todo simbolos-giorgina-ekermannTodo simbolos-giorgina-ekermann
Todo simbolos-giorgina-ekermanngiorginayanet
 
Resistencia de materiales ii
Resistencia de materiales ii  Resistencia de materiales ii
Resistencia de materiales ii
karen sofia silva huanca
 
KISI-KISI
KISI-KISIKISI-KISI
KISI-KISI
Azhar Ridwan
 

What's hot (18)

Editando ecuaciones en Word
Editando ecuaciones en WordEditando ecuaciones en Word
Editando ecuaciones en Word
 
Trabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBA
Trabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBATrabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBA
Trabajo encargado tarea 1 INTEGRALES RESOLUCIÓN PRUEBA
 
クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height
クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height
クンマーの合同式とゼータ関数の左側 - 数学カフェ #mathcafe_height
 
Tugas matematika kalkulus
Tugas matematika kalkulusTugas matematika kalkulus
Tugas matematika kalkulus
 
Asignacion de Calculo4 Carlos gonzalez Saia E
Asignacion de Calculo4 Carlos gonzalez Saia EAsignacion de Calculo4 Carlos gonzalez Saia E
Asignacion de Calculo4 Carlos gonzalez Saia E
 
Soal dan Penyelesaian tugas Kalkulus
Soal dan Penyelesaian tugas KalkulusSoal dan Penyelesaian tugas Kalkulus
Soal dan Penyelesaian tugas Kalkulus
 
ゲーム理論BASIC 演習27 -シュタッケルベルク競争-
ゲーム理論BASIC 演習27 -シュタッケルベルク競争-ゲーム理論BASIC 演習27 -シュタッケルベルク競争-
ゲーム理論BASIC 演習27 -シュタッケルベルク競争-
 
امتحان حساب للصف
امتحان حساب للصفامتحان حساب للصف
امتحان حساب للصف
 
Punto 6
Punto 6Punto 6
Punto 6
 
Ejercicios de Calculo. Grupo 2.
Ejercicios de Calculo. Grupo 2.Ejercicios de Calculo. Grupo 2.
Ejercicios de Calculo. Grupo 2.
 
Integrador calculo vectoria
Integrador calculo vectoriaIntegrador calculo vectoria
Integrador calculo vectoria
 
Universidad Fermín toro
Universidad Fermín toro Universidad Fermín toro
Universidad Fermín toro
 
Soal uts 1415_i
Soal uts 1415_iSoal uts 1415_i
Soal uts 1415_i
 
แผนการดำเนินงาน2557
แผนการดำเนินงาน2557แผนการดำเนินงาน2557
แผนการดำเนินงาน2557
 
회귀모델의 종류와 특징
회귀모델의 종류와 특징회귀모델의 종류와 특징
회귀모델의 종류와 특징
 
Todo simbolos-giorgina-ekermann
Todo simbolos-giorgina-ekermannTodo simbolos-giorgina-ekermann
Todo simbolos-giorgina-ekermann
 
Resistencia de materiales ii
Resistencia de materiales ii  Resistencia de materiales ii
Resistencia de materiales ii
 
KISI-KISI
KISI-KISIKISI-KISI
KISI-KISI
 

More from jkomiyama

バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題について
jkomiyama
 
暴れまわるティラノサウルス
暴れまわるティラノサウルス暴れまわるティラノサウルス
暴れまわるティラノサウルス
jkomiyama
 
ICML2015概要
ICML2015概要ICML2015概要
ICML2015概要
jkomiyama
 
Annals of Statistics読み回 第一回
Annals of Statistics読み回 第一回Annals of Statistics読み回 第一回
Annals of Statistics読み回 第一回
jkomiyama
 
20150331annstat preview
20150331annstat preview20150331annstat preview
20150331annstat preview
jkomiyama
 
WWW2014勉強会発表
WWW2014勉強会発表WWW2014勉強会発表
WWW2014勉強会発表
jkomiyama
 
確率的バンディット問題
確率的バンディット問題確率的バンディット問題
確率的バンディット問題jkomiyama
 

More from jkomiyama (7)

バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題について
 
暴れまわるティラノサウルス
暴れまわるティラノサウルス暴れまわるティラノサウルス
暴れまわるティラノサウルス
 
ICML2015概要
ICML2015概要ICML2015概要
ICML2015概要
 
Annals of Statistics読み回 第一回
Annals of Statistics読み回 第一回Annals of Statistics読み回 第一回
Annals of Statistics読み回 第一回
 
20150331annstat preview
20150331annstat preview20150331annstat preview
20150331annstat preview
 
WWW2014勉強会発表
WWW2014勉強会発表WWW2014勉強会発表
WWW2014勉強会発表
 
確率的バンディット問題
確率的バンディット問題確率的バンディット問題
確率的バンディット問題
 

Optimal Regret Analysis of Thompson Sampling in Stochastic Multi-armed Bandit Problem with Multiple Plays