SlideShare a Scribd company logo
ある最適停止問題の解
2016.01.30 下野寿之
1
例題-1
 問題設定 :
- ある病院にある心臓外科医が雇われているとする。
- ”訓練” の経験時間に比例して、”能力が増大” し、
単位時間当たり(例, 1週間または1ヶ月)に行える “手術” によって、
救える人の命の数が増える( “価値を出力” する) ものとする。
- ただし、”訓練” ではない時間(手術をしている時間を含む) は
その能力が増えないものとする。
- その医師が(25歳で)着任してから(65歳で)定年になるまでの
現役期間にどういう訓練期間を与えると、
救える人の命の数が、最大になるだろうか?
2
ここに記載した問題設定は、後で述べる理屈を分かり安く説明するための例として、
心臓外科医を持ち出したのであって、医療の問題をこのスライドで触れる訳では全
くありません。伝統工芸品を作る人が、生涯の製造品の価値の総和を最大化する
問題として置き換えることができます。具体例はいくらでも作れます。
ある図式化:
3
人生の時間
着任
(25歳)
離任
(65歳)
← 現役期間 →
能力の高さ
手を動かしたら生み
出せる価値の大きさ
 横軸を、時間を考える。
左から右へ時間が流れる。
 縦軸は、その時点の”能力”の
高さを表す。
 青い部分が “訓練期間” 中に
“能力” が一定の傾きで伸びて
いる様子を表す。
 赤い部分が、”生み出している
価値” を表す。赤い面積が生
み出した価値の総量に比例す
る。
 始まりと終わりは決まっていて、
赤い部分の上辺は、傾き0とす
る。
 赤い領域の面積を最大化する
ことが、元の問題の最適化の
解に一致する。
ある回答に到るまでのある考え方
4
(3) 訓練期間は最初に集中す
るのが “最適” の必要条件とな
る。(上の図の場合、左に現れた赤い
領域は、上下方向が短くて、もったいな
いことになっている。)
(1) 訓練だけ
で何も価値を
出力しないの
は、当然最適
ではない。
(2) 現役期間の後半よりも前半に、訓
練期間がある方がいいのは、明らか。
(下の2個の左と右の赤と青を比較)
現実の問題に対応させるには、現役が終わっ
ても(さらには死後も) 価値を生み出し続けるこ
ともあります。また、訓練を長くしないと価値を
生み出す能力は下がるのが普通です。しかし、
まずここでは、分かり安い理論模型を導くこと
が目的なので、簡単な定式化を最初に試みて
います。
例題-1 の解
5
人生の時間
着任
(25歳)
離任
(65歳)
← 現役期間 →
能力の高さ
手を動かしたら生み
出せる価値の大きさ
解のある表現 :
仮にずっと最後まで訓練した場合
に到達しうる最大能力を H とする。
H の50%、つまり H/2 に能力が到
達するまで訓練期間を維持し、そ
の後、価値を最後の日まで、出力
をし続ければ良い。
H
H/2
図式的に解説すると、冒頭の問題の最適解の
導き方は、理解しやすいと思われます。ただし、
数学的な定式化はやや大変かもしれません。
ひょっとしたら、機械的なアルゴリズムで検証
可能な形で、数学的な証明を書き下すのは、
ひとつ面白い問題だと思います。ç
例題-2
6
前問では、”成長カーブ” は直線であった。
では、その成長カーブを次のように変えた
らどうなるか? (最適な変更点はどこか?)
(1) 平方根関数 t1/2
(1’) 冪指数が α >0 の場合 : tα
(2) 指数関数 exp( β t ) ただし、β>0
ただし、一般性を失わない仮定として、
t の範囲は 0 から 1 とする。
平方根関数
2乗の関数
指数関数 exp(3t)
例題-2 の解
7
(1) (1’)
冪指数が固定の場合: h(t) := tα とする(α>0)。
赤の領域の面積は、s := (1-t)tα = tα-tα+1
∴ ds/dt = αtα-1 - (α+1)tα
∴ ds/dt = 0 ⇔ t = α/(α+1) = 1 – 1/(α+1)
従って、
α =1/2 であれば、t=1/3, h(t) = 0.577.. の時点が最適な変更点。
α = 2 であれば、 t=2/3, h(t) = 0.444.. の時点が最適な変更点。
(2) 指数関数の場合 : h(t) := exp( β t ) とする(β>0)。
赤の領域の面積は、s := (1-t)eβt = eβt-teβt
∴ ds/dt = βeβt-(eβt+tβeβt) = (β-1)eβt-βteβt
∴ ds/dt = 0 ⇔ t=(β-1)/β = 1 - 1/β
0≦t≦1の制約により
β >1であれば t = 1-1/β, h(t) = e-1 = 0.367879.. が最適変更点。
β ≦1であれば、t = 0 が最適変更点(青い領域は消失する)。
本題とは関係ありませんが、e3(3) = 20.0855.. で、20からのずれが、たったの0.42..%です。
得られる知見
8
※ 平方根関数は、「”既に身に付けた能力” にちょうど反比
例(-1乗に比例して)、次の1単位の能力の習得に時間がかか
る」をモデリングした微分方程式の解になっている。
横軸は、”成長カーブ”のベキ乗の指
数αを、逆tangent変換したものに対応。
2本の曲線について:
- 細線は T (最適停止時刻)の値
- 太線は h(T) (目標とすべき到達点)
(1) 加速度的/指数関数的に成長できる場合 :
最初はなかなか成長しなくても、
訓練期間は長くする。
ただし、到達可能最高点の約40%で、
あきらめを付けた方が良い。— ???
(2) 成熟後に能力飽和の傾向がある場合:
とりあえず ”達人” の6-7割になれる
までは訓練してみる。
与えられた期間の最初の約30%を
訓練に当てるとよい。
(1)
(2)
おまけ
• 密度関数が xα-1(1-x)β-1 /B(α,β) となる [0,1]区間上の確率分布を ベータ
分布と言う。(α,β>0であり、Bはベータ関数。)
• α>1かつβ>1の条件が成り立たないときは、ベータ分布の密度関数の、
対数を取ったものは、上に凸ではない。
• ところが、xをロジット変換( log[x/(1-x)] )したものの密度関数を、対数を
取ると、上に凸になる。
• では、ベータ分布を1変量ではなくて多変量に拡張したディリクレ分布に
ついて、その多変量をどう同時変換したら、密度関数の対数を取ると、
上に凸な関数になるだろうか??
9
本文とは全く脈略無く、
最近思いついた問題です :-)

More Related Content

Viewers also liked

Tokyo.R #22 Association Rules
Tokyo.R #22 Association RulesTokyo.R #22 Association Rules
Tokyo.R #22 Association Rules
osamu morimoto
 
Rexhep qosja te vertetat e vonuara
Rexhep qosja   te vertetat e vonuaraRexhep qosja   te vertetat e vonuara
Rexhep qosja te vertetat e vonuaraLibra Islame
 
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
Koichi Hamada
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用
Shohei Kumagai
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
Mitsunori Sato
 
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
宏喜 佐野
 
今日から使える! みんなのクラスタリング超入門
今日から使える! みんなのクラスタリング超入門今日から使える! みんなのクラスタリング超入門
今日から使える! みんなのクラスタリング超入門
toilet_lunch
 
論文紹介 Semi-supervised Learning with Deep Generative Models
論文紹介 Semi-supervised Learning with Deep Generative Models論文紹介 Semi-supervised Learning with Deep Generative Models
論文紹介 Semi-supervised Learning with Deep Generative Models
Seiya Tokui
 
SVMについて
SVMについてSVMについて
SVMについて
mknh1122
 
深層学習時代の自然言語処理
深層学習時代の自然言語処理深層学習時代の自然言語処理
深層学習時代の自然言語処理
Yuya Unno
 
Dbhondoren 14 15
Dbhondoren 14 15Dbhondoren 14 15
Dbhondoren 14 15arbelar
 
Magma Investor Presentation Q2 FY12
Magma Investor Presentation Q2 FY12Magma Investor Presentation Q2 FY12
Magma Investor Presentation Q2 FY12AtulTibrewal
 
Iman kepribadian
Iman kepribadianIman kepribadian
Iman kepribadian
MTs Nurul Huda Sukaraja
 
Mind chinmayananda
Mind chinmayanandaMind chinmayananda
Mind chinmayananda
BASKARAN P
 
Diapositiva word zoom
Diapositiva word zoomDiapositiva word zoom
Diapositiva word zoom
Angelica Lanchas
 

Viewers also liked (17)

Tokyo.R #22 Association Rules
Tokyo.R #22 Association RulesTokyo.R #22 Association Rules
Tokyo.R #22 Association Rules
 
Rexhep qosja te vertetat e vonuara
Rexhep qosja   te vertetat e vonuaraRexhep qosja   te vertetat e vonuara
Rexhep qosja te vertetat e vonuara
 
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用
 
実践で学ぶネットワーク分析
実践で学ぶネットワーク分析実践で学ぶネットワーク分析
実践で学ぶネットワーク分析
 
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
 
今日から使える! みんなのクラスタリング超入門
今日から使える! みんなのクラスタリング超入門今日から使える! みんなのクラスタリング超入門
今日から使える! みんなのクラスタリング超入門
 
論文紹介 Semi-supervised Learning with Deep Generative Models
論文紹介 Semi-supervised Learning with Deep Generative Models論文紹介 Semi-supervised Learning with Deep Generative Models
論文紹介 Semi-supervised Learning with Deep Generative Models
 
SVMについて
SVMについてSVMについて
SVMについて
 
深層学習時代の自然言語処理
深層学習時代の自然言語処理深層学習時代の自然言語処理
深層学習時代の自然言語処理
 
Dbhondoren 14 15
Dbhondoren 14 15Dbhondoren 14 15
Dbhondoren 14 15
 
Magma Investor Presentation Q2 FY12
Magma Investor Presentation Q2 FY12Magma Investor Presentation Q2 FY12
Magma Investor Presentation Q2 FY12
 
Iman kepribadian
Iman kepribadianIman kepribadian
Iman kepribadian
 
Mind chinmayananda
Mind chinmayanandaMind chinmayananda
Mind chinmayananda
 
Huongdanxaydung web
Huongdanxaydung webHuongdanxaydung web
Huongdanxaydung web
 
Diapositiva word zoom
Diapositiva word zoomDiapositiva word zoom
Diapositiva word zoom
 
LSCV2015
LSCV2015LSCV2015
LSCV2015
 

More from Toshiyuki Shimono

国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)
Toshiyuki Shimono
 
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
Toshiyuki Shimono
 
extracting only a necessary file from a zip file
extracting only a necessary file from a zip fileextracting only a necessary file from a zip file
extracting only a necessary file from a zip file
Toshiyuki Shimono
 
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
Toshiyuki Shimono
 
新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで
Toshiyuki Shimono
 
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 Multiplicative Decompositions of Stochastic Distributions and Their Applicat... Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
Toshiyuki Shimono
 
Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...
Toshiyuki Shimono
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Toshiyuki Shimono
 
Sqlgen190412.pdf
Sqlgen190412.pdfSqlgen190412.pdf
Sqlgen190412.pdf
Toshiyuki Shimono
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)
Toshiyuki Shimono
 
Seminar0917
Seminar0917Seminar0917
Seminar0917
Toshiyuki Shimono
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
Toshiyuki Shimono
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
Toshiyuki Shimono
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
Toshiyuki Shimono
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Toshiyuki Shimono
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案
Toshiyuki Shimono
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど
Toshiyuki Shimono
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなす
Toshiyuki Shimono
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理
Toshiyuki Shimono
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324
Toshiyuki Shimono
 

More from Toshiyuki Shimono (20)

国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)
 
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
 
extracting only a necessary file from a zip file
extracting only a necessary file from a zip fileextracting only a necessary file from a zip file
extracting only a necessary file from a zip file
 
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
 
新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで
 
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 Multiplicative Decompositions of Stochastic Distributions and Their Applicat... Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 
Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
 
Sqlgen190412.pdf
Sqlgen190412.pdfSqlgen190412.pdf
Sqlgen190412.pdf
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)
 
Seminar0917
Seminar0917Seminar0917
Seminar0917
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなす
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324
 

ある最適停止問題の解についての考察

  • 2. 例題-1  問題設定 : - ある病院にある心臓外科医が雇われているとする。 - ”訓練” の経験時間に比例して、”能力が増大” し、 単位時間当たり(例, 1週間または1ヶ月)に行える “手術” によって、 救える人の命の数が増える( “価値を出力” する) ものとする。 - ただし、”訓練” ではない時間(手術をしている時間を含む) は その能力が増えないものとする。 - その医師が(25歳で)着任してから(65歳で)定年になるまでの 現役期間にどういう訓練期間を与えると、 救える人の命の数が、最大になるだろうか? 2 ここに記載した問題設定は、後で述べる理屈を分かり安く説明するための例として、 心臓外科医を持ち出したのであって、医療の問題をこのスライドで触れる訳では全 くありません。伝統工芸品を作る人が、生涯の製造品の価値の総和を最大化する 問題として置き換えることができます。具体例はいくらでも作れます。
  • 3. ある図式化: 3 人生の時間 着任 (25歳) 離任 (65歳) ← 現役期間 → 能力の高さ 手を動かしたら生み 出せる価値の大きさ  横軸を、時間を考える。 左から右へ時間が流れる。  縦軸は、その時点の”能力”の 高さを表す。  青い部分が “訓練期間” 中に “能力” が一定の傾きで伸びて いる様子を表す。  赤い部分が、”生み出している 価値” を表す。赤い面積が生 み出した価値の総量に比例す る。  始まりと終わりは決まっていて、 赤い部分の上辺は、傾き0とす る。  赤い領域の面積を最大化する ことが、元の問題の最適化の 解に一致する。
  • 4. ある回答に到るまでのある考え方 4 (3) 訓練期間は最初に集中す るのが “最適” の必要条件とな る。(上の図の場合、左に現れた赤い 領域は、上下方向が短くて、もったいな いことになっている。) (1) 訓練だけ で何も価値を 出力しないの は、当然最適 ではない。 (2) 現役期間の後半よりも前半に、訓 練期間がある方がいいのは、明らか。 (下の2個の左と右の赤と青を比較) 現実の問題に対応させるには、現役が終わっ ても(さらには死後も) 価値を生み出し続けるこ ともあります。また、訓練を長くしないと価値を 生み出す能力は下がるのが普通です。しかし、 まずここでは、分かり安い理論模型を導くこと が目的なので、簡単な定式化を最初に試みて います。
  • 5. 例題-1 の解 5 人生の時間 着任 (25歳) 離任 (65歳) ← 現役期間 → 能力の高さ 手を動かしたら生み 出せる価値の大きさ 解のある表現 : 仮にずっと最後まで訓練した場合 に到達しうる最大能力を H とする。 H の50%、つまり H/2 に能力が到 達するまで訓練期間を維持し、そ の後、価値を最後の日まで、出力 をし続ければ良い。 H H/2 図式的に解説すると、冒頭の問題の最適解の 導き方は、理解しやすいと思われます。ただし、 数学的な定式化はやや大変かもしれません。 ひょっとしたら、機械的なアルゴリズムで検証 可能な形で、数学的な証明を書き下すのは、 ひとつ面白い問題だと思います。ç
  • 6. 例題-2 6 前問では、”成長カーブ” は直線であった。 では、その成長カーブを次のように変えた らどうなるか? (最適な変更点はどこか?) (1) 平方根関数 t1/2 (1’) 冪指数が α >0 の場合 : tα (2) 指数関数 exp( β t ) ただし、β>0 ただし、一般性を失わない仮定として、 t の範囲は 0 から 1 とする。 平方根関数 2乗の関数 指数関数 exp(3t)
  • 7. 例題-2 の解 7 (1) (1’) 冪指数が固定の場合: h(t) := tα とする(α>0)。 赤の領域の面積は、s := (1-t)tα = tα-tα+1 ∴ ds/dt = αtα-1 - (α+1)tα ∴ ds/dt = 0 ⇔ t = α/(α+1) = 1 – 1/(α+1) 従って、 α =1/2 であれば、t=1/3, h(t) = 0.577.. の時点が最適な変更点。 α = 2 であれば、 t=2/3, h(t) = 0.444.. の時点が最適な変更点。 (2) 指数関数の場合 : h(t) := exp( β t ) とする(β>0)。 赤の領域の面積は、s := (1-t)eβt = eβt-teβt ∴ ds/dt = βeβt-(eβt+tβeβt) = (β-1)eβt-βteβt ∴ ds/dt = 0 ⇔ t=(β-1)/β = 1 - 1/β 0≦t≦1の制約により β >1であれば t = 1-1/β, h(t) = e-1 = 0.367879.. が最適変更点。 β ≦1であれば、t = 0 が最適変更点(青い領域は消失する)。 本題とは関係ありませんが、e3(3) = 20.0855.. で、20からのずれが、たったの0.42..%です。
  • 8. 得られる知見 8 ※ 平方根関数は、「”既に身に付けた能力” にちょうど反比 例(-1乗に比例して)、次の1単位の能力の習得に時間がかか る」をモデリングした微分方程式の解になっている。 横軸は、”成長カーブ”のベキ乗の指 数αを、逆tangent変換したものに対応。 2本の曲線について: - 細線は T (最適停止時刻)の値 - 太線は h(T) (目標とすべき到達点) (1) 加速度的/指数関数的に成長できる場合 : 最初はなかなか成長しなくても、 訓練期間は長くする。 ただし、到達可能最高点の約40%で、 あきらめを付けた方が良い。— ??? (2) 成熟後に能力飽和の傾向がある場合: とりあえず ”達人” の6-7割になれる までは訓練してみる。 与えられた期間の最初の約30%を 訓練に当てるとよい。 (1) (2)
  • 9. おまけ • 密度関数が xα-1(1-x)β-1 /B(α,β) となる [0,1]区間上の確率分布を ベータ 分布と言う。(α,β>0であり、Bはベータ関数。) • α>1かつβ>1の条件が成り立たないときは、ベータ分布の密度関数の、 対数を取ったものは、上に凸ではない。 • ところが、xをロジット変換( log[x/(1-x)] )したものの密度関数を、対数を 取ると、上に凸になる。 • では、ベータ分布を1変量ではなくて多変量に拡張したディリクレ分布に ついて、その多変量をどう同時変換したら、密度関数の対数を取ると、 上に凸な関数になるだろうか?? 9 本文とは全く脈略無く、 最近思いついた問題です :-)

Editor's Notes

  1. par(new=T) ; curve ( sqrt(x),from=0,to=1/3,xaxt="n",yaxt="n",xaxs="i",yaxs="i", type="h",lwd=2,xlim=0:1,ylim=0:1,col="royalblue") par(new=T) ; curve ( x*0+sqrt(1/3),from=1/3,to=1,xaxt="n",yaxt="n",xaxs="i",yaxs="i", type="h",lwd=3,xlim=0:1,ylim=0:1,col="firebrick2") par(new=T) curve ( sqrt(x) , xaxt = "n" , yaxt="n", xaxs="i",yaxs="i" ,lwd = 3,n=400, ylim=0:1) par(new=T) ; curve ( (x)^2,from=0,to=2/3,xaxt="n",yaxt="n",xaxs="i",yaxs="i", type="h",lwd=4,xlim=0:1,ylim=0:1,col="royalblue") par(new=T) ; curve ( x*0+(2/3)^2,from=2/3,to=1,xaxt="n",yaxt="n",xaxs="i",yaxs="i", type="h",lwd=3,xlim=0:1,ylim=0:1,col="firebrick2") par(new=T) curve ( (x)^2 , xaxt = "n" , yaxt="n", xaxs="i",yaxs="i" ,lwd = 3,n=400, ylim=0:1) par(new=T) ; curve ( exp(x),from=0,to=2,xaxt="n",yaxt="n",xaxs="i",yaxs="i", type="h",lwd=4,xlim=(0:1)*3,ylim=0:1*20,col="royalblue") par(new=T) ; curve ( x*0+exp(2),from=2,to=3,xaxt="n",yaxt="n",xaxs="i",yaxs="i", type="h",lwd=3,xlim=0:1*3,ylim=0:1*20,col="firebrick2") par(new=T) curve ( exp(x) , xaxt = "n" , yaxt="n", xaxs="i",yaxs="i" ,lwd = 3,n=400, xlim=0:1*3,ylim=0:1*20) axis(2,c(0,10,20),las=2,cex.axis=1.8) axis(1,c(0,1,2,3),c("0","1/3","2/3",1),las=1,cex.axis=1.8) 1+3+9/2+27/6+81/24+243/120 1+3+9/2+27/6+81/24+243/120+729/720 1+3+9/2+27/6+81/24+243/120+729/720+2187/5040 1+3+9/2+27/6+81/24+243/120+729/720+2187/5040+6561/40320