Convex optimization

Convex Optimization
Presenter: @raitefu_ml
Place: DeepCoreKernel
Date: 2018/1/26

書誌情報
❏ https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf
❏ 同著者スライド引用数が 40000超
❏ 例や図が豊富で具体的なイメージがつきやすい
❏ 理論-応用-アルゴリズム 3章からなる
❏ 理論パート凸最適化定式化
ex) convex set, convex function etc.
❏ 応用凸最適化が使われる主要な場面紹介
ex) Statistical Estimation etc.
❏ アルゴリズムパート具体的な解き方
ex) 勾配降下 etc.
❏ 今日やる理論パート (2~4章)

今日やること〜凸〇〇定義から問題定式化まで〜
1. Introduction
Notation + 凸最適化問題標準形
2. Convex Set
凸集合定義
3. Convex Function
凸関数定義
4. Convex Optimization
凸最適化問題定式化

凸最適化問題で解きたいも
❏ 凸最適化といえこ形を思い出せよい
❏ 凸最適化かなり研究が進んでおり , 効率的な解き方が存在する . で式変形をして凸最適化問題形
に落とし込め効率的に解ける (今回解き方までやらない )(やれない)

凸集合(convex set) 定義
凸凸でない凸でない

凸集合凸関数実質的な定義域を形成する
❏ 凸関数凸集合上で定義されるで関数定義域として凸集合を定義しておく必要がある
❏ 凸最適化において凸関数定義域だけでなく , 実行可能集合(feasible set)も凸集合で指定される
(凸集合 intersection 凸集合なで, 凸関数実行可能集合上でも矛盾なく定義できる )
❏ 不等式を拡張した一般化不等式に凸錐 (凸集合一つ)が使われる(後述).
半空間
線形な不等式で指定される領域
多面体(polyhedron)
半空間 intersectionとして指定される領域

凸集合例: 凸錐
グレー領域が凸錐をなす.

凸錐例: 半正定値対称行列
❏ 半正定値対称行列凸錐をなす . なぜなら ,
上記計算により半正定値対称行列錐結合 (conic combination) 再び半正定値対称行列となること
がわかる.

錐ベクトル大小関係を規定するためにも使われる
❏ 最適化問題において目的関数戻り値がベクトル時 , ベクトル良さを比較する必要がある
❏ ベクトル間大小関係非自明
ex) [3, 3, 3]と[1, 1, 1]なら前者が大きそうだが , [1, 3, 4]と[2, 1, 4] …？
❏ 凸錐概念一般化不等式に直接使われる . 厳密に凸錐より強い真錐(proper cone)を使う
一般化不等式を使って大小関係を比較する

一般化不等式(generalized inequality)
❏ 次条件を満たす凸錐 Kを真錐と呼ぶ
❏ K 閉集合である
❏ K 空でない内部を持つ
❏ K 直線を含まない
❏ 真錐Kが与えられた元で一般化不等式を以下ように定義する
❏ 上記定義スカラー場合不等式やベクトル場合不等式拡張になっている
ex) Kを非負象限にとってやれ , R上で通常不等式に , R^n上でelement-wiseな不等式になる
❏ スカラー場合と違って任意 2元に対して必ずしも不等式成立しないことに注意

一般化不等式に成り立つ性質

一般化不等式を導入すると多次元場合でも極小, 最小が定義できる
❏ xが集合S 中で最小(minimum)であると , 任意 S 要素yに対して一般化不等式が成り立ち , xが
小さいことを言う. 最小値一意である .
❏ xが集合S 中で極小(minimal)であると , 一般化不等式が成り立つような任意 S 要素yに対して, x
自身を除いて小さいことを言う . 極小値複数存在しうる .
最小極小

凸関数(convex function) 定義
2点を結んだ線分が常にグラフ上側に来ると言い換
えることもできる. また凸関数上側領域
(epigraph) 常に凸集合になる . 凸関数最適性条
件(微分0)が最適解必要十分条件であるという良い
性質を持っている. つまり局所的な情報(微分)から大
域的な情報(最小)を導出できる.

一階微分可能な関数凸性チェック
左図ように任意接線が常に
関数全体より下側に来るような関
数凸関数である. こ条件必
要十分である.

二階微分可能な関数凸性チェック
❏ 二階微分可能だと凸性チェックがとても簡単
❏ 十分条件ぽく書いたが , 実際必要十分条件である
❏ 例) 二次関数fが凸であるため必要十分条件 , 二次項係数行列が半正定値である . すなわち,
という関数fを考えた時, Pが半正定値であれ凸である .

準凸関数(quasiconvex function)
❏ 凸関数定義を緩めたクラスとして準凸関数が存在する
❏ 扱える関数が凸関数より広いで , より広範な最適化問題に適用可能 (凸最適化より効率悪い )

準凸関数概形
❏ 上記関数どような αを持って来ても, sublevel setが区間になるで準凸関数である

準凸関数で凸っぽくない形関数も扱える
❏ 準凸概念凹関数や不連続関数にも適応可能
❏ 平坦な部分を含んだ凸っぽい関数 (前出)や, 単調関数 sublevel setが区間になるで準凸関数
である
❏ 凸っぽくないが準凸である関数例

準凸関数厳密な必要十分条件
❏ 単調関数であるか, ある一点で単調増加と単調減少が切り替わっているような形状をしていることが準凸
関数必要十分条件である
❏ でやっり凸性や連続性など性質満たす必要がない
❏ 関数微分可能性を仮定すると , 凸関数時ように微分をみて準凸関数チェックができる
(今回割愛)

凸最適化問題で解きたいも (再掲)
❏ 凸最適化といえこ形を思い出せよい
❏ 凸最適化かなり研究が進んでおり , 効率的な解き方が存在する . で式変形をして凸最適化問題形
に落とし込め効率的に解ける (今回解き方までやらない )(やれない)

凸最適化問題定式化
❏ 凸最適化と ,
❏ 凸関数によって指定される凸な領域 (実行可能集合)上で
❏ 凸関数f(x) 値を最小化(最大化)するxを見つける問題
❏ 関数f(x) 最大化問題 , f(x) 符号反転を考えれ良いで , 今後最適化といえ最小化を意味する
ことと約束する
❏ 目的関数が最小をとる時 xを変えない(もちろん実行可能集合も変えない )ような変換自由に施して良
い(どちらを解いても元問題を解いたことになる )

凸最適化問題幾何的解釈
❏ 実行可能集合をXとした時, そ上に目的関数
f_0が定義されている(左図全域でf_0が定義さ
れてる)
❏ X 中に最小値が存在すれ , すなわち微分0
点が存在すれそれが最適解
❏ こ時全て制約が有効でない (not
active)という
❏ 最適解が実行可能集合中にない時 , 解必ず
境界上にある. こ時目的関数勾配ベクトルと
実行可能集合支持超平面 (supporting
hyperplace)が直交する

最適解が境界に存在することざっくり証明
❏ 最適解が境界上に存在すること背理法で示せ
る
❏ 最適解xが内部にあると仮定すると , 目的関数が
可微分時勾配が取れるが , 勾配降下した方に
より小さい目的関数を与える点が存在するため ,
xが最適解である仮定に矛盾する

凸最適化問題解十分条件
❏ 凸最適化問題最適解必要十分条件が存在する (4.21)
❏ 幾何的に最適解xにおいて勾配ベクトルと内積が最小になることが必要十分条件

等価な最適化問題
❏ 最適化問題解を変えないように , 最適化式あるい最適化変数に変換を施した問題を , 等価な最適化
問題という
❏ 等価な最適化問題に次ようなもがある
❏ 最適化変数全単射な入れ替え
❏ 目的関数を単調増加関数と合成＋制約領域を変えないように式を変換 (目的と制約変換)
❏ スラック変数を導入(不等式から等式へ変換 )
❏ 等式制約削除
❏ etc.

目的関数と制約式変換
❏ 最終的に求めたいこと , 最適化変数がどこにあれ目的関数が最小になるかなで , 目的関数値そ
もに興味がない
❏ 制約式範囲変えていけない . 消したり増やした範囲に最適解があると解が変わってしまう
単調増加関数と合成できる (目的関数勾配が急 orなだらかになるだけ )
制約式を変えないような関数となら合成しても良い
(意味があるか知らない )

目的関数変換例: ノルム最小化
❏ 元々問題ユークリッドノルム最小化だが , 目的関数変換後ノルム二乗を最小化する問題になっ
ている
❏ ノルム正値しかとらないで二乗関数単調
❏ 変換後目的関数簡単に解ける形になっていてうれしい

スラック変数導入
❏ SVM 導出でも出てくる有名なやつ
❏ 制約式が増える代わりに , 不等式条件を等式条件に変換することができる
❏ 本質的に何も変わっていないだが都合いい場合がある

準凸最適化問題定式化
❏ 準凸最適化問題凸最適化問題目的関数を準凸関数で置き換えたも
❏ 制約式条件凸最適化と同じ . すなわち
❏ 不等式条件関数f_i 凸関数
❏ 等式制約線形
❏ 準凸に平坦な領域がありうるで , 凸最適化と最適性条件が変わる

準凸最適化問題解十分条件
❏ 凸最適化問題十分条件と似ているが以下 2点で異なる
❏ 凸最適化問題十分条件必要条件でもあったが , こちら十分条件だけ
❏ 不等号がイコール場合に成立しない
❏ 特に勾配が0である場合に十分条件にならない . これ平坦領域がありうることに由来

線形計画(Linear Program)
❏ 線形計画目的関数および制約式が全て線形な凸最適化問題
❏ 不等式条件超平面で囲まれた多面体を形成
❏ 等式条件解存在する部分空間を指定
❏ 以上制約元で線形な関数最小化を行う

線形計画幾何学的解釈
❏ 等式条件を満たす多面体 P 中でもっとも目的関数
が大きくなる点を探す
❏ 目的関数線形なで , 空間中で等高線が超平面
を描く. 超平面法線ベクトル -cで形成される
❏ 線形計画解幾何的に超平面と接する点で最
小値を与えるもを探す問題である

二次最適化問題(Quadratic Optimization Problem)
❏ 二次最適化問題目的関数が最適化変数に関する二次式 , 制約条件が全て線形凸最適化問題
❏ 制約式が線形計画と同じなで , 等式条件を満たすアフィン部分空間上多面体中で最適な点を探す
問題

二次最適化問題幾何学的解釈
❏ 実行可能集合線形計画と同様 . 目的関数が二次なで等
高線楕円を形成
❏ 幾何学的に目的関数等高線に接する最小値を与える点
を求める問題
❏ 最小二乗法二次最適化一種 (機械学習でよく見る制約条
件線形でなくノルムボール . なで実行可能集合が多面
体でなく球だったり超立方体だったりする )

単項式と多項式
❏ (4.41) 形を単項式(monomial), (4.42) 形を多項式(posynomial)という. 単項式を足し合わせると多
項式になる.
❏ 単項式や多項式を用いた凸最適化問題を扱いたい (気持ち)

幾何計画(Geometric Program)
❏ 幾何計画目的関数と不等式条件が多項式 , 等式条件が単項式であるような凸最適化問題
❏ 一見して凸性が自明でないが変形すると凸最適化問題に変換できる

Convex optimization

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Convex optimization

Similar to Convex optimization (20)

More from Simossyi Funabashi

More from Simossyi Funabashi (10)

Convex optimization