融合変換による最適化の理論的基盤と正当性 (2006-06-20)

融合変換による最適化の理論的基盤と正当性酒井政裕慶應義塾大学政策・メディア研究科修士課程2年

自己紹介 2001年慶應義塾大学総合政策学部入学 2005年同卒業 2005年慶應義塾大学大学院政策・メディア研究科入学、現在在学中萩野達也研究室所属

自己紹介: 活動 Haskell Lightweight Language Weekend 2004 Lightweight Language Day and Night 2005 日経ソフトウェア6月号「Haskellによる関数プログラミング入門」 Ruby-GNOME2

研究的興味関数型言語の最適化プログラム変換、特に融合変換の理論的基盤とアルゴリズム

研究の背景ソフトウェアの不具合が社会問題化するケースが増加様々な要因ソフトウェアが必要とされる領域の広がりソフトウェアの高機能化・多機能化にともなう複雑化

研究の背景 (2) ソフトウェアの信頼性が重要に様々なレベルの方法が必要工学的な品質管理, etc 分かり易い自明なコードが重要性能のよいコードは複雑で分かり難い信頼性と効率の両立は難しい

研究の目的高度な最適化技術の実現強力な最適化信頼性を損なわない信頼性と効率の両立

位置づけ基礎応用信頼性の高いソフトウェア高性能なソフトウェアソフトウェア検証プログラム変換数理論理学プログラム意味論コンピュータサイエンス

位置づけ基礎応用領域理論型理論各種意味論ロジック圏論離散数学融合変換等形式的証明モデル検査テスト等信頼性の高いソフトウェア高性能なソフトウェアソフトウェア検証プログラム変換数理論理学プログラム意味論コンピュータサイエンス

プログラム変換と融合変換

最適化概念を素直に書いた単純なプログラム分かりやすいモジュラリティーが高く、扱いやすいしかし、性能が悪いことがしばしば最適化が必要コンパイラによる最適化ハンドチューニング

ハンドチューニングの問題その過程でバグが混入する可能性結果のプログラムは複雑で保守が困難モジュラリティーが低く再利用が困難信頼性を損なう最適化のための別アプローチが必要 !

プログラム変換数学的(代数的)な性質を用いる最適化例) a×3 + a×2 = { 分配則 } a×(3+2) = { calculation } a×5 同じ意味で性能のよいプログラムへ変換中にはオーダが変わるような場合も

融合変換プログラム変換の一種複数のパスからなるプログラムわかりやすいが中間データが存在し、効率が悪いこれを単一のパスに変換

融合変換の例 add(vector A, vector B) { vector tmp; for (int i = 0; i < A.dim; i++) { tmp[i] = A[i] + B[i]; } return tmp; } add(add(A,B), C); 二回ループを回す必要

融合変換の例 add3(vector A, vector B, vector C) { vector tmp; for (int i = 0; i < A.dim; i++) { tmp[i] = A[i] + B[i] + C[i]; } return tmp; } add3(A,B,C); 一回のループですむ効率向上

融合変換 (2) 主に関数型言語で用いられる中間データ構造を生成しないことによる、空間効率の向上これまで離れていたコードが接することにより、更なる最適化が適用可能に時間効率も向上

関数型言語数学的な関数に基づいた言語 (原則的に)副作用がない等しい式は自由に置き換えが可能数学的な取り扱いが容易例: Haskell, ML, Lisp

なぜ関数型言語か? 数学的に厳密な議論をしたい現状の一般的な命令型言語では難しい代数的性質が簡単に利用できる命令型言語では特別な解析が必要 ⇒ そこで、とりあえず関数型言語に特化

関数型言語の代数的性質(例) map 関数 map f [a, b, …] = [f a, f b, …] concat 関数 concat [[a,b], [c], [d,e], ..] = [a,b,c,d,e,…] map f . map g = map (f . g) (map f) . concat = concat . (map (map f))

融合変換の理論圏論圏論によるデータ型と帰納的定義一意性による等式の導出融合変換の難しさ

圏論対象と射 ( 矢印 ) による抽象化プログラムを扱うのに便利な概念を提供等式を図式で表現連続関数位相空間準同型群関数集合プログラム型射対象

Catamorphism X, f, g に対して以下を満たす h が一意に存在。 fold(f,g) で表す h . 0 = f h . s = g . h 帰納的定義を表現 h(0) = f h(s(n)) = g(h(n)) catamorphism と呼ばれる

Catamorphism の例 2 倍する関数 double : N -> N double(0) = 0 double(s(n)) = s(s(double(n)) fold で表現 double = fold(0, s.s)

double . double の融合 double は以下を満たす double . 0 = 0 double . s.s = s.s.s.s . double よって double.double . 0 = 0 double.double . s = s.s.s.s.double.double

double . double の融合 double.double . 0 = 0 double.double . s = s.s.s.s.double.double fold(0,s.s.s.s) も同じ等式を満たす一意性より double . double = fold(0,s.s.s.s)

double . double の融合 double.double . 0 = 0 double.double . s = s.s.s.s.double.double fold(0,s.s.s.s) も同じ等式を満たす一意性より double . double = fold(0,s.s.s.s) 融合できた !!

融合変換の規則一般に h:X->Y が h . g = g’ . h h . f = f’ を満たすならば h . fold(f,g) = fold(f’,g’)

データ型の一般化以上の話は帰納的(inductive)なデータ型一般に対して、一般化出来るリスト, 木, etc.

融合の難しさ h . fold(f,g) = fold(f’,g’) 関数は fold(f,g) の形をしていないかも f’, g’ をどう発見するか ? 対策 Shortcut 融合変換関数を融合しやすい形で定義しておく Warm Fusion 一般の再帰的定義から fold/build を導出

融合変換の実装例(1) Haskellの処理系GHC 標準関数は short-cut 融合変換可能な形で定義されている short-cut 融合変換の書き換え規則をプラグマとして定義 10クイーンで43%, 大規模ベンチマークで平均3%の実行時間改善

融合変換の実装例(2) 尾上能之『融合変換による関数プログラムの最適化』　 [Onoue’99] 再帰的定義から Hylomorphism という形式を導出し、 Hylo-Cata fusion という規則によって融合を行う GHC に実装

尾上らの手法の問題 Hylo-Cata のみを扱いその双対の Hylo-Ana を扱っていない Hylomorphism と酸性雨定理を組み合わせることの正当性の問題

正当性の問題 Hylomorphism と Free Theorems を使用 Hylomorphism には Inductive なデータ型と Coinductive なデータ型の一致が必要 μX. F(X) = νX. F(X) …(A) Free Theorems はパラメトリシティに依存 (A) とパラメトリシティは厳密には矛盾 !!

Hylomorphism Coinduction (Anamorphism) より unfold(φ): A -> νX. F(X) Induction (Catamorphism) より fold(ψ) : μX. F(X) -> B νX. F(X) = μX. F(X) のとき、これらを結合して A -> B が得られるこれが Hylomorphism

パラメトリシティ型を関係として解釈して性質を証明具体的な型は「等しい」という関係で解釈型変数は任意の関係で解釈

パラメトリシティ(2) 例 ) length : ∀A. List(A) -> N ∀ A,A’,R⊆AxA’. (xs,ys)∈List(R) ⇒ length xs = length ys xRy iff y = f(x) とおくと、 ∀ A,A’,f: A->A’. ys = List(f)(xs) ⇒ length xs = length ys length xs = length (map f xs)

なぜ矛盾するかラムダ計算に基づく体系では以下が同値 Inductive なデータ型と Coinductive なデータ型が一致すべての型 A に不動点コンビネータ fixA: (A -> A) -> A が存在

なぜ矛盾するか (2) ラムダ計算 = Cartesian Closed Category パラメトリシティの元では、直和 A+B を ∀C. (A->C) -> (B->C) -> C で表現可能 Cartesian Closed Category では直和と不動点コンビネータは矛盾正確には退化したモデルしか存在しない

何が困るのか正当性は微妙なのは気持ち悪い本来成り立っていない等式に基づいた最適化が行われてしまう可能性アドホックに正当性を保障することは可能だが、一般的な保障が欲しい

アプローチ形式的な意味論を用いた正当化今考えているアイディア Moral equality [Danielsson’06] の利用? 途中の過程では弱い等号を用いる

目的正当性を理論的に保障融合変換をより安全に広い範囲で使用可能に安全で強力な最適化技術の実現信頼性と性能の両立を

目的(2) また、その過程で、融合変換についてのよりよい理解が得られるのではないか? それによって、より高度な融合変換を

まとめプログラム変換の一つとしての融合変換融合変換の簡単な例と理論私のアプローチ

融合変換による最適化の理論的基盤と正当性 (2006-06-20)

More Related Content

What's hot

Similar to 融合変換による最適化の理論的基盤と正当性 (2006-06-20)

More from Masahiro Sakai

融合変換による最適化の理論的基盤と正当性 (2006-06-20)