8/23/2020 3
PLDI論文選択理由
PLDIとは?
Programming Language Design and Implementation
1970年発祥、現在ではACM SIGPLAN(Special Interest Group
on programming languages)で最も重要な国際会議の一つ
PLDI is the premier forum in the field of programming
languages and programming systems research, covering
the areas of design, implementation, theory, applications,
and performance.
本論文選択理由
mathiine
4.
8/23/2020 4
MCMLの全体像 [1/3]
Model Counting Meet Machine Learningのフロー
mathiine
Alloy Analyzer
10% Sampling
Machine Learning
Test
MPCGen
TREE2CNF
Model Counting
Property 𝝓 Bound 𝒃
SAT/UNSAT
Input Binaries
𝑪𝑵𝑭 𝝓
Training Data Test Data
Inference
Model 𝒅
Training Report
Test Report
𝑪𝑵𝑭 𝝓,𝒅
Metric 𝒊𝒅
𝑴𝑪 𝝓,𝒅
𝒊𝒅
推論モデルが決定木の場合のみ実施
(推論モデルの全入力空間での汎化性能評価)
Alloy記述のPropertyを満たす推論モデルの構築と評価
𝑨𝒑𝒑𝒓𝒐𝒙𝑴𝑪
𝑷𝒓𝒐𝒋𝑴𝑪
𝒕𝒑, 𝒇𝒑, 𝒕𝒏, 𝒇𝒏
8/23/2020 7
関連研究 [1/2]
本論文が、全(有界)入力空間を用いた推論モデルの定量評価
の最初の論文
プログラムの性質学習に関する既存手法
Javaプログラムのデータ構造が持つPropertyの機械学習
Facundo Molina, Renzo Degiovanni, Pablo Ponzio, German
Regis, Nazareno Aguirre, and Marcelo Frias, “Training Binary
Classifiers as Data Structure Invariants,” ICSE, 2019.
Muhammad Usman,WenxiWang, KaiyuanWang, Cagdas Yelen,
Nima Dini, and Sarfraz Khurshid, “A Study of Learning Data
Structure Invariants Using Off-the-shelf Tools,” SPIN, 2019.
但し、全(有界)入力空間を用いた推論モデルの定量評価は未実施
mathiine
8.
8/23/2020 8
関連研究 [2/E]
学習可能性解析の既存手法
2値分類モデルの学習で必要となるデータ数の議論
PAC(Probably Approximately Correct) - L. G. Valiant, “A Theory
of the Learnable,” CACM 27, 11 Nov. 1984.
https://doi.org/10.1145/1968.1972
Relational Property学習手法の性能に関する幾ばくかの知見を提供
V. N. Vapnik and A Ya. Chervonenkis, “On the Uniform
Convergence of Relative Frequencies of Events to Their
Probabilities,” Theory of Probability and its Applications, 1971.
0-1損失の平均(精度)より、適合率、再現率、F値は優れた性能指標
与えたGround Truthに対して、MCMLは、適合率、再現率、F値
同様に、正確に0-1損失の平均(精度)の汎可性能を定量評価可能。
mathiine
8/23/2020 18
決定木のCNFへの変換手法 [1/2]
既存変換手法
1. 命題論理の等価性とド・モルガンを用いた変換
P. T. Johnstone, “Conditions related to de Morgan’s
law,” 1979.
CNF式のサイズが爆発し、後段のSAT Solverへの負荷が肥大化すると
いう問題がある。
2. Tseytin変換
G. S. Tseytin, “On the complexity of derivation in
propositional Calculus,” Presented at the Leningrad
Seminar on Mathematical Logic, 1966.
入力論理式に対して線型サイズのCNF式を出力
但し、中間変数を多数導入し(必ずしも等価でない)準充足可能なCNF
式を生成
元の論理式に対するModel Counting値と異なるModel Counting
値が得られる可能性がある、という問題がある。
mathiine