Learning to Search Henry Kautz

Learning to Search Henry Kautz University of Washington joint work with Dimitri Achlioptas, Carla Gomes, Eric Horvitz, Don Patterson, Yongshao Ruan, Bart Selman CORE – MSR, Cornell, UW

Speedup Learning ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

It failed. ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

It succeeded. ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Everyone got busy. ,[object Object],[object Object],[object Object],[object Object]

Another path ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Big Picture Problem Instances Solver static features runtime Learning / Analysis Predictive Model dynamic features resource allocation / reformulation control / policy

Case Study 1: Beyond 4.25 Problem Instances Solver static features runtime Learning / Analysis Predictive Model

Phase transitions & problem hardness ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Quasigroup Completion Problem (QCP) ,[object Object],[object Object],[object Object]

Phase Transition Almost all unsolvable area Fraction of pre-assignment Fraction of unsolvable cases Almost all solvable area Phase transition Underconstrained area Critically constrained area Overconstrained area Complexity Graph 42% 50% 20% 42% 50% 20%

Easy-Hard-Easy pattern in local search % holes Computational Cost “ Over” constrained area Underconstrained area Walksat Order 30, 33, 36

Are we ready to predict run times? ,[object Object],log scale

Deep structural features Hardness is also controlled by structure of constraints, not just the fraction of holes Rectangular Pattern Aligned Pattern Balanced Pattern Tractable Very hard

Random versus balanced Balanced Random

Random vs. balanced (log scale) Balanced Random

Considering variance in hole pattern

Effect of balance on hardness ,[object Object],[object Object],[object Object],[object Object],[object Object]

Intuitions ,[object Object],[object Object]

Are we done? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Case study 2: AutoWalksat Problem Instances Solver runtime Learning / Analysis Predictive Model dynamic features control / policy

Walksat ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],The Invariant Ratio 0 1 2 3 4 5 6 7 + 10% Mean of the objective function Std Deviation of the objective function

Automatic Noise Setting ,[object Object],[object Object],[object Object],[object Object],[object Object]

Summary: random, circuit test, graph coloring, planning

Other features still lurking ,[object Object],[object Object],[object Object]

Case Study 3: Restart Policies Problem Instances Solver static features runtime Learning / Analysis Predictive Model dynamic features resource allocation / reformulation control / policy

Background ,[object Object],[object Object],[object Object],[object Object]

Cost Distributions ,[object Object],[object Object],[object Object],[object Object],Very short Very long

Randomized Restarts ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Effect of restarts on expected solution time (log scale)

How to determine restart policy ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Backtracking Problem Solvers ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Formulation of Learning Problem ,[object Object],[object Object],[object Object],[object Object],Long Short Observation horizon Median run time 1000 choice points Observation horizon

Formulation of Learning Problem ,[object Object],[object Object],[object Object],[object Object],Observation horizon + Time expended Long Short Observation horizon Median run time 1000 choice points t 1 t 2 t 3

Formulation of Dynamic Features ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Dynamic Features

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Different formulations of task

Sample Results: CSP-QWH-Single ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Learned Decision Tree ,[object Object],[object Object],[object Object],[object Object],[object Object]

Restart Policies ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ongoing work ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Conclusions ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Learning to Search Henry Kautz

Recommended

Recommended

More Related Content

Similar to Learning to Search Henry Kautz

Similar to Learning to Search Henry Kautz (20)

More from butest

More from butest (20)

Learning to Search Henry Kautz

Editor's Notes