Concurrency Control for Parallel Machine Learning

Concurrency Control for
Parallel Machine Learning
Dimitris Papailiopoulos
Xinghao Pan, Joseph Gonzalez, Stefanie Jegelka, Tamara Broderick, Dimitris Papailiopoulos, Joseph
Bradley, Michael I. Jordan

Model
State
Data
Serial Inference

Model
State
Parallel Inference
Processor 1
Processor 2
Data

Model
State
Data
Parallel Inference
Processor 1
Processor 2
Concurrency:
more machines = less time
Correctness:
serial equivalence
?

Model
State
Data
Coordination Free Parallel
Inference
Processor 1
Processor 2
?
Ignore collisions
Concurrency:
(almost) free
+
Speedup = #CPU
Correctness?
Not always...

Correctness
Concurrency
Coordination-free
Serial
High
Low High
Low

Correctness
Concurrency
Coordination-free
Serial
High
Low High
Low
Concurrency
Control
Database mechanisms
o Guarantee correctness
o Maximize concurrency
 Mutual exclusion
 Optimistic CC

Model
State
Data
Mutual Exclusion Through
Locking
Processor 1
Processor 2
Introduce locking (scheduling) protocols to prevent
conflicts.

Mutual Exclusion Through
Model
State
Data
Processor 1
Processor 2
Locking
✗
Enforce local serialization to avoid conflicts.

Optimistic Concurrency Control
Model
State
Data
Processor 1
Processor 2
Allow computation to proceed without blocking.
Kung & Robinson. On optimistic methods for concurrency
control.

Model
State
Data
Invalid Outcome
✗ ✗
Processor 1
Processor 2
Validate potential conflicts.
control.

Model
State
Data
✗ ✗
Processor 1
Processor 2
Rollback and Redo
Take a compensating action.
control.

Concurrency Control
14
Coordination Free:
Provably fast and correct under key assumptions.
Concurrency Control:
Provably correct and fast under key assumptions.
Systems Ideas to
Improve Efficiency

Machine Learning + Concurrency
Clusteri
ng
Online
Facility
Location
Control
(Xinghao Pan et al.)
Submodular
Maximization
Subset selection, diminishing
marginal gains
Max Graph
Cut
Set
Cover
Sensor Placement
Social Network
Influence
Propagation
Document
Summarization
Sports
Football
Word Series
Giants
Cardinals
Politics
Midterm
Obama
Democrat
Tea
Finance
QE
market
interest
Dow
Topic Modelling
Correlation
Clustering
Deduplication
Community
Detection

Machine Learning + Concurrency
Clusteri
ng
Online
Facility
Location
Control
(Xinghao Pan et al.)
Submodular
Maximization
Subset selection, diminishing
marginal gains
Max Graph
Cut
Set
Cover
Sensor Placement
Social Network
Influence
Propagation
Document
Summarization
Sports
Football
Word Series
Giants
Cardinals
Politics
Midterm
Obama
Democrat
Tea
Finance
QE
market
interest
Dow
Topic Modelling
Correlation
Clustering
Deduplication
Community
Detection
Serial ML
algorithm
Sequence of
transactions
Identify potential
conflicts
Apply Concurrency
Control
mechanisms
Parallel ML
algorithm

Application: Deduplication
Computer Science
Division – University of
California Berkeley CA
University of California at Berkeley
Department of
Physics Stanford
University California
Lawrence Berkeley National
Labs <ref>California</ref>

Serial Correlation Clustering
Nir Ailon, Moses Charikar, and Alantha Newman.
Aggregating inconsistent information: ranking and clustering.
Journal of the ACM (JACM), 55(5):23, 2008.
Serially process vertices

Serial Correlation Clustering
Nir Ailon, Moses Charikar, and Alantha Newman.
Aggregating inconsistent information: ranking and clustering.
Journal of the ACM (JACM), 55(5):23, 2008.
Serially process vertices
Approximation 3 OPT (in expectation)

Parallel Correlation Clustering

Concurrency Control Correlation Clustering
(C4) Parallel Correlation Clustering
Cannot Resolve introduce
by
Mutual adjacent Exclusion
cluster
centers

Concurrency Control Correlation Clustering
(C4)
Common Resolve neighbor by
must be
assigned Optimistic to Concurrency
earliest center
Control
?
Optimistic Assumption
No other new cluster created
Resolution
Assign common neighbor to earliest cluster

Properties of C4
(Concurrency Control Correlation Clustering)
Theorem: C4 is correct.
C4 preserves same guarantees as serial algorithm (3
OPT).
Concurren Correctness
Theorem: C4 has provably small overheads.
cy
= almost linear speedup
Expected #blocked transactions < 2τ |E| / |V|.
τ ≡ diff in parallel cpu’s progress

Empirical Validation on Billion Edge
Graphs
Amazon EC2 r3.8xlarge instances
Multicore up to 16 threads
Real and synthetic graphs
100 runs (10 random orderings x 10 runs)
Graph Vertices Edges
IT-2004 Italian web-graph 41 Million 1.14 Billion
Webbase-2001 WebBase crawl 118 Million 1.02 Billion
Erdos-Renyi Synthetic random 100 Million ≈ 1.0 Billion

C4: Cost of Coordination
< 0.02% blocked

C4: Speed-up
Ideal
10x
speedu
p

Conclusion
Concurrency Control
for Parallel ML
o Guarantee
correctness
o Maximize
concurrency
Code release in the works!
https://amplab.cs.berkeley.edu/projects/cc
ml/
xinghao@berkeley.edu
Applications
Correlation Clustering
Submodular Maximization
Clustering
Online Facility Location
Feature Modeling

Concurrency Control for Parallel Machine Learning

Recommended

Recommended

More Related Content

Similar to Concurrency Control for Parallel Machine Learning

Similar to Concurrency Control for Parallel Machine Learning (20)

More from jeykottalam

More from jeykottalam (8)

Recently uploaded

Recently uploaded (20)

Concurrency Control for Parallel Machine Learning