www1.cs.columbia.edu

Machine Learning Reading: Chapter 18

Machine Learning and AI ,[object Object],[object Object],[object Object]

Different kinds of Learning ,[object Object],[object Object],[object Object],[object Object],[object Object]

Inductive Learning ,[object Object],[object Object],[object Object]

How do systems learn? ,[object Object],[object Object],[object Object]

Three Types of Learning ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Applications ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Language Tasks ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

IR Task ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Medical ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

General Approach ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Issues ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Classification Learning ,[object Object],[object Object],[object Object],[object Object]

Learning Decision Trees ,[object Object],[object Object],[object Object]

Example ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Data Verginica 1.7 2.6 3 2 3 Versicolour 2.1 5.6 4.2 6 9 Verginica 2.2 2.8 3.7 1 8 Setosa 1.2 1.6 4.3 6.3 7 Setosa 1.4 1.2 4.1 7.7 6 Versicolour 2.4 6.8 3.6 5.5 5 Verginica 1.1 2.5 3.4 3 4 Setosa 2.2 2.4 3.9 7 2 Versicolour 2.3 6.3 3 6.8 1 Class P-width P-length S-width S-length

Data Verginica 2.6 3 2 3 Versicolour 5.6 4.2 6 9 Verginica 2.8 3.7 1 8 Setosa 1.6 4.3 6.3 7 Setosa 1.2 4.1 7.7 6 Versicolour 6.8 3.6 5.5 5 Verginica 2.5 3.4 3 4 Setosa 2.4 3.9 7 2 Versicolour 6.3 3 6.8 1 Class P-length S-width S-length

Constructing the Decision Tree ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Construct example decision tree

Tree and Rules Learned S-length <5.5  5.5 3,4,8 P-length  5.6 ≤ 2.4 1,5,9 2,6,7 If S-length < 5.5., then Verginica If S-length  5.5 and P-length  5.6, then Versicolour If S-length  5.5 and P-length ≤ 2.4, then Setosa

Comparison of Target and Learned If S-length < 5.5., then Verginica If S-length  5.5 and P-length  5.6, then Versicolour If S-length  5.5 and P-length ≤ 2.4, then Setosa ,[object Object],[object Object],[object Object]

Text Classification ,[object Object],Positive Negative

20 attributes ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Example finance 20 6 5 7 other 28 15 0 10 finance 25 11 0 9 other 35 2 0 8 finance 25 4 9 6 finance 20 2 8 5 other 14 7 5 4 other 25 7 7 3 finance 35 8 6 2 other 40 3 0 1 class the rolling stock

Choosing the Best Attribute: Binary Classification ,[object Object],[object Object],[object Object],n i=1

Information based on attributes = Remainder (A) P=n=10, so H(1/2,1/2)= 1 bit

Information Gain ,[object Object],[object Object]

stock rolling <5 5-10  10  10 5-10 <5 1,8,9,10 2 , 3,4,5,6,7 1 , 5,6,8 2,3,4,7 9,10 Gain(stock)=1-[4/10H(1/10,3/10)+6/10H(4/10,2/10)]= 1-[.4((-.1* -3.32)-(.3*-1.74))+.6((-.4*-1.32)-(.2*-2.32))]= 1-[.303+.5952]=.105 Gain(rolling)=1-[4/10H(1/2,1/2)+4/10H(1/2,1/2)+2/10H(1/2,1/2)]=0

Other cases ,[object Object],[object Object]

Training vs. Testing ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Division into 3 sets ,[object Object],[object Object],[object Object],[object Object],[object Object]

Overfitting ,[object Object],[object Object],[object Object],[object Object],[object Object]

K-fold Cross Validation ,[object Object],[object Object],[object Object],[object Object],[object Object]

Ensemble Learning ,[object Object],[object Object],[object Object]

Boosting ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

AdaBoost ,[object Object],[object Object],[object Object],[object Object]

www1.cs.columbia.edu

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (10)

Similar to www1.cs.columbia.edu

Similar to www1.cs.columbia.edu (20)

More from butest

More from butest (20)

www1.cs.columbia.edu