Cicling2005

Name Discrimination by Clustering Similar Contexts Ted Pedersen & Anagha Kulkarni University of Minnesota, Duluth Amruta Purandare Now at University of Pittsburgh Research Supported by National Science Foundation Faculty Early Career Development Award (#0092784)

Name Discrimination ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Our goals? ,[object Object],[object Object],[object Object]

Measuring Similarity of Words and Contexts w/Large Corpora? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Word sense discrimination ,[object Object],[object Object],[object Object],[object Object]

Methodology ,[object Object],[object Object],[object Object],[object Object],[object Object]

Feature Selection ,[object Object],[object Object],[object Object]

Lexical features ,[object Object],[object Object],[object Object]

Context representation ,[object Object],[object Object],[object Object]

Context Representation ,[object Object],[object Object],[object Object],[object Object]

2 nd Order Context Vectors ,[object Object],0 6272.85 2.9133 62.6084 20.032 1176.84 51.021 O2 context 0 18818.55 0 0 0 205.5469 134.5102 Store 0 0 0 136.0441 29.576 0 0 Shore 0 0 8.7399 51.7812 30.520 3324.98 18.5533 Sea Artillery Sales Bombs Sandy North- West Water Sells

2 nd Order Context Vectors Context sea shore store

Measuring Similarities ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Limitations of 1 st or 2 nd order 0 52.27 0 0.92 0 4.21 0 28.72 0 3.24 0 1.28 0 2.53 Weapon Missile Shoot Fire Destroy Murder Kill 17.77 0 14.6 46.2 22.1 0 34.2 19.23 2.36 0 72.7 0 1.28 2.56 Execute Command Bomb Pipe Fire CD Burn

Latent Semantic Analysis ,[object Object],[object Object],[object Object],[object Object]

After context representation… ,[object Object],[object Object],[object Object],[object Object]

Clustering ,[object Object],[object Object],[object Object],[object Object]

Evaluation (before mapping) c1 c2 c4 c3 2 1 15 2 C4 6 1 1 2 C3 1 7 1 1 C2 2 3 0 10 C1

Evaluation (after mapping) Accuracy=38/55=0.69 20 15 2 1 2 C4 17 1 1 0 55 11 12 15 10 6 1 2 C3 10 1 7 1 C2 15 2 3 10 C1

Majority Sense Classifier Maj. =17/55=0.31

Data ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Experimental comparison of 1 st and 2 nd order representations: ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Schütze (2 nd Order Contexts) Pedersen & Bruce (1 st Order Contexts)

Experimental Conclusions 2 nd order, RB Smaller Data (like SENSEVAL-2) 1 st order, UPGMA Large, Homogeneous (like Line, Hard, Serve) Recommendation Nature of Data

Software ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Making Free Software Mostly Perl, All CopyLeft ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Cicling2005

Recommended

Recommended

More Related Content

What's hot

What's hot (16)

Viewers also liked

Viewers also liked (8)

Similar to Cicling2005

Similar to Cicling2005 (20)

More from University of Minnesota, Duluth

More from University of Minnesota, Duluth (19)

Recently uploaded

Recently uploaded (20)

Cicling2005