Learning from large unstructured datasets

Data mining from large unstructured data sources Tim Menzies, Roy Nutter, WVU July 15, 2008

Handling diverse data ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Example 1: learning what we don’t know ,[object Object],[object Object],[object Object],[object Object],[object Object],From 9 dimensions to 2 And we’ll do better, later

Example 2: From nonsense to sense ,[object Object],[object Object],[object Object],[object Object],A decision tree predicting for each class

The good news: most collectable data is ignorable ,[object Object]

Real-time application ,[object Object],[object Object],Step two: massive dimensionality reduction Step one: data collection Step three: structure extraction From 100 dimensions to 2

Works, even for unstructured data (part 1 of 2) ,[object Object]

Works, even for unstructured data (part 2 of 2) ,[object Object],[object Object],[object Object],Top 3 terms Top 100 terms From 10,000 dimensions to 3

Conclusion ,[object Object],[object Object]

Learning from large unstructured datasets

Recommended

Recommended

More Related Content

Similar to Learning from large unstructured datasets

Similar to Learning from large unstructured datasets (20)

Recently uploaded

Recently uploaded (20)

Learning from large unstructured datasets