Text categorization

By: Sy-Quan Nguyen Minh-Hoang Nguyen Phi-Dung Tran Instructor : Prof. Quang-Thuy Ha Tuan-Quang Nguyen A Comparation study on SVM,TSVM and SVM-kNN in Text Categorization

Table of content ,[object Object],[object Object],[object Object],[object Object],[object Object]

Document Classification: Motivation ,[object Object],[object Object],[object Object],[object Object],[object Object]

Text Categorization ,[object Object],[object Object],[object Object],11/01/11 Categorization System … Sports Business Education Science … Sports Business Education

Document Classification: Problem Definition ,[object Object],[object Object],[object Object],[object Object],[object Object]

Flavors of Classification ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Classification Methods ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Steps in Document Classification ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

SVM — History and Applications ,[object Object],[object Object],[object Object],[object Object],[object Object]

SVM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object]

Problem ,[object Object],[object Object]

SVM – Separable Case ,[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object]

[object Object],[object Object]

SVM – Nonlinear ,[object Object]

[object Object],[object Object],[object Object],[object Object]

TSVM - Overview ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

TSVM - Overview ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

TSVM - Overview ,[object Object],[object Object],[object Object],[object Object],After SVM After TSVM

TSVM - Algorithm ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

TSVM - Algorithm ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

TSVM - Algorithm ,[object Object]

TSVM - Algorithm ,[object Object],[object Object],[object Object],[object Object],[object Object]

Problem ,[object Object],[object Object],[object Object]

Semi-Supervised ,[object Object],[object Object],[object Object],[object Object],[object Object]

Semi-Supervised ,[object Object],[object Object],[object Object]

Algorithm SVM ,[object Object],[object Object]

Algorithm KNN ,[object Object],[object Object],[object Object]

Pseudocode KNN ,[object Object],[object Object],[object Object],[object Object],[object Object]

Example ,[object Object],[object Object]

Algorithm SVM-KNN ,[object Object],[object Object],[object Object],[object Object],[object Object]

Pesudocode SVM-KNN [1] ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Initial training set Predict labels all the remaining unlabeled data SVM1 New testing set Choose 2n Vector boudary Boundary vectors get new labels Use KNN Retrain new SVM2 Put them in training set Number training set =m times whole data set

References ,[object Object],[object Object],[object Object],11/01/11 Data Mining: Principles and Algorithms

References ,[object Object],[object Object],[object Object],[object Object],[object Object]

Text categorization

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (10)

Similar to Text categorization

Similar to Text categorization (20)

Recently uploaded

Recently uploaded (20)

Text categorization

Editor's Notes