Machine Learning Basics for Improving Information Retrieval Rankings

Learning to Rank (part 1) NESCAI 2008 Tutorial Yisong Yue Cornell University

Goals for this Tutorial ,[object Object],[object Object],[object Object],[object Object]

(Soft) Prerequisites ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Outline (Part 1) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Outline (Part 2) ,[object Object],[object Object],[object Object],[object Object],[object Object]

Disclaimer ,[object Object],[object Object],[object Object],[object Object],[object Object]

Disclaimer ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Brief Overview of IR ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Basic Approach to IR ,[object Object],[object Object],[object Object]

Basic Approach to IR ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Vector Space Model ,[object Object],[object Object],[object Object],[object Object],[object Object]

Other Methods ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Machine Learning ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Training Data ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Feature Space ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Learning Problem ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

How to Train? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Conventional multiclass learning does not incorporate ordinal structure of class labels Not Relevant Somewhat Relevant Very Relevant

Ordinal Regression ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ordinal Regression ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ordinal Regression Approaches ,[object Object],[object Object],[object Object]

Option 1: Multiple Thresholds ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ordinal SVM Example [Chu & Keerthi, 2005]

Ordinal SVM Formulation Such that for j = 0..T : [Chu & Keerthi, 2005] And also:

Learning Multiple Thresholds ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Option 2: Voting Classifiers ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object]

Option 3: Pairwise Preferences ,[object Object],[object Object],[object Object]

Optimizing Pairwise Preferences ,[object Object],[object Object]

Optimizing Pairwise Preferences ,[object Object],[object Object],[object Object],[object Object],[object Object]

Optimizing Pairwise Preferences ,[object Object],[object Object],[object Object],[object Object]

Pairwise SVM Formulation Such that: [Herbrich et al., 1999] Can be reduced to time [Joachims, 2005].

Optimizing Pairwise Preferences ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Rank-Based Measures ,[object Object],[object Object],[object Object],[object Object]

Rank-Based Measures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[email_address] ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Mean Average Precision ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Mean Reciprocal Rank ,[object Object],[object Object],[object Object]

NDCG ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Optimizing Rank-Based Measures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Discontinuity Example ,[object Object],D1 D2 D3 Retrieval Score 0.9 0.6 0.3 Rank 1 2 3 Relevance 0 1 0

Discontinuity Example ,[object Object],[object Object],D1 D2 D3 Retrieval Score 0.9 0.6 0.3 Rank 1 2 3

Discontinuity Example ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],D1 D2 D3 Retrieval Score 0.9 0.6 0.3 Rank 1 2 3

Discontinuity Example ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],NDCG discontinuous w.r.t model parameters! D1 D2 D3 Retrieval Score 0.9 0.6 0.3 Rank 1 2 3

Optimizing Rank-Based Measures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Structural SVMs ,[object Object],[object Object],[object Object],[object Object],[object Object],[Tsochantaridis et al., 2007]

Structural SVMs for MAP ,[object Object],[object Object],[object Object],[object Object],[object Object],[Yue et al., 2007]

Too Many Constraints! ,[object Object],[object Object],[object Object],[object Object]

Structural SVM Training ,[object Object],[object Object],[object Object],[object Object],STEP 1-3 is guaranteed to loop for at most a polynomial number of iterations. [Tsochantaridis et al., 2005]

Illustrative Example ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Finding Most Violated Constraint ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Gradient Descent ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

LambdaRank ,[object Object],[object Object],[object Object],[object Object],[object Object],[Burges et al., 2006]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Burges, 2007]

LambdaRank for NDCG ,[object Object],[object Object]

Properties of LambdaRank ,[object Object],[object Object],[object Object],1 Subject to additional assumptions – see [Burges et al., 2006]

Summary (Part 1) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Machine Learning Basics for Improving Information Retrieval Rankings

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Machine Learning Basics for Improving Information Retrieval Rankings

Similar to Machine Learning Basics for Improving Information Retrieval Rankings (20)

More from butest

More from butest (20)

Machine Learning Basics for Improving Information Retrieval Rankings

Editor's Notes