2 Receiver Operating Characteristic (ROC)

Introduction to Machine
Learning
(ROC)
Dmytro Fishman (dmytro@ut.ee)

Receiver Operating
Characteristic

(1, 0, 1, 0 ,1)
True labels
(0.6,0.2,0.7,0.5,0.4)
Classiﬁer predicts

(1, 1, 0, 1, 0)
True labels
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
(0.7,0.6,0.5,0.4,0.2)
There are as many marks
on y-axis as there are 1’s
in our true labels

(1, 1, 0, 1, 0)
True labels
There are as many marks
on x-axis as there are 0’s
in our true labels
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
Go through true labels
one by one, if 1 go up, if
0 go right
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
(0.7,0.6,0.5,0.4,0.2)
0 go right

(1, 1, 0, 1, 0)
True labels
1
(0.7,0.6,0.5,0.4,0.2)
0 go right

(1, 1, 0, 1, 0)
True labels
(0.7,0.6,0.5,0.4,0.2)
1
0 go right

(1, 1, 0, 1, 0)
True labels
1
1
(0.7,0.6,0.5,0.4,0.2)
0 go right

(1, 1, 0, 1, 0)
True labels
1
1
0
(0.7,0.6,0.5,0.4,0.2)
0 go right

(1, 1, 0, 1, 0)
True labels
1
1
0 1
(0.7,0.6,0.5,0.4,0.2)
0 go right

(1, 1, 0, 1, 0)
True labels
1
1
0 1
0
(0.7,0.6,0.5,0.4,0.2)
0 go right

(1, 1, 0, 1, 0)
True labels
1
1
0 1
0
This is called Receiver
Operating Characteristic
(ROC)
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
1
1
0 1
0
This is square has sides
of length 1 and 1
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
1
1
0 1
0
We need to ﬁnd a square
of the area under the
(ROC) curve
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
1
1
0 1
0
We need to ﬁnd a square
of the area under the
(ROC) curveAUC = 0.83
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
1
1
0 1
0
Here is another way to do it
(not always you can count
labels yourself)AUC = 0.83
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labelsTPR
FPR
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labelsTPR
FPR
TPR = TP/P
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labelsTPR
FPR
FPR = FP/N
TPR = TP/P
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labelsTPR
FPR
FPR = FP/(FP + TN)
TPR = TP/P
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
(0.7,0.6,0.5,0.4,0.2)
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
We would like to evaluate different strictness
levels of our classiﬁer
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
What if consider as positive (1) only instances
that were predicted positive with >= 0.7
probability?
(0.7,0.6,0.5,0.4,0.2)

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
probability?
(0.7,0.6,0.5,0.4,0.2)
What would TPR and
FPR be in this case?

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
probability?
(0.7,0.6,0.5,0.4,0.2)
What would TPR and
>= 0.7 TPR = ?
FPR = ?

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
probability?
(0.7,0.6,0.5,0.4,0.2)
What would TPR and
>= 0.7 TPR = 1/3
FPR = 0/(0 + 2)

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
Let’s plot this point on a graph
1/3
0

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
We shall do this procedure for all possible thresholds
1/3
0

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
1/3
0
>= 0.6 TPR = ? FPR = ?
How about TPR and FPR?

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
1/3
0
>= 0.6 TPR = 2/3 FPR = 0

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
1/3
0
>= 0.6 TPR = 2/3 FPR = 0
>= 0.5 TPR = ? FPR = ?

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
1/3
0
>= 0.6 TPR = 2/3 FPR = 0
>= 0.5 TPR = ? FPR = ?
Oops, this is a false positive!

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
1/3
0
>= 0.6 TPR = 2/3 FPR = 0
>= 0.5 TPR = 2/3 FPR =1/2

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
>= 0.7 TPR = 1/3 FPR = 0
1/3
0
>= 0.6 TPR = 2/3 FPR = 0
>= 0.5 TPR = 2/3 FPR =1/2
And so on…

(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
1/3
0
>= 0.4 TPR = 3/3 FPR =1/2
>= 0.2 TPR = 3/3 FPR =2/2
>= 0.7 TPR = 1/3 FPR = 0
>= 0.6 TPR = 2/3 FPR = 0
>= 0.5 TPR = 2/3 FPR =1/2

AUC = 0.83
(1, 1, 0, 1, 0)
True labels
TPR = TP/P
FPR = FP/(FP + TN)
TPR
FPR
(0.7,0.6,0.5,0.4,0.2)
1/3
0
>= 0.4 TPR = 3/3 FPR =1/2
>= 0.2 TPR = 3/3 FPR =2/2
>= 0.7 TPR = 1/3 FPR = 0
>= 0.6 TPR = 2/3 FPR = 0
>= 0.5 TPR = 2/3 FPR =1/2
AUC is considered to be more
adequate performance
measure than accuracy

(1, 1, 0, 1, 0)
True labelsTPR
FPR
(0.7,0.6,0.5,0.4,0.2)
0
AUC = 0.5
AUC of 0.5 means random
guess

(1, 1, 0, 1, 0)
True labelsTPR
FPR
(0.7,0.6,0.5,0.4,0.2)
0
AUC = 1
guess
AUC of 1 means perfect
classiﬁcation

(1, 1, 0, 1, 0)
True labelsTPR
FPR
(0.7,0.6,0.5,0.4,0.2)
0
AUC = 1
guess
AUC of 1 means perfect
classiﬁcation overﬁtting
🙄

References
• Machine Learning by Andrew Ng (https://www.coursera.org/learn/machine-
learning)
• Introduction to Machine Learning by Pascal Vincent given at Deep Learning
Summer School, Montreal 2015 (http://videolectures.net/
deeplearning2015_vincent_machine_learning/)
• Welcome to Machine Learning by Konstantin Tretyakov delivered at AACIMP
Summer School 2015 (http://kt.era.ee/lectures/aacimp2015/1-intro.pdf)
• Stanford CS class: Convolutional Neural Networks for Visual Recognition by
Andrej Karpathy (http://cs231n.github.io/)
• Data Mining Course by Jaak Vilo at University of Tartu (https://courses.cs.ut.ee/
MTAT.03.183/2017_spring/uploads/Main/DM_05_Clustering.pdf)
• Machine Learning Essential Conepts by Ilya Kuzovkin (https://
www.slideshare.net/iljakuzovkin)
• From the brain to deep learning and back by Raul Vicente Zafra and Ilya
Kuzovkin (http://www.uttv.ee/naita?id=23585&keel=eng)

www.biit.cs.ut.ee www.ut.ee www.quretec.ee

2 Receiver Operating Characteristic (ROC)

Recommended

Recommended

More Related Content

More from Dmytro Fishman

More from Dmytro Fishman (12)

Recently uploaded

Recently uploaded (20)

2 Receiver Operating Characteristic (ROC)