Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
ROC :Receiver operating characteristic
1. Receiver operating characteristic
Un esempio di curva ROC.
Nella teoria delle decisioni, le curve ROC (Receiver
Operating Characteristic o anche note come Relative
Operating Characteristic[1]) sono degli schemi grafici
per un classificatore binario. Lungo i due assi si possono
rappresentare la sensibilità e (1-specificità), come True
Positive Rate (vero positivo) e False Positive Rate (falso
positivo). In altre parole, si studiano i rapporti fra allarmi
veri (hit rate) e falsi allarmi.
Le curve ROC furono utilizzate per la prima volta
da alcuni ingegneri elettrici durante la seconda guerra
mondiale, che volevano scovare i nemici utilizzando il
radar durante le battaglie. Recentemente invece le curve
ROC sono utilizzate anche in medicina,[2][3] radiologia,[4]
psicologia, veterinaria[5] e altri ambiti, come il machine
learning e data mining.
1 Concetto basilare
Se si considera un problema di predizione a 2 classi
(classificatore binario come da figura: distribuzione rossa
e azzurra), scelto un valore di soglia (threshold o cut-off),
in cui è possibile andare a decidere il risultato, ovvero se
la classe è positiva (p) o negativa (n), dato che le due cur-ve
risultano in parte sovrapposte, sono possibili quattro
risultati a seconda della posizione del valore di cut-off:
se il risultato della predizione è positivo p e il valore
vero è anche positivo p, viene chiamato vero positivo
(true positive - TP);
se invece il valore vero è negativo, viene chiamato
falso positivo (false positive - FP);
contrariamente un vero negativo (true negative - TN)
occorre quando entrambi, il risultato e il valore vero,
sono negativi;
un falso negativo (false negative - FN) invece è
quando il risultato è negativo e il valore vero è
positivo.
È inoltre possibile rappresentare questo tipo di situazio-ne
anche andando a utilizzare una tabella di contingenza
di tipo 2×2, dove le colonne rappresentano la distinzione
tra soggetti sani e malati; le righe invece rappresentano il
risultato del test sui pazienti. Un risultato qualitativo del
test potrebbe essere quello di andare a valutare il numero
di falsi positivi e negativi, meno ve ne saranno e tanto il
test sarà maggiormente valido.
Una curva ROC è il grafico dell'insieme delle coppie
(FP, TP) al variare di un parametro del classificatore. Per
esempio, in un classificatore a soglia, si calcola la frazione
di veri positivi e quella di falsi positivi per ogni possibile
valore della soglia; tutti i punti così ottenuti nello spazio
FP-TP descrivono la curva ROC.
Il test che si effettua attraverso l'analisi delle curve ROC
ha la capacità di discernere, ad esempio, tra un insieme di
popolazione sana e malata, andando ad analizzare l'area
sottesa dalla curva ROC (Area Under Curve, AUC). Ciò
equivale alla probabilità che il risultato del test effettuato
su un individuo estratto a caso dal gruppo dei malati sia
superiore a quello estratto a caso dal gruppo dei sani.[6]
Solitamente si ha che le curve ROC passano per i
punti (0,0) e (1,1), avendo inoltre due condizioni che
rappresentano due curve limite:
1
2. 2 4 ALTRI PROGETTI
una che taglia il grafico a 45°, passando per l'origine.
Questa retta rappresenta il caso del classificatore
randomico (linea di «nessun beneficio»), e l'area
sottesa è pari a 0,5.
la seconda curva è rappresentata dall'insieme di seg-menti
che dall'origine sale al punto (0,1) e da quello
che congiunge il punto (0,1) a (1,1), avendo un'area
sottesa di valore pari a 1, ovvero rappresenta il
classificatore perfetto.
2 Alcuni concetti
TPR = TP/P = TP/(TP + FN)
FPR = FP/N = FP/(FP + TN)
accuratezza ACC = (TP + TN)/(P + N)
3 Note
[1] http://www.unipr.it/arpa/facvet/annali/2003/49.pdf
[2] Lusted, 1971
[3] Erdrich 1981, Henderson, 1993
[4] Goodenough e coll., 1974; Hanley e McNeil, 1982
[5] Greiner, Pfeiffer e Smith, 2000
[6] Bamber, 1975; Zweig e Campbell, 1993
4 Altri progetti
Commons contiene immagini o altri file su
Receiver operating characteristic
3. 3
5 Fonti per testo e immagini; autori; licenze
5.1 Testo
Receiver operating characteristic Fonte: http://it.wikipedia.org/wiki/Receiver_operating_characteristic?oldid=65186377 Contributori:
Jalo, Llorenzi, TXiKiBoT, VolkovBot, Marcol-it, SieBot, Muro Bot, Luckas-bot, Amirobot, FrescoBot, Arodichevski, Rubinbot, EmausBot,
ZéroBot, Artsakenos, Botcrux, Addbot e Anonimo: 4
5.2 Immagini
File:Commons-logo.svg Fonte: http://upload.wikimedia.org/wikipedia/commons/4/4a/Commons-logo.svg Licenza: Public domain Con-tributori:
This version created by Pumbaa, using a proper partial circle and SVG geometry features. (Former versions used to be slightly
warped.) Artista originale: SVG version was created by User:Grunt and cleaned up by 3247, based on the earlier PNG version, created by
Reidab.
File:ROCfig.PNG Fonte: http://upload.wikimedia.org/wikipedia/commons/5/5c/ROCfig.PNG Licenza: CC-BY-SA-3.0 Contributori: ?
Artista originale: ?
5.3 Licenza dell'opera
Creative Commons Attribution-Share Alike 3.0