o curbă caracteristică operatorului receptor (Roc) este o diagramă grafică utilizată pentru a arăta capacitatea de diagnosticare a clasificatorilor binari. A fost folosit pentru prima dată în teoria detectării semnalului, dar este acum utilizat în multe alte domenii, cum ar fi medicina, radiologia, pericolele naturale și învățarea automată. În această postare vă voi arăta cum este creată o curbă ROC și cum să interpretați curba ROC., un exemplu este prezentat mai jos:
crearea unei curbe ROC
o curbă ROC este construită prin trasarea ratei pozitive reale (TPR) împotriva ratei fals pozitive (FPR). Rata pozitivă reală este proporția observațiilor care au fost corect prezise a fi pozitive din toate observațiile pozitive [TP / (TP + FN)]. În mod similar, rata fals pozitivă este proporția de observații care sunt prezise incorect a fi pozitive din toate observațiile negative [FP/(TN + FP)]., De exemplu, în testarea medicală, adevărata rată pozitivă este rata în care oamenii sunt identificați corect pentru a testa pozitiv pentru boala în cauză.
un clasificator discret care returnează doar clasa prezisă oferă un singur punct în spațiul ROC. Dar pentru clasificatorii probabilistici, care dau o probabilitate sau un scor care reflectă gradul în care o instanță aparține unei clase, mai degrabă decât alteia, putem crea o curbă prin modificarea pragului pentru scor., Rețineți că multe Clasificatoare discrete pot fi convertite într-un clasificator de notare prin „căutarea în interiorul” statisticilor lor de instanță. De exemplu, un arbore de decizie determină clasa unui nod de frunze din proporția de instanțe la nod.
interpretarea curbei ROC
curba ROC arată compromisul dintre sensibilitate (sau TPR) și specificitate (1-FPR). Clasificatorii care dau curbe mai aproape de colțul din stânga sus indică o performanță mai bună. Ca bază, se așteaptă ca un clasificator aleatoriu să dea puncte situate de-a lungul diagonalei (FPR = TPR)., Cu cât curba este mai aproape de diagonala de 45 de grade a spațiului ROC, cu atât testul este mai puțin precis.rețineți că ROC nu depinde de distribuția clasei. Acest lucru îl face util pentru evaluarea clasificatorilor care prezic evenimente rare, cum ar fi boli sau Dezastre. În schimb, Evaluarea performanței folosind precizia(TP +
TN)/(TP + TN + FN + FP) ar favoriza clasificatorii care prezic întotdeauna un rezultat negativ pentru evenimente rare.pentru a compara clasificatorii diferiți, poate fi util să rezumăm performanța fiecărui clasificator într-o singură măsură., O abordare comună este de a calcula aria de sub curba ROC, care este abreviată la ASC. Este echivalent cu probabilitatea ca o instanță pozitivă aleasă aleatoriu să fie clasificată mai mare decât o instanță negativă aleasă aleatoriu, adică este echivalentă cu cele două statistici Wilcoxon rank-sum.
un clasificator cu ASC mare poate avea ocazional un scor mai slab într-o anumită regiune decât un alt clasificator cu ASC mai mic. Dar, în practică, ASC funcționează bine ca o măsură generală a preciziei predictive.
Înscrieți-vă pentru Displayr