a Vevő operátor karakterisztika (ROC) görbe egy grafikus telek, amelyet a bináris osztályozók diagnosztikai képességének bemutatására használnak. Először a jelérzékelés elméletében használták, de ma már számos más területen használják, mint például az orvostudomány, a radiológia, a természeti veszélyek és a gépi tanulás. Ebben a bejegyzésben megmutatom, hogyan jön létre egy ROC görbe, és hogyan értelmezhető a ROC görbe.,
egy példa az alábbiakban látható:
Roc görbe létrehozása
a ROC görbe úgy van kialakítva, hogy a valódi pozitív arányt (TPR) a hamis pozitív arányhoz (FPR) ábrázolják. Az igazi pozitív arány azon megfigyelések aránya, amelyeket az összes pozitív megfigyelésből (TP/(TP + FN) helyesen jósoltak pozitívnak. Hasonlóképpen, a hamis pozitív arány azon megfigyelések aránya, amelyek az összes negatív megfigyelésből (FP/(TN + FP) helytelenül pozitívnak számítanak., Például az orvosi vizsgálat során az igazi pozitív arány az a sebesség, amelyben az embereket helyesen azonosítják, hogy pozitívak legyenek a szóban forgó betegség szempontjából.
egy diszkrét osztályozó, amely csak az előre jelzett osztályt adja vissza, egyetlen pontot ad a ROC térben. De a valószínűségi osztályozók számára, amelyek olyan valószínűséget vagy pontszámot adnak, amely tükrözi azt a fokot, amelyre egy példány az egyik osztályba tartozik, nem pedig a másikba, görbét hozhatunk létre a pontszám küszöbértékének megváltoztatásával., Vegye figyelembe, hogy sok különálló osztályozó konvertálható pontozási osztályozóvá, ha “belenéz” a példány statisztikájába. Például egy döntési fa meghatározza a levélcsomópont osztályát a csomópont példányainak arányából.
a ROC-görbe értelmezése
a ROC-görbe az érzékenység (vagy TPR) és a specificitás (1 – FPR) közötti kompromisszumot mutatja. A bal felső sarokhoz közelebb álló görbék osztályozói jobb teljesítményt jeleznek. Alapvonalként egy véletlenszerű osztályozó várhatóan pontokat ad az átló mentén (FPR = TPR)., Minél közelebb van a görbe a ROC tér 45 fokos átlójához, annál kevésbé pontos a teszt.
vegye figyelembe, hogy a ROC nem függ az osztály eloszlásától. Ez hasznos a ritka eseményeket, például betegségeket vagy katasztrófákat előrejelző osztályozók értékeléséhez. Ezzel szemben a teljesítmény pontosságával történő értékelése (TP +
TN)/(TP + TN + FN + FP) olyan osztályozókat részesítene előnyben, amelyek mindig negatív eredményt jósolnak ritka eseményekre.
görbe alatti terület (AUC)
a különböző osztályozók összehasonlításához hasznos lehet az egyes osztályozók teljesítményét egyetlen mérésbe foglalni., Az egyik közös megközelítés a ROC görbe alatti terület kiszámítása, amelyet az AUC rövidít. Ez egyenértékű azzal a valószínűséggel, hogy egy véletlenszerűen kiválasztott pozitív példány magasabb, mint egy véletlenszerűen kiválasztott negatív példány, azaz egyenértékű a két minta Wilcoxon rank-sum statisztika.
a magas AUC-értékkel rendelkező osztályozó esetenként rosszabb pontszámot érhet el egy adott régióban, mint egy másik, alacsonyabb AUC-értékkel rendelkező osztályozó. De a gyakorlatban az AUC jól teljesít, mint a prediktív pontosság általános mértéke.
iratkozzon fel a Displayr