křivka operátora přijímače (ROC) je grafický graf používaný k zobrazení diagnostické schopnosti binárních klasifikátorů. To bylo poprvé použito v teorii detekce signálu, ale nyní se používá v mnoha dalších oblastech, jako je medicína, radiologie, přírodní nebezpečí a strojové učení. V tomto příspěvku vám ukážu, jak je vytvořena křivka ROC a jak interpretovat křivku ROC.,
níže je uveden příklad:
vytvoření křivky ROC
křivka ROC je konstruována vykreslením skutečné pozitivní rychlosti (TPR) proti falešně pozitivní rychlosti (FPR). Skutečnou pozitivní mírou je podíl pozorování, která byla správně předpovězena jako pozitivní ze všech pozitivních pozorování(TP/(TP + FN)). Podobně falešně pozitivní míra je podíl pozorování, které jsou nesprávně předpokládá, že pozitivní ze všech negativních vyjádření (FP/(TN + FP))., Například v lékařském testování je skutečnou pozitivní mírou míra, ve které jsou lidé správně identifikováni, aby testovali pozitivní na danou nemoc.
diskrétní klasifikátor, který vrací pouze předpokládanou třídu, dává jediný bod v prostoru ROC. Ale pro pravděpodobnostní klasifikátory, které dávají Pravděpodobnost nebo skóre, které odráží stupeň, do kterého instance patří spíše do jedné třídy než do druhé, můžeme vytvořit křivku změnou prahu pro skóre., Všimněte si, že mnoho diskrétních klasifikátorů může být převedeno na klasifikátor bodování „hledáním uvnitř“ jejich statistik instancí. Například rozhodovací strom určuje třídu uzlu listu z podílu instancí v uzlu.
interpretace křivky ROC
křivka ROC ukazuje kompromis mezi citlivostí (nebo TPR) a specificitou (1-FPR). Klasifikátory, které dávají křivky blíže k levému hornímu rohu, naznačují lepší výkon. Jako základní linie se očekává, že náhodný klasifikátor poskytne body ležící podél úhlopříčky (FPR = TPR)., Čím blíže je křivka k 45 stupňové úhlopříčce prostoru ROC, tím méně přesný je test.
Všimněte si, že ROC nezávisí na rozdělení třídy. To je užitečné pro hodnocení klasifikátorů předpovídajících vzácné události, jako jsou nemoci nebo katastrofy. V kontrastu, hodnocení výkonu pomocí přesnosti (TP +
TN)/(TP + TN + FN + FP) by laskavost klasifikátory, že vždycky předpovídají negativní výsledek pro vzácné události.
Plocha pod křivkou (AUC)
Pro porovnání různých klasifikátorů, to může být užitečné shrnout výkon každého klasifikátoru do jediného opatření., Jedním společným přístupem je výpočet plochy pod křivkou ROC, která je zkrácena na AUC. To je ekvivalentní pravděpodobnost, že náhodně zvolené pozitivní instance je zařadil vyšší než náhodně vybraný negativní instance, tj. je ekvivalentní dvěma vzorku Wilcoxonův rank-sum statistika.
klasifikátor s vysokou AUC může mít v určité oblasti občas horší skóre než jiný klasifikátor s nižší AUC. V praxi však AUC funguje stejně jako obecná míra prediktivní přesnosti.
Zaregistrujte se na Displayr