Terminologi og utledninger
innen forvirringsmatriser - tilstand positiv (P)
- antall reellt positive tilfeller i datene
- tilstand negativ (N)
- antall reellt negative tilfeller i datene
- sann positiv (SP)
- antall reellt positive tilfeller klassifisert som positive (trefninger)
- sann negative (SN)
- antall reellt negative tilfeller klassifisert som negative (korrekt forkastninger)
- falsk positive (FP)
- antall reellt negative tilfeller klassifisert som positive (falske alarmer, type-I-feil)
- falsk negative (FN)
- antall reellt positive tilfeller klassifisert som negative (bomskudd, type-II-feil)
- sensitivitet, recall, trefningsrate, eller sann-positiv-rate (SPR)
- spesifisitet, selektivitet, eller sann-negativ-rate (SNR)
- presisjon, eller positiv-prediktiv-verdi (PPV)
- negativ-prediktiv-verdi (NPV)
- bomskuddsrate, eller falsk-negativ-rate (FNR)
- fall-out, eller falsk-positiv-rate (FPR)
- falsk-oppdagelsesrate (FOR)
- falsk-utelatelsesrate (FUR)
- nøyaktighet (NØY)
- F1-verdi
- det harmoniske gjennomsnitt mellom presisjon og sensitivitet
- Matthews korrelasjonskoeffisient (MKK)
- Youden-indeks, Informedness, eller Bookmaker Informedness (BM)
- Markerthet, Markedness (MH)
Kilder: Fawcett (2006),[1] Powers (2011),[2] and Ting (2011)[3] |
Innenfor maskinlæring og spesifikt statistisk klassifisering er en forvirringsmatrise, også kjent som feilmatrise,[4] et spesifikt tabelloppsett som visualiserer ytelsen til en algoritme, typisk ved veiledet læring. I ikke-veiledet læring kalles det vanligvis en samsvarmatrise.
Hver rad i matrisen representerer instansene i en faktisk klasse, mens hver kolonne representerer instansene i en predikert klasse (eller omvendt – begge variantene finnes i litteraturen).[2] Navnet kommer fra at matrisen gjør det enkelt å se om systemet forveksler to klasser (altså ofte feilmerker den ene som en annen).
Det er en spesiell type krysstabell med to dimensjoner ("faktisk" og "predikert"), og identiske sett med "klasser" i begge dimensjoner (hver kombinasjon av dimensjon og klasse er en variabel i krysstabellen).
Referanser
- ^ Fawcett, Tom (2006). «An Introduction to ROC Analysis» (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
- ^ a b Powers, David M W (2011). «Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation» (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.
- ^ Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.
- ^ Stehman, Stephen V. (1997). «Selecting and interpreting measures of thematic classification accuracy». Remote Sensing of Environment. 62 (1): 77–89. Bibcode:1997RSEnv..62...77S. doi:10.1016/S0034-4257(97)00083-7.