Índex de Jaccard

L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització).

Definició

Sigui un conjunt de n {\displaystyle n} objectes O = { o 1 , , o n } {\displaystyle O=\{o_{1},\ldots ,o_{n}\}} , i dues particions Π = { π 1 , , π r } {\displaystyle \Pi =\{\pi _{1},\ldots ,\pi _{r}\}} i Π = { π 1 , , π r } {\displaystyle \Pi '=\{\pi '_{1},\ldots ,\pi '_{r}\}} del conjunt d'objectes.

Aleshores, si definim

r': correspon al nombre de parells (a,b) on a i b es troben en un mateix grup tant a la partició Π {\displaystyle \Pi } com a la partició Π {\displaystyle \Pi '} .

s: correspon al nombre de parells (a,b) on a i b es troben en un mateix grup de Π {\displaystyle \Pi } però no de Π {\displaystyle \Pi '} .

t: correspon al nombre de parells (a,b) on a i b es troben en grups diferents de Π {\displaystyle \Pi } però en canvi es troben en el mateix grup de Π {\displaystyle \Pi '} .

l'índex de Jaccard correspon al quocient:

r r + s + t {\displaystyle {\frac {r}{r+s+t}}}

Vegeu també