Maximum likelihood módszer

A maximum likelihood módszer (magyarul: legnagyobb valószínűség) a matematikai statisztika egyik leggyakrabban használt becslési eljárása mérési eredmények, minták kiértékelésére.

A maximum likelihood módszer célja, hogy adott mérési értékekhez az ismeretlen paramétereknek olyan becslését adja meg, amely mellett az adott érték a legnagyobb valószínűséggel következik be. Az eljárás a likelihoodfüggvény maximalizálásával történik.

Definíció

A maximum likelihood becslés azokban az esetekben használatos, amikor az egyes mérési eredmények olyan véletlen eseményekként interpretálhatóak, amelyek egy vagy több ismeretlen paramétertől függenek. Mivel a vizsgált értékek kizárólagosan az ismeretlen paraméter(ek)től függenek, előállíthatók ezen paraméter vagy paraméterek függvényeként. A mérést, becslést végző kutató ezt a paramétert határozza meg, így maximalizálja a mért minta által követett valószínűséget.

A maximum likelihood módszer egy X {\displaystyle X} valószínűségi változóból indul ki, amelynek a sűrűség- vagy tömegfüggvénye f {\displaystyle f} és q {\displaystyle q} paramétertől függ.

Véletlenszerű mintavételezéskor, n {\displaystyle n} független és azonos feltételek között végzett mintavétel esetén, a sűrűség- vagy tömegfüggvény a következő formula szerint faktorizálható:

f ( x 1 , x 2 , . . . , x n ; q ) = i = 1 n f X i ( x i ; q ) {\displaystyle f(x_{1},x_{2},...,x_{n};q)=\prod _{i=1}^{n}{f_{X}}_{i}(x_{i};q)}

Amíg rögzített q {\displaystyle q} paraméter esetén a sűrűségfüggvény tetszőleges x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} értékkel határozható meg, fordítva járunk el, és rögzített x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} értékekre a sűrűségfüggvényt mint a q {\displaystyle q} paraméter függvényét tekintjük. Ezt nevezzük likelihoodfüggvénynek:

L ( q ) = i = 1 n f X i ( x i ; q ) {\displaystyle L(q)=\prod _{i=1}^{n}{f_{X}}_{i}(x_{i};q)}

A becslés a likelihoodfüggvény maximumának a megkeresése, azaz egy szélsőérték-feladat. A számítások egyszerűsítése céljából a gyakorlatban nem az eredeti likelihood-függvényt használjuk, hanem annak a természetes alapú logaritmusát. Mivel a l n {\displaystyle ln} függvény szigorúan monoton növekvő függvény, a szélsőérték helye nem változik, és egy összeggel egyszerűbb számolni, mint egy szorzattal. Ezt a függvényt gyakran nevezik loglikelihoodfüggvénynek:

( q ) = ln ( i = 1 n f X i ( x i ; q ) ) = i = 1 n ln f X i ( x i ; q ) {\displaystyle \ell (q)=\ln \left(\prod _{i=1}^{n}{f_{X}}_{i}(x_{i};q)\right)=\sum _{i=1}^{n}\ln f_{X_{i}}(x_{i};q)}

Példa

A normális eloszlás N ( μ , σ 2 ) {\displaystyle {\mathcal {N}}(\mu ,\sigma ^{2})} sűrűségfüggvénye μ {\displaystyle \mu } várhatóértékkel és σ 2 {\displaystyle \sigma ^{2}} szórásnégyzettel a következő:

f ( x ; μ , σ 2 ) = 1 2 π σ 2 exp ( ( x μ ) 2 2 σ 2 ) . {\displaystyle f\left(x;\mu ,\sigma ^{2}\right)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\exp {\left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)}.}

Tekintsük az x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} független mérési eredményeket, amelyek a feltételezés szerint ismeretlen m {\displaystyle m} várhatóértékkel és s 2 {\displaystyle s^{2}} ismeretlen szórásnégyzettel N ( m , s 2 ) {\displaystyle {\mathcal {N}}(m,s^{2})} normális eloszlást követnek. A következő likelihoodfüggvénnyel kell számolnunk: q = ( m , s ) {\displaystyle q=(m,s)} .

L ( m , s 2 ) = i = 1 n f ( x i ; m , s 2 ) = ( 1 2 π s 2 ) n / 2 exp ( i = 1 n ( x i m ) 2 2 s 2 ) {\displaystyle L(m,s^{2})=\prod _{i=1}^{n}f\left(x_{i};m,s^{2}\right)=\left({\frac {1}{2\pi s^{2}}}\right)^{n/2}\exp \left(-{\frac {\sum _{i=1}^{n}(x_{i}-m)^{2}}{2s^{2}}}\right)}

a loglikelihoodfüggvény pedig:

log ( L ( m , s 2 ) ) = n 2 log ( 2 π s 2 ) i = 1 n ( x i m ) 2 2 s 2 . {\displaystyle \log(L(m,s^{2}))=-{\tfrac {n}{2}}\log(2\pi s^{2})-{\frac {\sum _{i=1}^{n}(x_{i}-m)^{2}}{2s^{2}}}.}

Források

  • Jánossy, Lajos. A valószínűségelmélet alapjai és néhány alkalmazása, 1., Budapest: Tankönyvkiadó Vállalat, 206. o. (1965) 
  • Tómács, Tibor. Matematikai statisztika [archivált változat], 1., Eger: Eszterházy Károly Főiskola Matematikai és Informatikai Intézet, 133. o. (2012). Hozzáférés ideje: 2013. május 17. [archiválás ideje: 2013. március 9.]