Aannemelijkheidsfunctie

In de statistiek is de aannemelijkheidsfunctie de functie van een of meer parameters die bij een gegeven steekproefuitkomst als functiewaarde de kans(functie) of kansdichtheid van die uitkomst heeft. Eenvoudig gezegd is het de kans of kansdichtheid van de steekproefuitkomst, opgevat als functie van de onbekende parameter(s). De aannemelijkheidsfunctie geeft aan hoe aannemelijk een bepaalde waarde van de parameter is in het licht van de waarnemingen. Bij de toepassingen van de aannemelijkheidsfunctie is niet zozeer de waarde van belang, maar het maximum, zoals bij de methode van de grootste aannemelijkheid, of bij vergelijking het quotiënt van twee aannemelijkheidsfuncties, zoals bij de aannemelijkheidsquotiënttoets.

Definitie

Discreet

Als { p θ } {\displaystyle \{p_{\theta }\}} een familie kansfuncties is met parameter θ , {\displaystyle \theta ,} en uit een van deze verdelingen is een steekproef met uitkomst x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}} getrokken, dan heet de functie L {\displaystyle L} , gedefinieerd door:

L ( θ ) = L ( θ | x 1 , x 2 , , x n ) = p θ ( x 1 , x 2 , , x n ) {\displaystyle L(\theta )=L(\theta |x_{1},x_{2},\ldots ,x_{n})=p_{\theta }(x_{1},x_{2},\ldots ,x_{n})} ,

de aannemelijkheidsfunctie van θ {\displaystyle \theta } .

Continu

Als { f θ } {\displaystyle \{f_{\theta }\}} een familie kansdichtheden is met parameter θ {\displaystyle \theta } , en uit een van deze verdelingen is een steekproef met uitkomst x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}} getrokken, dan heet de functie L {\displaystyle L} , gedefinieerd door:

L ( θ ) = L ( θ | x 1 , x 2 , , x n ) = f θ ( x 1 , x 2 , , x n ) {\displaystyle L(\theta )=L(\theta |x_{1},x_{2},\ldots ,x_{n})=f_{\theta }(x_{1},x_{2},\ldots ,x_{n})} ,

de aannemelijkheidsfunctie van θ {\displaystyle \theta } .

Aselecte steekproef

In het belangrijke geval van een aselecte steekproef is de simultane kansfunctie of kansdichtheid het product van de afzonderlijke kansfuncties of dichtheden f θ ( x k ) {\displaystyle f_{\theta }(x_{k})} , zodat:

L ( θ ) = L ( θ | x 1 , x 2 , , x n ) = k = 1 n f θ ( x k ) {\displaystyle L(\theta )=L(\theta |x_{1},x_{2},\ldots ,x_{n})=\prod _{k=1}^{n}f_{\theta }(x_{k})}

Meestal is het dan voldoende met de logaritme van de aannemelijkheidsfunctie te werken, waardoor het product overgaat in een som.

Voorbeelden

Binomiale verdeling

Uit een binomiale verdeling met parameter n = 10 {\displaystyle n=10} en onbekende succeskans p {\displaystyle p} is een waarneming x {\displaystyle x} gedaan. De aannemelijkheidsfunctie van p {\displaystyle p} bij gegeven x {\displaystyle x} is:

L ( p | x ) = ( 10 x ) p x ( 1 p ) 10 x {\displaystyle L(p|x)={\tbinom {10}{x}}p^{x}(1-p)^{10-x}}

De aannemelijkheidsfunctie is maximaal voor p = x / 10 {\displaystyle p=x/10} ; deze waarde van p {\displaystyle p} heet de meest aannemelijke waarde (schatting).

Voor bijvoorbeeld de waarneming x = 3 {\displaystyle x=3} is de aannemelijkheid van de parameterwaarde p {\displaystyle p} :

L ( p ) = ( 10 3 ) p 3 ( 1 p ) 7 {\displaystyle L(p)={\tbinom {10}{3}}p^{3}(1-p)^{7}}

In de onderstaande tabel staat L ( p ) {\displaystyle L(p)} voor enkele waarden van de parameter p {\displaystyle p} :

p {\displaystyle p} 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55
L ( p ) {\displaystyle L(p)} 0,06 0,13 0,20 0,25 0,27 0,25 0,21 0,17 0,12 0,07

De waarde p = 0 , 10 {\displaystyle p=0{,}10} is niet erg aannemeljk, maar 6%, terwijl de waade p = 0 , 25 {\displaystyle p=0{,}25} veel aannemelijker is, namelijk 25%. Het meest aannemelijk is p = 0 , 30 {\displaystyle p=0{,}30} met een aannemelijkheid 27%.

Normale verdeling

Uit een normale verdeling met onbekende verwachtingswaarde μ {\displaystyle \mu } en standaardafwijking σ {\displaystyle \sigma } is een aselecte steekproef x 1 , x 2 , , x 100 {\displaystyle x_{1},x_{2},\ldots ,x_{100}} van omvang 100 getrokken. De aannemelijkheidsfunctie van het paar ( μ , σ ) {\displaystyle (\mu ,\sigma )} is:

L ( μ , σ ) = i = 1 100 φ ( μ + σ x i ) {\displaystyle L(\mu ,\sigma )=\prod _{i=1}^{100}\varphi (\mu +\sigma x_{i})}

waarin φ {\displaystyle \varphi } de kansdichtheid van de standaardnormale verdeling is.

Uniforme verdeling

Uit een uniforme verdeling op het interval [ 0 , θ ] {\displaystyle [0,\,\theta ]} met onbekende bovengrens θ {\displaystyle \theta } is een aselecte steekproef x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\ldots ,x_{n}} getrokken. De aannemelijkheidsfunctie van θ {\displaystyle \theta } is:

L ( θ ) = i = 1 n 1 θ I [ 0 , θ ] ( x i ) = { 1 θ n als  θ max ( x i )   0 elders {\displaystyle L(\theta )=\prod _{i=1}^{n}{\frac {1}{\theta }}I_{[0,\,\theta ]}(x_{i})={\begin{cases}{\frac {1}{\theta ^{n}}}&{\text{als }}\theta \geq \max(x_{i})\\\ 0&{\text{elders}}\end{cases}}}

Zie ook

  • Meest aannemelijke schatter
  • Score (statistiek)
WikiWoordenboek