Box-Cox aldakuntza

Estatistikan, Box-Cox aldakuntza aldagai bakarreko datu multzo bat banaketa normalera egokitzeko aldakuntza da: funtzio baten bitartez, jatorrizko datuak beste datuetara bihurtzen dira, banaketa normalera egokituagoak izango direlako helburuz.

Jatorrizko datuak x eta datu aldatuak x ( λ ) {\displaystyle x^{(\lambda )}} izanik, honela definitzen da aldakuntza:

x ( λ ) = { ( x + m ) λ 1 λ λ 0 x > m l n ( x + m ) λ = 0 m > 0 {\displaystyle x^{(\lambda )}=\left\{{\begin{matrix}{\frac {(x+m)^{\lambda }-1}{\lambda }}&\lambda \neq 0&x>-m\\ln(x+m)&\lambda =0&m>0\end{matrix}}\right.}

non λ {\displaystyle \lambda } datuetan oinarrituz zenbatesten den parametroa den, aldakuntza parametroa alegia. x+m balio guztiak positibo egiten dituen m balioa aukeratu behar da. Beraz, m=0, datu guztiak positiboak badira, eta bestela, datu txikienaren balio absolutua izango da, datu negatiborik badago.

Aldakuntza parametroaren zenbatespena

Datuak banaketa normalera egokitzen dituen λ {\displaystyle \lambda } parametroa honela zenbatetsi daiteke:

  • datu bakoitzeko z ( λ ) = x λ 1 λ x ˙ λ 1 {\displaystyle z(\lambda )={\frac {x^{\lambda }-1}{\lambda {\dot {x}}^{\lambda -1}}}} definitzen da, x ˙ {\displaystyle {\dot {x}}} izanik datuen batez besteko geometrikoa;


  • ondoren, L ( λ ) = n 2 ln ( z i ( λ ) x ¯ ( λ ) ) 2 {\displaystyle L(\lambda )=-{\frac {n}{2}}{\text{ln}}\sum (z_{i}(\lambda )-{\overline {x}}(\lambda ))^{2}} adierazpena maximizatzen duen λ {\displaystyle \lambda } izango da aldakuntza parametro egokiena, zehatzago, normaltasunerako parametroaren egiantz handieneko zenbateslea.

Kanpo estekak

Autoritate kontrola
  • Wikimedia proiektuak
  • Wd Datuak: Q27032458
  • Wd Datuak: Q27032458