Distribució khi quadrat

Infotaula distribució de probabilitat χ 2 {\displaystyle \chi ^{2}}
Funció de densitat de probabilitat
Funció de distribució de probabilitat
Tipusfamília exponencial, Distribució khi quadrat no central, distribució gamma, Generalized chi-squared distribution (en) Tradueix i distribució de probabilitat contínua Modifica el valor a Wikidata
Notació χ 2 ( k ) {\displaystyle \chi ^{2}(k)\;} o χ k 2 {\displaystyle \chi _{k}^{2}\!}
Paràmetres k ( 0 , ) {\displaystyle k\in (0,\infty )} (graus de llibertat)
Suport x > 0 {\displaystyle x>0} Modifica el valor a Wikidata
fdp 1 2 k / 2 Γ ( k / 2 ) x k / 2 1 e x / 2   x > 0 {\displaystyle {\frac {1}{2^{k/2}\Gamma (k/2)}}\;x^{k/2-1}e^{-x/2}\,\ x>0}
FD 1 Γ ( k / 2 ) γ ( k 2 , x 2 ) {\displaystyle {\frac {1}{\Gamma (k/2)}}\;\gamma \left({\frac {k}{2}},\,{\frac {x}{2}}\right)\;}
Esperança matemàtica k {\displaystyle k}
Mediana k ( 1 2 9 k ) 3 {\displaystyle \approx k{\bigg (}1-{\frac {2}{9k}}{\bigg )}^{3}\;}
Moda k 2 ,   si   k 2 {\displaystyle k-2,\ {\text{si}}\ k\geq 2}
Variància 2 k {\displaystyle 2k\;}
Coeficient de simetria 8 / k {\displaystyle {\sqrt {8/k}}\,}
Curtosi 12 ν {\displaystyle {\frac {12}{\nu }}} Modifica el valor a Wikidata
Entropia k 2 + ln ( 2 Γ ( k 2 ) ) + ( 1 k 2 ) ψ ( k 2 ) {\displaystyle {\frac {k}{2}}+\ln(2\Gamma ({\frac {k}{2}}))+(1-{\frac {k}{2}})\psi ({\frac {k}{2}})}
FGM ( 1 2 t ) ν / 2 ,   t ( , 1 / 2 ) {\displaystyle (1-2t)^{-\nu /2},\ t\in (-\infty ,1/2)} Modifica el valor a Wikidata
FC ( 1 2 i t ) ν / 2 {\displaystyle (1-2\mathrm {i} t)^{-\nu /2}} Modifica el valor a Wikidata
MathworldChi-SquaredDistribution Modifica el valor a Wikidata

En Teoria de la probabilitat i Estadística la distribució distribució khi quadrat χ 2 {\displaystyle \chi ^{2}} (pronunciat [xi] o [ci]), també anomenada khi quadrat de Pearson, amb k {\displaystyle k} de llibertat és la distribució de la suma dels quadrats de k {\displaystyle k} variables aleatòries normals estàndard independents. És un cas particular de la distribució gamma i es pot estendre a un nombre no enter de graus de llibertat. És molt important en Estadística ja que intervé en nombrosos tests estadístics, com el de la t {\displaystyle t} de Student o de la χ 2 {\displaystyle \chi ^{2}} de Pearson, així com en la construcció de diversos intervals de confiança.

La referència bàsica d'aquest article és Johnson et al.[1].

Definició, funció de densitat i funció de distribució

Siguin Z 1 , , Z k {\displaystyle Z_{1},\dots ,Z_{k}} variables aleatòries independents, totes amb distribució normal estàndard N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} . La variable aleatòria

Q = Z 1 2 + + Z k 2 {\displaystyle Q=Z_{1}^{2}+\cdots +Z_{k}^{2}}
es diu que té una distribució χ 2 {\displaystyle \chi ^{2}} amb k {\displaystyle k} graus de llibertat i s'escriu Q χ k 2 {\displaystyle Q\sim \chi _{k}^{2}} o Q χ 2 ( k ) {\displaystyle Q\sim \chi ^{2}(k)} .

La funció de densitat és

f ( x ; k ) = { x k 2 1 e x 2 2 k 2 Γ ( k 2 ) , si   x > 0 , 0 , en cas contrari , {\displaystyle f(x;\,k)={\begin{cases}{\dfrac {x^{{\frac {k}{2}}-1}e^{-{\frac {x}{2}}}}{2^{\frac {k}{2}}\Gamma \left({\frac {k}{2}}\right)}},&{\text{si}}\ x>0,\\0,&{\text{en cas contrari}},\end{cases}}}
on Γ ( a ) {\displaystyle \Gamma (a)} és la funció gamma. Per tant, tenim que la distribució coincideix amb una distribució gamma amb paràmetre de forma k / 2 {\displaystyle k/2} i paràmetre d'escala 2, Q Γ ( k 2 , 2 ) {\displaystyle Q\sim \Gamma {\Big (}{\frac {k}{2}},2{\Big )}} .

Prova
Comencem pel cas k = 1 {\displaystyle k=1} . Sigui Q = Z 2 {\displaystyle Q=Z^{2}} , amb Z N ( 0 , 1 ) {\displaystyle Z\sim {\mathcal {N}}(0,1)} . La funció de distribució de Q {\displaystyle Q} , F Q ( x ) = P ( Q x ) {\displaystyle F_{Q}(x)=P(Q\leq x)} valdrà:
  • Si x < 0 {\displaystyle x<0} , llavors òbviament F Q ( x ) = 0 {\displaystyle F_{Q}(x)=0} .
  • Si x 0 {\displaystyle x\geq 0} , llavors F Q ( x ) = P ( Z 2 x ) = P ( x Z x ) = F Z ( x ) F Z ( x ) , {\displaystyle F_{Q}(x)=P(Z^{2}\leq x)=P(-{\sqrt {x}}\leq Z\leq {\sqrt {x}})=F_{Z}({\sqrt {x}})-F_{Z}(-{\sqrt {x}}),}

on F Z {\displaystyle F_{Z}} és la funció de distribució de Z {\displaystyle Z} .

Derivant obtenim la funció de densitat de Q {\displaystyle Q} , f Q {\displaystyle f_{Q}} : per a x 0 {\displaystyle x\geq 0} ,

f Q ( x ) = F Z ( x ) 1 2 x + F Z ( x ) 1 2 x = 1 2 π e x / 2 x . {\displaystyle f_{Q}(x)=F'_{Z}({\sqrt {x}})\,{\frac {1}{2{\sqrt {x}}}}+F'_{Z}(-{\sqrt {x}})\,{\frac {1}{2{\sqrt {x}}}}={\frac {1}{\sqrt {2\pi }}}\,{\frac {e^{-x/2}}{\sqrt {x}}}.}
Per tant, identifiquem que Q {\displaystyle Q} té una distribució gamma amb paràmetre de forma 1/2 i paràmetre d'escala 2: Q Γ ( 1 2 , 2 ) {\displaystyle Q\sim \Gamma {\Big (}{\frac {1}{2}},2{\Big )}} .

Anem ara al cas general: podem escriure
Q = Q 1 + + Q k , {\displaystyle Q=Q_{1}+\cdots +Q_{k},}
on Q 1 , , Q k {\displaystyle Q_{1},\dots ,Q_{k}} són independents i Q i Γ ( 1 2 , 2 ) {\displaystyle Q_{i}\sim \Gamma {\Big (}{\frac {1}{2}},2{\Big )}} . Llavors, pel caràcter reproductiu de les distribucions gamma, Q Γ ( k 2 , 2 ) {\displaystyle Q\sim \Gamma {\Big (}{\frac {k}{2}},2{\Big )}} , i, per tant, tindrà la densitat que hem indicat abans.

Funció de distribució

La funció de distribució es pot escriure en termes de la funció gamma incompleta:

F ( x ; k ) = { 1 Γ ( k 2 ) γ ( k 2 , x 2 ) , si   x 0 0 , si   x < 0 , {\displaystyle F(x;k)={\begin{cases}{\dfrac {1}{\Gamma ({\frac {k}{2}})}}\gamma {\big (}{\dfrac {k}{2}},{\dfrac {x}{2}}{\big )},&{\text{si}}\ x\geq 0\\0,&{\text{si}}\ x<0,\end{cases}}}
on γ ( ν , x ) {\displaystyle \gamma (\nu ,x)} és la funció gamma incompleta inferior.

Extensió a graus de llibertat no enters

La funció f ( x ; k ) {\displaystyle f(x;k)} està ben definida i és una funció de densitat per a qualsevol k ( 0 , ) {\displaystyle k\in (0,\infty )} : en efecte, fixat qualsevol nombre real k > 0 {\displaystyle k>0} , tenim que f ( x ; k ) 0 {\displaystyle f(x;k)\geq 0} i f ( x ; k ) d x = 1 {\displaystyle \int _{-\infty }^{\infty }f(x;k)\,dx=1} . Aleshores, una variable aleatòria amb aquesta densitat es diu que té una distribució χ 2 {\displaystyle \chi ^{2}} amb k {\displaystyle k} graus de llibertat. Alternativament, la distribució Γ ( k 2 , 2 ) {\displaystyle \Gamma {\Big (}{\frac {k}{2}},2{\Big )}} està definida per a qualsevol k ( 0 , ) {\displaystyle k\in (0,\infty )} . A partir d'ara, suposarem que k ( 0 , ) {\displaystyle k\in (0,\infty )} . i especificarem quan suposem que k {\displaystyle k} és un nombre natural.

Moments, funció generatriu de moments i funció característica

Moments

Aquestes propietats es dedueixen particularitzant les corresponents propietats de la distribució gamma. Si Q χ 2 ( k ) {\displaystyle Q\sim \chi ^{2}(k)} aleshores té moments de tots els ordres, que valen

E [ Q ] = k i E [ Q n ] = k ( k + 2 ) ( k + 2 n 2 ) ,   n 2. {\displaystyle E[Q]=k\quad {\text{i}}\quad E[Q^{n}]=k(k+2)\cdots (k+2n-2),\ n\geq 2.}
Utilitzant la funció Gamma es pot escriure

E [ Q n ] = 2 n Γ ( ( k / 2 ) + n ) Γ ( k / 2 ) . {\displaystyle E[Q^{n}]=2^{n}\,{\frac {\Gamma {\big (}(k/2)+n{\big )}}{\Gamma (k/2)}}.}

En particular,

E [ Q 2 ] = k ( k + 2 ) , {\displaystyle E[Q^{2}]=k(k+2),}
d'on
Var ( Q ) = E [ Q 2 ] ( E [ Q ] ) 2 = 2 k . {\displaystyle {\text{Var}}(Q)=E[Q^{2}]-(E[Q])^{2}=2k.}
Així,

E [ Q ] = k i Var ( Q ) = 2 k . {\displaystyle E[Q]=k\quad {\text{i}}\quad {\text{Var}}(Q)=2k.}

Moments d'ordre negatiu

Si X {\displaystyle X} és una variable aleatòria positiva, X 0 {\displaystyle X\geq 0} , aleshores per a qualsevol r > 0 {\displaystyle r>0} podem calcular

E [ X r ] = E [ 1 X r ] , {\displaystyle E[X^{-r}]=E{\Big [}{\frac {1}{X^{r}}}{\Big ]},}
però pot donar + {\displaystyle +\infty } . Quan dóna finit, llavors es diu que la variable X {\displaystyle X} té moment d'ordre negatiu r {\displaystyle -r} .[2]

Sigui Q χ 2 ( k ) {\displaystyle Q\sim \chi ^{2}(k)} . Llavors, si r ( 0 , ν / 2 ) {\displaystyle r\in (0,\nu /2)} , Q {\displaystyle Q} té moment d'ordre negatiu r {\displaystyle -r} i val [2]

E [ Q r ] = Γ ( ν 2 r ) 2 r Γ ( ν 2 ) . {\displaystyle E[Q^{-r}]={\frac {\Gamma {\Big (}{\frac {\nu }{2}}-r{\Big )}}{2^{r}\,\Gamma {\Big (}{\frac {\nu }{2}}{\Big )}}}.}
Per exemple, si ν = 4 {\displaystyle \nu =4} , llavors Q {\displaystyle Q} té moment negatiu d'ordre -1 i val
E [ Q 1 ] = 1 2 . {\displaystyle E[Q^{-1}]={\frac {1}{2}}.}
Aquesta propietat s'utilitza per a calcular els moments de distribucions de quocients (o ratios) de variables aleatòries independents quan al denominador hi ha una distribució khi quadrat, com en el cas d'una distribució t {\displaystyle t} de Student o una distribució F {\displaystyle F} .

Funció generatriu de moments

La funció generatriu de moments és

M ( t ) = 1 ( 1 2 t ) k / 2 , t ( , 1 2 ) . {\displaystyle M(t)={\frac {1}{(1-2t)^{k/2}}},\quad t\in (-\infty ,{\frac {1}{2}}).}

Funció característica

La funció característica és

φ ( t ) = 1 ( 1 2 i t ) k / 2 , t R . {\displaystyle \varphi (t)={\frac {1}{(1-2it)^{k/2}}},\quad t\in \mathbb {R} .}

Caràcter reproductiu

Del caràcter reproductiu de les distribucions gamma es dedueix el de les distribucions χ 2 {\displaystyle \chi ^{2}} : Siguin Q 1 , , Q n {\displaystyle Q_{1},\dots ,Q_{n}} independents, amb distribucions Q i χ 2 ( k i ) {\displaystyle Q_{i}\sim \chi ^{2}(k_{i})} , 1 = 1 , , n {\displaystyle 1=1,\dots ,n} . Llavors,

i = 1 n Q i χ 2 ( i = 1 n k i ) . {\displaystyle \sum _{i=1}^{n}Q_{i}\sim \chi ^{2}{\big (}\sum _{i=1}^{n}k_{i}{\big )}.}

Propietat.:[3] Siguin Q 1 χ 2 ( k 1 ) {\displaystyle Q_{1}\sim \chi ^{2}(k_{1})} i Q 2 χ 2 ( k 2 ) {\displaystyle Q_{2}\sim \chi ^{2}(k_{2})} . Suposem que Q = Q 1 Q 2 {\displaystyle Q=Q_{1}-Q_{2}} és independent de Q 2 {\displaystyle Q_{2}} . Aleshores Q χ 2 ( k 1 k 2 ) {\displaystyle Q\sim \chi ^{2}(k_{1}-k_{2})} .


Prova
Designem per φ Q ,   φ Q 1   i   φ Q 2 {\displaystyle \varphi _{Q},\ \varphi _{Q_{1}}\ {\text{i}}\ \varphi _{Q_{2}}} les funcions característiques de Q ,   Q 1   i   Q 2 {\displaystyle Q,\ Q_{1}\ {\text{i}}\ Q_{2}} respectivament. Llavors,
φ Q 1 ( t ) = 1 ( 1 2 i t ) k 1 / 2 = E [ e i t Q 1 ] = E [ e i t Q + i t Q 2 ] = E [ e i t Q ] E [ e i t Q 2 ] = φ Q ( t ) φ Q 2 ( t ) = φ Q ( t ) 1 ( 1 2 i t ) k 2 / 2 . {\displaystyle \varphi _{Q_{1}}(t)={\frac {1}{(1-2it)^{k_{1}/2}}}=E[e^{itQ_{1}}]=E[e^{itQ+itQ_{2}}]=E[e^{itQ}]\,E[e^{itQ_{2}}]=\varphi _{Q}(t)\,\varphi _{Q_{2}}(t)=\varphi _{Q}(t)\,{\frac {1}{(1-2it)^{k_{2}/2}}}.}
D'on
φ Q ( t ) = 1 ( 1 2 i t ) ( k 1 k 2 ) / 2 . {\displaystyle \varphi _{Q}(t)={\frac {1}{(1-2it)^{(k_{1}-k_{2})/2}}}.}
i per tant, Q χ 2 ( k 1 k 2 ) {\displaystyle Q\sim \chi ^{2}(k_{1}-k_{2})} .


Aproximació per la distribució normal

En aquesta secció considerarem la distribució χ 2 {\displaystyle \chi ^{2}} amb un nombre enter de graus de llibertat. D'acord amb el teorema central del límit, si Q k χ 2 ( k ) {\displaystyle Q_{k}\sim \chi ^{2}(k)} , aleshores

lim k Q k k 2 k = N ( 0 , 1 ) , en distribució. {\displaystyle \lim _{k\to \infty }{\frac {Q_{k}-k}{\sqrt {2k}}}={\mathcal {N}}(0,1),\quad {\text{en distribució.}}}
En altres paraules, per a k {\displaystyle k} gran, Q k {\displaystyle Q_{k}} és aproximadament normal N ( k , 2 k ) {\displaystyle {\mathcal {N}}(k,2k)} .

Però aquesta aproximació demana k {\displaystyle k} força gran. La següent aproximació, deguda a Fisher,[4] és més ràpida

lim k ( 2 Q k 2 k 1 ) = N ( 0 , 1 ) , en distribució. {\displaystyle \lim _{k\to \infty }{\Big (}{\sqrt {2Q_{k}}}-{\sqrt {2k-1}}{\Big )}={\mathcal {N}}(0,1),\quad {\text{en distribució.}}}
Equivalentment, per a k {\displaystyle k} gran, 2 Q k {\displaystyle {\sqrt {2Q_{k}}}} és aproximadament normal N ( 2 k 1 , 1 ) {\displaystyle {\mathcal {N}}({\sqrt {2k-1}},1)} .

Segons Johnson et al[5] encara és més ràpida l'aproximació deguda a Wilson and Hilferty:[6] per a k {\displaystyle k} gran, Q k / k 3 {\displaystyle {\sqrt[{3}]{Q_{k}/k}}} és aproximadament normal N ( 1 2 9 k , 2 9 k ) . {\displaystyle {\mathcal {N}}{\big (}1-{\frac {2}{9k}},{\frac {2}{9k}}{\big )}.}

Prova
Per a l'aproximació donada pel teorema central del límit, considerem una successió Z 1 , Z 2 , {\displaystyle Z_{1},Z_{2},\dots } de variables aleatòries independents, totes amb distribució normal estàndard N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} . La successió Z 1 2 , Z 2 2 , {\displaystyle Z_{1}^{2},Z_{2}^{2},\dots } estarà formada per variables independents, amb esperança E [ Z i 2 ] = 1 {\displaystyle E[Z_{i}^{2}]=1} i variància
Var ( Z i ) = E [ Z i 4 ] ( E [ Z i 2 ] ) 2 = 2. {\displaystyle {\text{Var}}(Z_{i})=E[Z_{i}^{4}]-{\big (}E[Z_{i}^{2}]{\big )}^{2}=2.}
Pel teorema central del límit,

lim k i = 1 k Z i 2 k 2 k = N ( 0 , 1 ) , en distribució. {\displaystyle \lim _{k\to \infty }{\frac {\sum _{i=1}^{k}Z_{i}^{2}-k}{\sqrt {2k}}}={\mathcal {N}}(0,1),\quad {\text{en distribució.}}}
Però i = 1 k Z i 2 χ 2 ( k ) . {\displaystyle \sum _{i=1}^{k}Z_{i}^{2}\sim \chi ^{2}(k).}


L'aproximació de Fisher pot deduir-se de l'aproximació de la distribució gamma a la distribució normal: sigui X k Γ ( k , 1 ) {\displaystyle X_{k}\sim \Gamma (k,1)} . Aleshores

lim k 2 ( X k k 1 4 ) =   N ( 0 , 1 ) , en distribució . {\displaystyle \lim _{k\to \infty }2{\Big (}{\sqrt {X_{k}}}-{\sqrt {k-{\tfrac {1}{4}}}}{\Big )}=\ {\mathcal {N}}(0,1),\quad {\text{en distribució}}.}
Ara, per la propietat d'escala de la distribució gamma, atès que Q k χ 2 ( k ) = Γ ( k 2 , 2 ) {\displaystyle Q_{k}\sim \chi ^{2}(k)=\Gamma {\Big (}{\dfrac {k}{2}},2{\Big )}} , tenim que Q k 2 Γ ( k 2 , 1 ) {\displaystyle {\dfrac {Q_{k}}{2}}\sim \Gamma {\Big (}{\dfrac {k}{2}},1{\Big )}} . Vegeu [7] pels detalls .

Per a l'aproximació de Wilson and Hilferty, consulteu la referència citada.

La distribució χ² i les mostres de poblacions normals

El següent resultat té una importància fonamental en la inferència estadística basada en mostres de poblacions normals.

Teorema. Sigui X 1 , , X n {\displaystyle X_{1},\dots ,X_{n}} una mostra d'una població normal N ( μ , σ 2 ) {\displaystyle {\mathcal {N}}(\mu ,\sigma ^{2})} , és a dir, les variables aleatòries X 1 , , X n {\displaystyle X_{1},\dots ,X_{n}} són independents i totes tenen distribució N ( μ , σ 2 ) {\displaystyle {\mathcal {N}}(\mu ,\sigma ^{2})} . Considerem la mitjana mostral

X ¯ = 1 n i = 1 n X i . {\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}
Aleshores:

  1. 1 σ 2 i = 1 n ( X i X ¯ ) 2 χ 2 ( n 1 ) . {\displaystyle {\frac {1}{\sigma ^{2}}}\sum _{i=1}^{n}{\big (}X_{i}-{\overline {X}}{\big )}^{2}\sim \chi ^{2}(n-1).}
  2. Les variables aleatòries X ¯ {\displaystyle {\overline {X}}} i i = 1 n ( X i X ¯ ) 2 {\displaystyle \sum _{i=1}^{n}{\big (}X_{i}-{\overline {X}}{\big )}^{2}} són independents.

A partir d'aquest teorema i del fet que X ¯ N ( μ , σ 2 / n ) {\displaystyle {\overline {X}}\sim {\mathcal {N}}(\mu ,\sigma ^{2}/n)} , tenim que la variable aleatòria (estadístic)

T = X ¯ μ S / n {\displaystyle T={\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}}
té una distribució t {\displaystyle t} de Sudent amb n 1 {\displaystyle n-1} graus de llibertat: T t ( n 1 ) {\displaystyle T\sim t(n-1)} , on

S 2 = 1 n 1 i = 1 n ( X i X ¯ ) 2 , {\displaystyle S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}{\big (}X_{i}-{\overline {X}}{\big )}^{2},}
és la variància mostral.

Prova
Aquesta demostració està extreta de DeGroot .[8]

Pas previ: reducció a una mostra d'una població normal estàndard. Siguin

Z i = X i μ σ ,   i = 1 , , n , {\displaystyle Z_{i}={\frac {X_{i}-\mu }{\sigma }},\ i=1,\dots ,n,}
que son variables independents amb distribució N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} . Tenim que
X ¯ = σ Z ¯ + μ . {\displaystyle {\overline {X}}=\sigma {\overline {Z}}+\mu .}
Llavors,
X i X ¯ = σ Z i + μ ( σ Z ¯ + μ ) = σ ( Z i Z ¯ ) . {\displaystyle X_{i}-{\overline {X}}=\sigma Z_{i}+\mu -(\sigma {\overline {Z}}+\mu )=\sigma (Z_{i}-{\overline {Z}}).}
Per tant,
1 σ 2 i = 1 n ( X i X ¯ ) 2 = i = 1 n ( Z i Z ¯ ) 2 . {\displaystyle {\frac {1}{\sigma ^{2}}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}=\sum _{i=1}^{n}(Z_{i}-{\overline {Z}})^{2}.}
Així, n'hi ha prou amb demostrar que si Z 1 , , Z n {\displaystyle Z_{1},\dots ,Z_{n}} són independents, totes amb llei N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} , aleshores

  1. i = 1 n ( Z i Z ¯ ) 2 χ 2 ( n 1 ) . {\displaystyle \sum _{i=1}^{n}{\big (}Z_{i}-{\overline {Z}}{\big )}^{2}\sim \chi ^{2}(n-1).}
  2. Les variables aleatòries Z ¯ {\displaystyle {\overline {Z}}} i i = 1 n ( Z i Z ¯ ) 2 {\displaystyle \sum _{i=1}^{n}{\big (}Z_{i}-{\overline {Z}}{\big )}^{2}} són independents.

Per demostrar aquestes propietats utilitzarem l'anomenada matriu de Helmert de dimensió n {\displaystyle n} :[9]

H = ( 1 n 1 n 1 n 1 n 1 n 1 n 1 2 1 2 0 0 0 0 1 6 1 6 2 6 0 0 0 1 12 1 12 1 12 3 12 0 0 1 n ( n 1 ) 1 n ( n 1 ) 1 n ( n 1 ) 1 n ( n 1 ) 1 n ( n 1 ) n 1 n ( n 1 ) ) {\displaystyle {\boldsymbol {H}}={\begin{pmatrix}{\frac {1}{\sqrt {n}}}&{\frac {1}{\sqrt {n}}}&{\frac {1}{\sqrt {n}}}&{\frac {1}{\sqrt {n}}}&\cdots &{\frac {1}{\sqrt {n}}}&{\frac {1}{\sqrt {n}}}\\{\frac {1}{\sqrt {2}}}&-{\frac {1}{\sqrt {2}}}&0&0&\cdots &0&0\\{\frac {1}{\sqrt {6}}}&{\frac {1}{\sqrt {6}}}&-{\frac {2}{\sqrt {6}}}&0&\cdots &0&0\\{\frac {1}{\sqrt {12}}}&{\frac {1}{\sqrt {12}}}&{\frac {1}{\sqrt {12}}}&-{\frac {3}{\sqrt {12}}}&\cdots &0&0\\\vdots &\vdots &\vdots &\vdots &&\vdots &\vdots \\{\frac {1}{\sqrt {n(n-1)}}}&{\frac {1}{\sqrt {n(n-1)}}}&{\frac {1}{\sqrt {n(n-1)}}}&{\frac {1}{\sqrt {n(n-1)}}}&\cdots &{\frac {1}{\sqrt {n(n-1)}}}&-{\frac {n-1}{\sqrt {n(n-1)}}}\end{pmatrix}}}
que és una matriu ortogonal, és a dir,
H 1 = H , {\displaystyle {\boldsymbol {H}}^{-1}={\boldsymbol {H}}',}
on H {\displaystyle {\boldsymbol {H}}'} denota la matriu transposada de H {\displaystyle {\boldsymbol {H}}} . Aquesta matriu té la següent propietat: sigui z = ( z 1 , , z n ) {\displaystyle {\boldsymbol {z}}=(z_{1},\dots ,z_{n})} (escriurem tots els vectors en columna) i
y = ( y 1 , , y n ) = H z . {\displaystyle {\boldsymbol {y}}=(y_{1},\dots ,y_{n})^{\prime }={\boldsymbol {Hz}}.}
Aleshores, tenim que
i = 1 n ( z i z ¯ ) 2 = i = 2 n y i 2 . ( 1 ) {\displaystyle \sum _{i=1}^{n}(z_{i}-{\overline {z}})^{2}=\sum _{i=2}^{n}y_{i}^{2}.\qquad (1)}
En efecte, d'una banda,
y 1 = 1 n i = 1 n z i = n z ¯ . {\displaystyle y_{1}={\frac {1}{\sqrt {n}}}\sum _{i=1}^{n}z_{i}={\sqrt {n}}\,{\overline {z}}.}
D'altra banda, desenvolupant els quadrats de l'esquerra de (1) s'obté
i = 1 n ( z i z ¯ ) 2 = i = 1 n z i 2 n ( z ¯ ) 2 = z z n ( z ¯ ) 2 . {\displaystyle \sum _{i=1}^{n}(z_{i}-{\overline {z}})^{2}=\sum _{i=1}^{n}z_{i}^{2}-n({\overline {z}})^{2}={\boldsymbol {z'z}}-n({\overline {z}})^{2}.}
El costat de la dreta de (1) és
i = 2 n y i 2 = i = 1 n y i 2 y 1 2 = y y y 1 2 = z H H z n ( z ¯ ) 2 = z z n ( z ¯ ) 2 , {\displaystyle \sum _{i=2}^{n}y_{i}^{2}=\sum _{i=1}^{n}y_{i}^{2}-y_{1}^{2}={\boldsymbol {y'y}}-y_{1}^{2}={\boldsymbol {z'H'Hz}}-n({\overline {z}})^{2}={\boldsymbol {z'z}}-n({\overline {z}})^{2},}
amb la qual cosa queda provada la igualtat (1).

Ara considerem el vector normal multidimensional Z = ( Z 1 , , Z n ) {\displaystyle {\boldsymbol {Z}}=(Z_{1},\dots ,Z_{n})'} , i sigui Y = ( Y 1 , , Y n ) {\displaystyle {\boldsymbol {Y}}=(Y_{1},\dots ,Y_{n})'} donat per

Y = H Z . {\displaystyle {\boldsymbol {Y}}={\boldsymbol {HZ}}.}
Per les propietats dels vectors normals multidimensionals, del fet que Z 1 , , Z n {\displaystyle Z_{1},\dots ,Z_{n}} són independents, totes amb llei N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} i que H {\displaystyle {\boldsymbol {H}}} és ortogonal, es dedueix que Y 1 , , Y n {\displaystyle Y_{1},\dots ,Y_{n}} són independents, totes amb llei N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} . Llavors,

i = 1 n ( Z i Z ¯ ) 2 = i = 2 n Y i 2 χ 2 ( n 1 ) . {\displaystyle \sum _{i=1}^{n}(Z_{i}-{\overline {Z}})^{2}=\sum _{i=2}^{n}Y_{i}^{2}\sim \chi ^{2}(n-1).}
La independència entre Z ¯ {\displaystyle {\overline {Z}}} i i = 1 n ( Z i Z ¯ ) 2 {\displaystyle \sum _{i=1}^{n}{\big (}Z_{i}-{\overline {Z}}{\big )}^{2}} es dedueix de les relacions
Z ¯ = 1 n Y 1 i i = 1 n ( Z i Z ¯ ) 2 = i = 2 n Y i 2 , {\displaystyle {\overline {Z}}={\frac {1}{\sqrt {n}}}\,Y_{1}\quad {\text{i}}\quad \sum _{i=1}^{n}(Z_{i}-{\overline {Z}})^{2}=\sum _{i=2}^{n}Y_{i}^{2},}

i de què Y 1 {\displaystyle Y_{1}} i ( Y 2 , , Y n ) {\displaystyle (Y_{2},\dots ,Y_{n})} són independents.

Relació amb altres distribucions

  • Si Q k χ 2 ( k ) {\displaystyle Q_{k}\sim \chi ^{2}(k)} , aleshores Q k {\displaystyle Q_{k}} té una distribució gamma Γ ( k 2 , 2 ) {\displaystyle \Gamma {\Big (}{\frac {k}{2}},2{\Big )}} .
  • Si Q k χ 2 ( k ) {\displaystyle Q_{k}\sim \chi ^{2}(k)} i c > 0 {\displaystyle c>0} , aleshores c Q k Γ ( k 2 , 2 c ) {\displaystyle c\,Q_{k}\sim \Gamma {\Big (}{\frac {k}{2}},2c{\Big )}} . En particular, per a θ > 0 {\displaystyle \theta >0} , tenim que θ 2 Q 2 k Γ ( k , θ ) {\displaystyle {\tfrac {\theta }{2}}Q_{2k}\sim \Gamma (k,\theta )} . Aquesta propietat és deguda a la propietat d'escala de la distribució gamma.
  • Relació amb la distribució de Poisson.[10]. Sigui Q k χ 2 ( k ) {\displaystyle Q_{k}\sim \chi ^{2}(k)} amb k {\displaystyle k} parell. Aleshores per a qualsevol a > 0 {\displaystyle a>0} ,

P ( Q k > a ) = P ( Y k 2 1 ) , {\displaystyle P(Q_{k}>a)=P(Y\leq {\frac {k}{2}}-1),}
on Y {\displaystyle Y} és una variable aleatòria amb una distribució de Poisson de paràmetre a / 2 {\displaystyle a/2} .

Prova
Escrivim m = k / 2 {\displaystyle m=k/2} . Llavors,
P ( Q k > a ) = 1 2 m Γ ( m ) a x m 1 e x / 2 d x . {\displaystyle P(Q_{k}>a)={\frac {1}{2^{m}\Gamma (m)}}\int _{a}^{\infty }x^{m-1}e^{-x/2}\,dx.}
Ara integrem per parts iteradament, començant per u = x m 1 {\displaystyle u=x^{m-1}} i e x / 2 d t = d v {\displaystyle e^{-x/2}\,dt=dv} .

Noteu que aquesta propietat és equivalent a la que es formula a la pàgina de la distribució de Poisson: Si Y {\displaystyle Y} és una variable amb distribució de Poisson de paràmetre λ {\displaystyle \lambda } , aleshores [11] per a n = 0 , 1 , 2 , {\displaystyle n=0,\,1,2,\dots } ,

P ( Y n ) = P ( Q 2 ( n + 1 ) > 2 λ ) , {\displaystyle P(Y\leq n)=P(Q_{2(n+1)}>2\lambda ),}

on Q 2 ( n + 1 ) χ 2 ( 2 ( n + 1 ) ) {\displaystyle Q_{2(n+1)}\sim \chi ^{2}{\big (}2(n+1){\big )}} .

  • Si Q χ 2 2 {\displaystyle Q\sim \chi _{2}^{2}} , aleshores Q {\displaystyle Q} té una distribució exponencial de paràmetre 1/2.
  • Si Q χ 2 k 2 {\displaystyle Q\sim \chi _{2k}^{2}} , aleshores Q {\displaystyle Q} té una distribució d'Erlang de paràmetres k {\displaystyle k} i 1/2.
  • Si X Erlang ( k , λ ) {\displaystyle X\sim \operatorname {Erlang} (k,\lambda )} (distribució d'Erlang) llavors 2 λ X χ 2 ( 2 k ) {\displaystyle 2\lambda X\sim \chi ^{2}(2k)} .
  • Si X Rayleigh ( 1 ) {\displaystyle X\sim \operatorname {Rayleigh} (1)\,} (distribució de Rayleigh) llavors X 2 χ 2 ( 2 ) {\displaystyle X^{2}\sim \chi ^{2}(2)\,} .
  • Si X Maxwell ( 1 ) {\displaystyle X\sim \operatorname {Maxwell} (1)\,} (distribució de Maxwell) llavors X 2 χ 2 ( 3 ) {\displaystyle X^{2}\sim \chi ^{2}(3)\,} .
  • Si Q 1 χ 2 ( k 1 ) {\displaystyle Q_{1}\sim \chi ^{2}(k_{1})\,} i Q 2 χ 2 ( k 2 ) {\displaystyle Q_{2}\sim \chi ^{2}(k_{2})\,} són independents, llavors Q 1 / ( Q 1 + Q 2 ) Beta ( k 1 2 , k 2 2 ) {\displaystyle Q_{1}/(Q_{1}+Q_{2})\sim \operatorname {Beta} ({\tfrac {k_{1}}{2}},{\tfrac {k_{2}}{2}})\,} (Distribució beta).
  • Si X U ( 0 , 1 ) {\displaystyle X\sim \operatorname {U} (0,1)\,} (distribució uniforme contínua) llavors 2 log ( X ) χ 2 ( 2 ) {\displaystyle -2\log(X)\sim \chi ^{2}(2)\,} .

Aplicacions

La distribució khi quadrat té moltes aplicacions en inferència estadística, per exemple en el test khi quadrat i en l'estimació de variàncies. També està involucrada en el problema d'estimar la mitjana d'una població normalment distribuïda i en el problema d'estimar el pendent d'una recta de regressió lineal, a través del seu paper en la distribució t de Student, i participa en tots els problemes d'anàlisi de variància, pel seu paper en la distribució F de Snedecor, que és la distribució del quocient de dues variables aleatòries de distribució khi-quadrat i independents. També té ús al contrast de k {\displaystyle k} poblacions amb els contrasts d'homogeneïtat i al d'independència.

Referències

  1. Johnson, Kotz i Balakrishnan, 1994, Chapter 18.
  2. 2,0 2,1 David, H. A. «Moments of Negative Order and Ratio-Statistics». Journal of the Royal Statistical Society. Series B (Methodological), 17, 1, 1955, pàg. 122–123. ISSN: 0035-9246.
  3. Seber, G. A. F.. Linear regression analysis. 2a edició. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13. ISBN 0-471-41540-5. 
  4. Fisher, Ronald A. Stastistical Methods for Social Workers. Edimburg: Oliver & Boyd, 1925, p. 63. 
  5. Johnson, Kotz i Balakrishnan, 1994, p. 426.
  6. Wilson, Edwin B.; Hilferty, Margaret M. «The Distribution of Chi-Square» (en anglès). Proceedings of the National Academy of Sciences, 17, 12, 1931-12, pàg. 684–688. DOI: 10.1073/pnas.17.12.684. ISSN: 0027-8424. PMC: PMC1076144. PMID: 16577411.
  7. Williams, D. Weighing the odds : a course in probability and statistics. Cambridge: Cambridge University Press, 2001, p. 164. ISBN 0-521-80356-X. 
  8. DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374. ISBN 0-201-64405-3. 
  9. Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 149. ISBN 978-0-470-22678-0. 
  10. Johnson, Kotz i Balakrishnan, 1994, p. 450.
  11. Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 162, formula (4.38). ISBN 0-471-54897-9. 

Bibliografia

  • Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions (en anglès). 1 1. 2a edició. Nova York: Wiley, 1994. ISBN 0-471-58495-9. 

Vegeu també

  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies