Odotusarvo

Odotusarvo on todennäköisyyslaskennassa ja tilastotieteessä satunnaisilmiön tuottamien lukujen odotettavissa oleva arvo. Numeerisia lukuarvoja tuottavia satunnaisilmiöitä kutsutaan satunnaismuuttujiksi. Satunnaismuuttujan tuottamat luvut ja niiden todennäköisyydet muodostavat yhdessä todennäköisyysjakauman. Odotusarvo on todennäköisyysjakauman ensimmäinen tunnusluku eli momentti.[1][2][3][4]

Keskiarvo ja odotusarvo samaistetaan usein toisiinsa, vaikka odotusarvo on todennäköisyyslaskennan käsite ja keskiarvo lukuihin liittyvä tilastotieteen käsite. Odotusarvo saadaan laskemalla keskiarvo äärettömän monesta, yhden satunnaismuuttujan tuottamasta luvusta. Se voidaan myös tulkita keskiarvoksi äärettömän monesta äärellisen kokoisesta otoskeskiarvosta. Odotusarvolla on sama yksikkö kuin satunnaismuuttujalla.[1][4][5][3]

Määritelmä ja merkinnät

Odotusarvo voidaan merkitä eri tavoilla E ( X ) = μ X = μ = X . {\displaystyle \operatorname {E} (X)=\mu _{X}=\mu =\langle X\rangle .} [5][4][2]

Matemaattisesti odotusarvo E ( X ) {\displaystyle \operatorname {E} (X)} määritellään diskreeteille ja jatkuville satunnaismuuttujille erikseen.

Diskreetti satunnaismuuttuja

Diskreetin satunnaismuuttujan X {\displaystyle X} saamien kaikkien arvojen joukkoa kutsutaan todennäköisyyslaskennassa perusjoukoksi ja se merkitään Ω = X = { x 1 , x 2 , , x n } . {\displaystyle \Omega =X=\{x_{1},x_{2},\dots ,x_{n}\}.} Kunkin arvon esiintymistodennäköisyyttä merkitään vastaavasti p 1 , p 2 ,  ja  p n . {\displaystyle p_{1},p_{2},\dots {\text{ ja }}p_{n}.} Näitä todennäköisyyksiä kutsutaan usein pistetodennäköisyyksiksi ja niitä saatetaan merkitä myös

p i = p ( x i ) = f X ( x i ) , {\displaystyle p_{i}=p(x_{i})=f_{X}(x_{i}),} [5]

jossa funktioita p ( x i ) {\displaystyle p(x_{i})} ja f X ( x i ) {\displaystyle f_{X}(x_{i})} kutsutaan pistetodennäköisyysfunktioiksi.

Diskreetin satunnaismuuttujan odotusarvo määritellään nyt (eri merkintätapoja käyttäen)

E ( X ) = i = 1 n x i p i = x i Ω x i p ( x i ) = x i X x i f X ( x i ) . {\displaystyle \operatorname {E} (X)=\sum _{i=1}^{n}x_{i}p_{i}=\sum _{x_{i}\in \Omega }x_{i}p(x_{i})=\sum _{x_{i}\in X}x_{i}f_{X}(x_{i}).} [2][3][6]

Esimerkkinä nopanheitto

Pisteluvun odotusarvo kuusitahoiselle nopalle, jonka kaikkien pistelukujen todennäköisyys on yhtä suuri, on

E ( X ) = 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 = 1 + 2 + 3 + 4 + 5 + 6 6 = 3 , 5 {\displaystyle \operatorname {E} (X)=1\cdot {\frac {1}{6}}+2\cdot {\frac {1}{6}}+3\cdot {\frac {1}{6}}+4\cdot {\frac {1}{6}}+5\cdot {\frac {1}{6}}+6\cdot {\frac {1}{6}}={\frac {1+2+3+4+5+6}{6}}=3{,}5} .[5][2]

Noppapelissä pelaaja voi odottaa etenevänsä pelilaudalla noin 3,5 askelta kierrosta kohti.[3]

Jatkuva satunnaismuuttuja

Jatkuvan satunnaismuuttujan X {\displaystyle X} saamien reaalilukuarvojen joukko muodostaa vähintään yhden yhtenäisen lukuvälin I {\displaystyle I} , joka on reaalilukujen osajoukko. Luvut I {\displaystyle I} muodostavat satunnaismuuttujan perusjoukon Ω {\displaystyle \Omega } ja se voidaan merkitä I = Ω R {\displaystyle I=\Omega \in \mathbb {R} } . Reaalilukuja ei voida luetella, joten yksittäiseen lukuun liittyvää todennäköisyyttäkään ei voida esittää luettelemalla. Sen sijaan jokaisen välin I {\displaystyle I} luvulle voidaan liittää lukuarvo käyttämällä funktiota. Tätä funktiota kutsutaan todennäköisyyslaskennassa tiheysfunktioksi. Tiheysfunktion arvot eivät ole suoraan todennäköisyyksiä, mutta sen avulla voidaan eri tapahtumille laskea ne.[5]

Jatkuvan satunnaismuuttujan tiheysfunktio on f X ( x ) {\displaystyle f_{X}(x)} ja tämän avulla määritellään satunnaismuuttujan odotusarvo

E ( X ) = x f X ( x ) d x {\displaystyle \operatorname {E} (X)=\int _{-\infty }^{\infty }xf_{X}(x)\,dx} . [5][2]

Yleisempi jatkuva määritelmä

Määritellään satunnaismuuttujan X : Ω R {\displaystyle X:\Omega \rightarrow \mathbb {R} } odotusarvo integraalina yli satunnaismuuttujan perusjoukon Ω {\displaystyle \Omega } todennäköisyysmitan P {\displaystyle P} suhteen

E ( X ) = Ω X d P {\displaystyle \operatorname {E} (X)=\int _{\Omega }X\,dP} . [7]

Tämä voidaan kirjoittaa satunnaismuuttujan X {\displaystyle X} kertymäfunktion F {\displaystyle F} suhteen Lebesgue–Stieltjes-integraalilla

E ( X ) = x d P ( X x ) = x d F ( x ) {\displaystyle \operatorname {E} (X)=\int _{-\infty }^{\infty }x\,dP(X\leq x)=\int _{-\infty }^{\infty }x\,dF(x)} . [7]

Satunnaismuuttujan funktion odotusarvo

Jos g ( x ) {\displaystyle g(x)} on mitallinen funktio, voidaan laskea sillekin odotusarvo E ( g ( X ) ) . {\displaystyle \operatorname {E} (g(X)).} Jos X {\displaystyle X} on diskreetti satunnaismuuttuja, on odotusarvo

E ( g ( X ) ) = x i X g ( x i ) f X ( x i ) . {\displaystyle \operatorname {E} (g(X))=\sum _{x_{i}\in X}g(x_{i})f_{X}(x_{i}).} [6][7]

ja jos se on jatkuva, saadaan odotusarvoksi

E ( g ( X ) ) = g ( x ) f X ( x ) d x {\displaystyle \operatorname {E} (g(X))=\int _{-\infty }^{\infty }g(x)f_{X}(x)\,dx} [7]

Tällä ajattelulla on mahdollista määrittää esimerkiksi origomomentteja E ( X 2 ) {\displaystyle \operatorname {E} (X^{2})\dots } E ( X n ) {\displaystyle \operatorname {E} (X^{n})} tai keskusmomentteja E ( ( X μ ) n ) . {\displaystyle \operatorname {E} ((X-\mu )^{n}).}

Ehdollinen odotusarvo

Satunnaismuuttujan X {\displaystyle X} ehdollinen odotusarvo alisigma-algebralla G F {\displaystyle {\mathcal {G}}\subset {\mathcal {F}}} on G {\displaystyle {\mathcal {G}}} -mitallinen satunnaismuuttuja E ( X | G ) {\displaystyle \mathrm {E} (X\,|\,{\mathcal {G}})} , jolle yhtälö

G E ( X | G ) d P = G X d P {\displaystyle \int _{G}\mathrm {E} (X\,|\,{\mathcal {G}})\,dP=\int _{G}X\,dP}

pätee kaikilla G G {\displaystyle G\in {\mathcal {G}}} . Satunnaismuuttujan X {\displaystyle X} ehdollinen odotusarvo ehdolla satunnaismuuttuja Y {\displaystyle Y} on E ( X | σ ( Y ) ) {\displaystyle \mathrm {E} (X\,|\,\sigma (Y))} , missä σ ( Y ) {\displaystyle \sigma (Y)} tarkoittaa satunnaismuuttujan Y {\displaystyle Y} virittämää sigma-algebraa.

On huomattava, että ehdollinen odotusarvo on satunnaismuuttuja, eli funktio ehdollistettavasta muuttujasta. Ehdollinen odotusarvo ehdolla G G {\displaystyle G\in {\mathcal {G}}} on E ( X | G ) ( ω ) {\displaystyle \mathrm {E} (X\,|\,{\mathcal {G}})(\omega )} , missä ω G {\displaystyle \omega \in G} on reaaliluku.

Ominaisuuksia

Todennäköisyysmassalla tarkoitetaan todennäköisyyslaskennassa pistetodennäköisyysfunktion pylväikköä tai tiheysfunktion kuvaajan alle jäävää aluetta. Odotusarvo on sellainen satunnaismuuttujan arvo, joka vastaa tämän alueen painopistettä. Symmetrisen jakauman keskikohta on myös jakauman odotusarvo.[5]

Satunnaismuuttujan X {\displaystyle X} , jonka ulostuloina on vain vakion a {\displaystyle a} arvoja, odotusarvo on

E [ X ] = a . {\displaystyle \operatorname {E} [X]=a.} [4]

Tästä seuraa myös, että E [ E [ X ] ] = E [ X ] = a . {\displaystyle \operatorname {E} [\operatorname {E} [X]]=\operatorname {E} [X]=a.} [5]

Odotusarvon olemassaolo

Todennäköisyysjakaumalla ei välttämättä ole olemassa odotusarvoa, jos jakauma ei toteuta niin sanottua itseistä satunnaismuuttujan odotusarvoa (itseisarvo)

x i X | x i | p ( x i ) < {\displaystyle \sum _{x_{i}\in X}|x_{i}|p(x_{i})<\infty }

tai jatkuvassa tapauksessa

| x | f X ( x ) d x < . {\displaystyle \int _{-\infty }^{\infty }|x|f_{X}(x)\,dx<\infty .} [5][6][7]

Satunnaismuuttujan sanotaan olevan integroituva, jos sen odotusarvo on äärellinen eli E ( X ) < {\displaystyle \mathrm {E} (X)<\infty } . Jos se ei ole integroituva, on se vielä kvasi-integroituva, jos E ( max { X , 0 } ) < {\displaystyle \mathrm {E} (\max\{X,0\})<\infty } tai E ( min { X , 0 } ) < {\displaystyle \mathrm {E} (\min\{-X,0\})<\infty } .

Summat ja lineaarikombinaatiot

Seuraaville satunnaismuuttujille X , Y {\displaystyle X,Y} ja { X 1 , X 2 , , X n } {\displaystyle \{X_{1},X_{2},\dots ,X_{n}\}} sekä reaaliluvuille a , b {\displaystyle a,b} ja { a 1 , a 2 , , a n } {\displaystyle \{a_{1},a_{2},\dots ,a_{n}\}} voidaan johtaa seuraavia tuloksia.

Odotusarvo on lineaarinen operaattori, jolloin suorien summien odotusarvo on

E ( X ± Y ) = E ( X ) ± E ( Y ) {\displaystyle \operatorname {E} (X\pm Y)=\operatorname {E} (X)\pm \operatorname {E} (Y)} [5]

ja lineaarikombinaatioiden odotusarvo on

E ( a X + b Y ) = a E ( X ) + b E ( Y ) . {\displaystyle \operatorname {E} (aX+bY)=a\operatorname {E} (X)+b\operatorname {E} (Y).} [5][7]

Tällöin useamman satunnaismuuttujan tapauksissa on myös

E ( X 1 + X 2 + + X n ) = E ( X 1 ) + E ( X 2 ) + + E ( X n ) {\displaystyle \operatorname {E} (X_{1}+X_{2}+\dots +X_{n})=\operatorname {E} (X_{1})+\operatorname {E} (X_{2})+\dots +\operatorname {E} (X_{n})} [4]

ja

E ( a 1 X 1 + a 2 X 2 + + a n X n ) = a 1 E ( X 1 ) + a 2 E ( X 2 ) + + a n E ( X n ) . {\displaystyle \operatorname {E} (a_{1}X_{1}+a_{2}X_{2}+\dots +a_{n}X_{n})=a_{1}\operatorname {E} (X_{1})+a_{2}\operatorname {E} (X_{2})+\dots +a_{n}\operatorname {E} (X_{n}).} [4]

Luvun lisääminen satunnaismuuttujien arvoihin vaikuttaa myös sen odotusarvoon

E ( X + a ) = E ( X ) + E ( a ) = E ( X ) + a . {\displaystyle \operatorname {E} (X+a)=\operatorname {E} (X)+\operatorname {E} (a)=\operatorname {E} (X)+a.}

Satunnaismuuttujan ensimmäinen keskusmomentti on aina nolla, koska

E ( X μ X ) = E ( X ) E ( μ X ) = E ( X ) μ X = E ( X ) E ( X ) = 0 , {\displaystyle \operatorname {E} (X-\mu _{X})=\operatorname {E} (X)-\operatorname {E} (\mu _{X})=\operatorname {E} (X)-\mu _{X}=\operatorname {E} (X)-\operatorname {E} (X)=0,}

jos μ X = E ( X ) . {\displaystyle \mu _{X}=\operatorname {E} (X).}

Tulot

Riippumattomien satunnaismuuttujien tulon odotusarvo on kahden satunnaismuuttujan tapauksessa

E ( X Y ) = E ( X ) E ( Y ) {\displaystyle \operatorname {E} (X\cdot Y)=\operatorname {E} (X)\cdot \operatorname {E} (Y)}

ja usean satunnaismuuttujan tapauksessa

E ( X 1 X 2 X n ) = E ( X 1 ) E ( X 2 ) E ( X n ) . {\displaystyle \operatorname {E} (X_{1}\cdot X_{2}\dots X_{n})=\operatorname {E} (X_{1})\cdot \operatorname {E} (X_{2})\dots \operatorname {E} (X_{n}).} [8]

Riippuvassa tapauksessa

E ( X Y ) = E ( X ) E ( Y ) + σ ( X , Y ) . {\displaystyle \operatorname {E} (X\cdot Y)=\operatorname {E} (X)\cdot \operatorname {E} (Y)+\sigma (X,Y).}

Lisäksi jos X 0 {\displaystyle X\geq 0} , niin E ( X ) 0 {\displaystyle \operatorname {E} (X)\geq 0} , ja yleisemmin jos X Y {\displaystyle X\geq Y} , niin E ( X ) E ( Y ) {\displaystyle \operatorname {E} (X)\geq \operatorname {E} (Y)} .

Ehdolliselle odotusarvolle pätee niin sanottu iteroidun odotusarvon laki

E ( X ) = E Y ( E X ( X | Y ) ) . {\displaystyle \operatorname {E} (X)=\operatorname {E} _{Y}\left(\operatorname {E} _{X}(X|Y)\right).}

Populaatio- ja otoskeskiarvo

Odotusarvo on satunnaismuuttujan tärkein tunnusluku. Otoskeskiarvolla tarkoitetaan suppean otoksen keskiarvoa suuremmasta populaatiosta. Sen avulla on mahdollista selvittää odotusarvon suuruus likimääräisesti, mutta kuitenkin "edullisesti". Keskiarvoa on tällöin pidettävä odotusarvon estimaattorina.[9]

Kun lasketaan otoskeskiarvojen odotusarvoa, saadaan edellisten päättelysääntöjen avulla

E ( x ¯ ) = E ( 1 n i = 1 n x i ) = 1 n i = 1 n E ( x i ) = 1 n i = 1 n E ( X ) = 1 n n E ( X ) = E ( X ) . {\displaystyle \operatorname {E} ({\bar {x}})=\operatorname {E} \left({\frac {1}{n}}\sum _{i=1}^{n}x_{i}\right)={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} (x_{i})={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} (X)={\frac {1}{n}}n\operatorname {E} (X)=\operatorname {E} (X).}

Tämä tarkoittaa sitä, että keskiarvon lausekkeella saadaan keskimäärin odotusarvon tuloksia eli estimaattori on harhaton.[10]

Keskiarvolla on toinen ominaisuus, joka liittyy estimointiin. Kun keskiarvon laskemiseksi kasvataetaan otoksen lukumäärää (otoksen ulostulot ovat riippumattomia toisistaan), käy keskiarvon varianssin

σ 2 ( 1 n i = 1 n x i ) = 1 n 2 σ 2 ( i = 1 n x i ) = 1 n 2 i = 1 n σ 2 ( x i ) = 1 n 2 i = 1 n σ 2 = σ 2 n . {\displaystyle \sigma ^{2}\left({\frac {1}{n}}\sum _{i=1}^{n}x_{i}\right)={\frac {1}{n^{2}}}\,\sigma ^{2}\left(\sum _{i=1}^{n}x_{i}\right)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sigma ^{2}(x_{i})={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sigma ^{2}={\frac {\sigma ^{2}}{n}}.}

Keskiarvo on tarkentuva odotusarvon estimaattori, koska varianssi pienenee kun otoksen lukumäärä n {\displaystyle n} kasvaa.[10]

Suurten lukujen lakien mukaan satunnaismuuttujan keskiarvo toistokokeessa on sen odotusarvo ja keskiarvo on siten odotusarvon harhaton ja tarkentuva estimaattori.

Lähteet

  1. a b Etälukio: Todennäköisyysjakautuma ja satunnaisilmiön odotusarvo (Arkistoitu – Internet Archive), Opetushallitus
  2. a b c d e Kivelä, Simo K.: Jakauman tunnusluvut, M niin kuin matematiikka, 10.8.2000
  3. a b c d Alatupa, Sami et al.: Pitkä Sigma 6, s. 66−79. (lukion pitkän matematiikan oppikirja). Helsinki: Otava, 2010. ISBN 978-951-31-5343-4.
  4. a b c d e f Weisstein, Eric W.: Expectation Value (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  5. a b c d e f g h i j k Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s. 155−165, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  6. a b c Emet, Stefan: Johdatus todennäköisyyslaskentaan ja tilastotieteeseen, s. 17−20, Matematiikan ja tilastotieteen laitos, Turun Yliopisto, 2014
  7. a b c d e f Ruskeapää, Heikki: Todennäköisyyslaskenta I(luentomoniste), Turun Yliopisto, 2012
  8. Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s. 204−225, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  9. Emet, Stefan: Johdatus todennäköisyyslaskentaan ja tilastotieteeseen, s. 41−46, Matematiikan ja tilastotieteen laitos, Turun Yliopisto, 2014
  10. a b Weisstein, Eric W.: Arithmetic Mean (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)