Kuvassa tapauksiin liittyvien kahden satunnaismuuttujan arvojen mukaan tulostetut pisteet muodostavat kuvion, joka on selvästi jotain muuta kuin pyöreä pistepilvi. Sen mukaan satunnaismuuttujien arvot voisivat piippua toistaan eli niillä olisi kovarianssia.
Kovarianssi on todennäköisyyslaskennassa ja tilastotieteessä kahden satunnaismuuttujan välisen riippuvuuden mitta. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Yksinkertaistaen voidaan havainnollistaa, että kovarianssi saa positiivisen arvon, kun satunnaismuuttujan arvot jäävät samalle puolelle odotusarvoihinsa nähden, ja vastaavasti negatiivisen arvon, kun niiden arvot jäävät eri puolille odotusarvoihinsa nähden. Kovarianssi on yhteisjakauman toinen keskusmomentti, jonka yksiköksi eli dimensioksi tulee kummankin satunnaismuuttujan yksiköiden tulo. Momentin käsitteeseen liittyy tulkinta, että kovarianssi on niin sanotun yhteisjakauman "todennäköisyysmassan painopisteen" ympärillä tapahtuvan vaihtelun mitta. Korrelaatio on kovarianssin normalisoitu tunnusluku, joka on puolestaan yksikötön.[1]
Todennäköisyyslaskennassa kovarianssi on yhteisjakauman tunnusluku, kun taas tilastolaskennassa kovarianssi on todennäköisyyslaskennan tunnusluvun estimaatti.
Sisällys
1Määritelmä ja merkinnät
1.1Diskreetit satunnaismuuttujat
1.2Jatkuvat satunnaismuuttujat
2Ominaisuuksia
2.1Rinnakkaiskaavan johtaminen
2.2Riippumattomuus
2.3Arvojoukko
2.4Päättelysääntöjä
3Tilastollinen kovarianssi
4Satunnaisvektorit
5Korrelaatiokerroin
6Katso myös
7Lähteet
Määritelmä ja merkinnät
Matemaattisesti kovarianssi on määritelty kahden reaaliarvoisen satunnaismuuttujan ja avulla
missä ja ovat vastaavasti satunnaismuuttujien odotusarvot. Kovarianssi voidaan merkitä erilaisilla vaihtoehtoisilla tavoilla, kuten esimerkiksi
Yleisessä tilanteessa satunnaismuuttujat ovat toisistaan riippuvia jossakin mielessä. Silloin kovarianssi voidaan kehittää edelleen hyödyntämällä odotusarvo-operaattorin tunnetut ominaisuudet:[1]
Riippumattomuus
Jos satunnaismuuttujat ovat riippumattomia, saadaan odotusarvoksi
Yleisen kovarianssin kehitetystä lausekkeesta tulee silloin
Siten, jos satunnaismuuttujat ovat riippumattomia toisistaan, saadaan kovarianssiksi nolla. Päinvastainen ei pidä aina paikkaansa, sillä kovarianssin ollessa nolla, ei satunnaismuuttujat aina ole riippumattomia toisistaan.[2][1]
Arvojoukko
Kovarianssin yksikkö määräytyy satunnaismuuttujien tulosta. Koska korrelaation arvo jää välille , saadaan kovarianssin arvolle väli , missä on keskihajontojen tulo.
Päättelysääntöjä
Kovarianssille voidaan johtaa seuraavia laskusääntöjä ( ovat reaalivakioita):
missä otoksen suuruus on ja otoksen muuttujien keskiarvot ovat ja . Usein kuitenkin jaetaan summa otoksen suuruutta yhtä pienemmällä luvulla (vapausaste)
Kun X ja Y ovat n- ja m-ulotteisia pystyvektoreita, n x m-ulotteinen kovarianssimatriisi on määritelty:
Matriisit cov(X,Y) ja cov(Y,X) ovat toistensa transpooseja. Kun X on vektori, matriisia cov(X,X) sanotaan X:n kovarianssimatriisiksi tai pidemmin varianssi-kovarianssi-matriisiksi.[5]
Korrelaatiokerroin
Kovarianssilla voidaan mitata satunnaismuuttujien riippuvuuksia, mutta satunnaismuuttujien keskihajonnat vaikuttavat myös kovarianssin arvoon. Tuloksesta voidaan puhdistaa keskihajontojen vaikutukset jakamalla kovarianssi niillä, jolloin saadaan uusi riippuvuuden mitta korrelaatiokerroin