Painotettu aritmeettinen keskiarvo

Painotettu aritmeettinen keskiarvo on matematiikassa ja tilastotieteessä yleinen menetelmä laskea lukujoukolle tai lukujonolle keskiarvo siten, että tietyt lukujoukon luvut vaikuttavat tulokseen enemmän kuin muut luvut. Jokaiseen lukuarvoon liitetään painokerroin, joka on suuri, jos luku on tarkastelun kannalta tärkeä, ja pieni, jos se taas on vähemmän tärkeä. Monesti painokertoimet määräytyvät fysikaalisten lainalaisuuksien perusteella, joskus painokertoimet määräytyvät etäisyyteen perustuvasta ajattelusta, ja parhaimmissa menetelmissä painokertoimet määräytyvät menetelmällä, joka antaa parhaan tilastollisen vastaavuuden.

Lukujoukon luvut ovat yleensä otos tutkittavana olevasta mitatusta ilmiöstä ja tarkoituksena on määrittää tutkittavaan ilmiöön liittyvä lukuarvo mahdollisimman tarkasti. Tällöin painokertoimien määräytymisessä huomioidaan ilmiön luonnollisia ominaisuuksia. Tällainen tarkoitus tekee painotetusta keskiarvosta estimaattorin. Estimaattorilla tarkoitetaan interpolaatiomenetelmää, joka pyrkii tuottamaan mahdollisimman hyviä luonnon ilmiötä seuraavia lukuarvoja. Painokertoimien määrittämiseen löytyy lukuisia strategioita.

Esimerkki

Painokertoimia käytetään, kun havainnoilla on erisuuri vaikutus tutkittavan ilmiön kannalta. Esimerkki: haluamme selvittää tankatun bensiinin keskimääräisen hinnan Suomessa ns. otantamenetelmällä, eli selvitämme bensiinin hinnan vain joillakin asemilla. Tällöin kannattaa myös selvittää kyseisen aseman myymä bensiinin määrä esimerkiksi vuodessa. Kun nyt myyntihintaa (havainnot x i {\displaystyle x_{i}} ) painotetaan myyntimäärillä (painot w i {\displaystyle w_{i}} ), on tulos tarkempi. Painotus ehkäisee sen, että esimerkiksi hyvin kallista hintaa pitävän aseman tiedot eivät vääristä lopputulosta, jos kyseisellä asemalla ei juuri kukaan käy tankkaamassa.

Määritelmä

Määritetään lukujoukon { x 1 , x 2 , x 3 , , x n } {\displaystyle \{x_{1},x_{2},x_{3},\dots ,x_{n}\}} painotettu aritmeettinen keskiarvo, kun käyttöön on saatu eräällä tavalla määräytyneet painokertoimet { λ 1 , λ 2 , λ 3 , , λ n } . {\displaystyle \{\lambda _{1},\lambda _{2},\lambda _{3},\dots ,\lambda _{n}\}.} Kunkin lukuarvo x i {\displaystyle x_{i}} ja λ i {\displaystyle \lambda _{i}} , joilla on sama indeksi i, liittyvät toisiinsa. Silloin painotettu keskiarvo x ¯ {\displaystyle {\bar {x}}} kirjoitetaan

x ¯ = λ 1 x 1 + λ 2 x 2 + λ 3 x 3 + + λ n x n = i = 1 n λ i x i . {\displaystyle {\bar {x}}=\lambda _{1}x_{1}+\lambda _{2}x_{2}+\lambda _{3}x_{3}+\dots +\lambda _{n}x_{n}=\sum _{i=1}^{n}\lambda _{i}x_{i}.} [1][2]

Monissa tapauksissa vaaditaan, että painokertoimet ovat kaikki positiivisia tai ainakin ei-negatiivisia. Tällä yritetään varmistaa, että keskiarvo pysyy halutuissa rajoissa. Silloin painotettu aritmeettinen keskiarvo määritellään [2]

x ¯ = w 1 x 1 + w 2 x 2 + + w n x n w 1 + w 2 + + w n {\displaystyle {\bar {x}}={\frac {w_{1}x_{1}+w_{2}x_{2}+\dots +w_{n}x_{n}}{w_{1}+w_{2}+\dots +w_{n}}}}

ja osittelulakia soveltamalla yksittäisen painokertoimen arvoksi saadaan

λ i = w i w 1 x 1 + w 2 x 2 + + w n x n . {\displaystyle \lambda _{i}={\frac {w_{i}}{w_{1}x_{1}+w_{2}x_{2}+\dots +w_{n}x_{n}}}.}

Näiden painokertoimien summaksi saadaan yksi eli

λ 1 + λ 2 + + λ n = i = 1 n λ i = 1 , {\displaystyle \lambda _{1}+\lambda _{2}+\dots +\lambda _{n}=\sum _{i=1}^{n}\lambda _{i}=1,} [2] (normeerausehto)

jolloin tilastollisesti keskiarvon odotusarvoksi saadaan sama arvo kuin otoksen odotusarvo populaatiossa.[1][3]

Vielä yleisemmässä tapauksessa painokertoimet voivat olla sekä positiivisia tai negatiivisia reaalilukuja. Tämän painotetun aritmeettisen keskiarvon odotusarvo ei enää ole sama kuin populaation odotusarvo, ellei normeerausehto ole voimassa. Kehittyneissä menetelmissä painokertoimiin vaikuttaa muitakin tilastollisisa ehtoja, jolloin keskiarvon tulokset noudattavat populaation muita ominaisuuksia.

Käyttöesimerkkejä

Aritmeettinen keskiarvo

Artimeettisessa keskiarvossa kukin lukuarvo huomioidaan tasa-arvoisesti keskiarvoa määritettäessä. Niillä kaikilla on siksi yhtäsuuret painokertoimet. Tämän huomaa, kun modifioi keskiarvon lauseketta hieman

x ¯ = x 1 + x 2 + + x n n = x 1 n + x 2 n + + x n n = 1 n x 1 + 1 n x 2 + + 1 n x n , {\displaystyle {\bar {x}}={\frac {x_{1}+x_{2}+\dots +x_{n}}{n}}={\frac {x_{1}}{n}}+{\frac {x_{2}}{n}}+\dots +{\frac {x_{n}}{n}}={\frac {1}{n}}x_{1}+{\frac {1}{n}}x_{2}+\dots +{\frac {1}{n}}x_{n},}

missä

λ i = 1 n . {\displaystyle \lambda _{i}={\frac {1}{n}}.}

Koululaisen eri oppiaineissa saamat tärkeimmät arvosanat voidaan sisällyttää keskiarvoon, joka lasketaan aritmeettisena keskiarvona. Näin oppilaalle saadaan yksittäinen tilastollinen vertailuarvo, jolla hänen suoritustaan voidaan verrata muihin oppilaisiin.

Frekvenssikeskiarvo

Frekvenssikeskiarvo on itse asiassa tavallinen aritmeettinen keskiarvo, jossa jonkin luvun toistuva esiintyminen lausekkeessa yksinkertaistetaan muuttamalla sen summat kertolaskuksi. Kerroin on silloin frekvenssi (ylin esimerkki), joita lasketaan luokka-aineistojen ja luokiteltujen aineistojen lukuarvoille. Vertaamalla painotettua keskiarvoa ja frekvenssikeskiarvoa, voidaan myös suhteellisten frekvenssien todeta olevan painokertoimia. Painokertoimet ovat suhteelliset frekvenssit [4]

x ¯ = f 1 x 1 + f 2 x 2 + + f n x n n = f 1 n x 1 + f 2 n x 2 + + f n n x n , {\displaystyle {\bar {x}}={\frac {f_{1}x_{1}+f_{2}x_{2}+\dots +f_{n}x_{n}}{n}}={\frac {f_{1}}{n}}x_{1}+{\frac {f_{2}}{n}}x_{2}+\dots +{\frac {f_{n}}{n}}x_{n},}

missä

λ i = f i n . {\displaystyle \lambda _{i}={\frac {f_{i}}{n}}.}

Painojen käyttö

Luonnontieteellisissä tapauksissa käytetään painotettuja artitmeettisiä keskiarvoja laskettaessa esimerkiksi tiheyksiä ja painopisteitä. Mekaniikassa sekoite voidaan ajatella joukoksi eritiheyksisiä ainesosia, joiden painokertoimet ovat ainesosien tilavuuksia. Kun painokerroin (tilavuus, V i {\displaystyle V_{i}} ) kerrotaan ainesosan (tiheys, ρ i {\displaystyle \rho _{i}} ) kanssa, saadaan tulokseksi massa ( m i = ρ i V i {\displaystyle m_{i}=\rho _{i}V_{i}} ). Kun massojen summa jaetaan tilavuuksien summalla, saadaan tulokseksi tiheys. Sekoituksen tiheys on siten

ρ = ρ 1 V 1 + ρ 2 V 2 + + ρ n V n V 1 + V 2 + + V n = m 1 + m 2 + + m n V = m V {\displaystyle \rho ={\frac {\rho _{1}V_{1}+\rho _{2}V_{2}+\dots +\rho _{n}V_{n}}{V_{1}+V_{2}+\dots +V_{n}}}={\frac {m_{1}+m_{2}+\dots +m_{n}}{V}}={\frac {m}{V}}}

ja painokertoimet ovat λ i = V i V 1 + V 2 + + V n = V i V . {\displaystyle \lambda _{i}={\frac {V_{i}}{V_{1}+V_{2}+\dots +V_{n}}}={\frac {V_{i}}{V}}.} Staattisessa mekaniikassa levyn painopisteen x-koordinaatti määritellään palojensa painopisteiden painotettuna keskiarvona x 0 = m i x i m i {\displaystyle x_{0}={\frac {\sum {m_{i}x_{i}}}{\sum {m_{i}}}}} ja y-koordinaatti y 0 = m i y i m i . {\displaystyle y_{0}={\frac {\sum {m_{i}y_{i}}}{\sum {m_{i}}}}.}

Joissakin oppilaitoksissa vaaditaan tärkeiden oppiaineiden painotetun keskiarvon ilmoittamista hakulomakkeessa. Esimerkiksi Helsingin luonnontiedelukiossa painot ovat matematiikassa ( w i = 3 {\displaystyle w_{i}=3} ), fysiikassa, kemiassa, maantiedossa ja biologiassa ( w i = 1 , 5 {\displaystyle w_{i}=1{,}5} ) ja muissa aineissa ( w i = 1 {\displaystyle w_{i}=1} ).[5]

Liukuva keskiarvo

Aikasarjoissa painotettuja keskiarvoja kutsutaan liukuviksi keskiarvoiksi. Siinä tarkasteltavat luvut x t i {\displaystyle x_{t-i}} on järjestetty aikajärjestykseen, jolloin uusimmat luvut ajatellaan vaikuttavan tulevaisuuden arvoihin eniten. Kun tulevaisuuden lukuja x t + j {\displaystyle x_{t+j}} estimoidaan, annetaan uusille lukuarvoille eniten painoa, näitä vanhemmille pieniä kertoimia ja tiettyä viivettä vanhemmille luvuille painokerroin on tasaantunut nollaksi. Tällainen liukuva keskiarvo estimaatille y t {\displaystyle y_{t}} voisi olla

y t = 0 , 45 x t 1 + 0 , 35 x t 2 + 0 , 15 x t 3 + 0 , 05 x t 4 . {\displaystyle y_{t}=0{,}45x_{t-1}+0{,}35x_{t-2}+0{,}15x_{t-3}+0{,}05x_{t-4}.}

Tässäkin esimerkissä painokertoimien summa on yksi, mutta on myös perusteltua vaatia summan olevan muutakin kuin yksi. Kun summa on yli tai alle yksi, ei liukuvaa keskiarvoa voi enää pitää painotettuna keskiarvona.

Katso myös

Painotettuja artimeettisia keskiarvoja käytetään muun muassa:

Lähteet

  1. a b Internetix: Aritmeettinen keskiarvo
  2. a b c David Terr: Weighted Mean (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
  3. Vedenjuoksu, Tero: Indeksiteoria[vanhentunut linkki], Oulun yliopisto
  4. Tilastokeskus: Keskiluvut
  5. Helsingin luonnontiedelukio: Opiskelijavalinta luonnontiedelinjalle (Arkistoitu – Internet Archive), 2014