Generell lineær modell

Den generelle lineære modellen eller multivariat regresjonsmodel er en statistisk lineær modell. Den kan bli skevet som[1]

Y = X B + U , {\displaystyle \mathbf {Y} =\mathbf {X} \mathbf {B} +\mathbf {U} ,}

hvor Y {\displaystyle Y} er en matrise med multivariate målingsserier (hver kolonne er et målingssett på en av de avhengige variablene), X {\displaystyle X} er en matrise med observasjoner av uavhengige variabler som kan være en designmatrise (hver kolonne er et sett observasjoner på en av de avhengige variablene), B {\displaystyle B} er en matrise som inneholder parametere som vanligvis estimeres og U {\displaystyle U} er en matrise som inneholder feil (støy). Feilene er vanligvis antatt å være ukorrelerte på tvers av målinger og følger en multivariat normalforderling. Hvis feilene ikke følger en multivariat normalfordeling kan generaliserte lineære modeller bli brukt for å slakke antakelsene om Y {\displaystyle Y} og U {\displaystyle U} .

Den generelle lineære modellen innlemmer flere ulike statistiske modeller: ANOVA, ANCOVA, MANOVA, MANCOVA, vanlig lineær regresjon, t-tester og F-tester. Den generelle lineære modellen er en generalisering av en multippel lineær regresjonsmodell i tilfeller med flere enn en avhengig variabel. Hvis Y {\displaystyle Y} , B {\displaystyle B} og U {\displaystyle U} var kolonnevektorer ville matriselikningen over forestillt en multippel lineær regresjon.

Hypotesetester med den generelle lineære modellen kan bli gjort på to måter: multivariat eller som flere uavhengige univariate tester. I multivariate tester er Y {\displaystyle Y} s kolonner testet sammen, mens i univariate tester er Y {\displaystyle Y} s kolonner testet separat, i.e. som flere univariate tester med den samme designmatrisen.

Multippel lineær regresjon

Multippel lineær regresjon er en generalisering av en lineær regresjon ved å vurdere flere enn én avhengig variabel, og et spesielt tilfelle i formingen av generelle lineære modeller ved å begrense antallet avhengige variabler til en. Den grunnleggende modellen for lineær regresjon er

Y i = β 0 + β 1 X i 1 + β 2 X i 2 + + β p X i p + ϵ i . {\displaystyle Y_{i}=\beta _{0}+\beta _{1}X_{i1}+\beta _{2}X_{i2}+\ldots +\beta _{p}X_{ip}+\epsilon _{i}.}

I formelen over vurderer vi n observasjoner av en avhengig variabel og p uavhengige variabler. Dermed er Y i {\displaystyle Y_{i}} den i {\displaystyle i} -ende observasjonen av den avhengige variabelen, X i j {\displaystyle X_{ij}} den i {\displaystyle i} -ende observasjonen av den j {\displaystyle j} -ende uavhengige variabelen, j = 1 , 2 , . . . , p {\displaystyle j=1,2,...,p} . Verdiene β j {\displaystyle \beta _{j}} representerer parametrene som skal estimeres, og ϵ i {\displaystyle \epsilon _{i}} er den i {\displaystyle i} -ende uavhengige, identiskfordelte normalfeilen.

Bruksområder

En generell lineær modells bruksområde kan for eksempel fremkomme i analysen av hjernescanninger i forskningseksperimenter, hvor Y {\displaystyle Y} inneholder data fra hjernescannere og X {\displaystyle X} inneholder eksperimentelle designvariabler og -forvekslinger. Den er vanligvis testet univariat, og er ofte henvist til som statistisk parameterkartlegging.[2]

Se også

  • Bayesiansk multivariat lineær regresjon
  • Sammenlikning av generelle og generaliserte lineære modeller

Referanser

  1. ^ K. V. Mardia, J. T. Kent and J. M. Bibby (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5. 
  2. ^ K.J. Friston; A.P. Holmes; K.J. Worsley; J.-B. Poline; C.D. Frith; R.S.J. Frackowiak (1995). «Statistical Parametric Maps in functional imaging: A general linear approach». Human Brain Mapping. 2 (4): 189–210. doi:10.1002/hbm.460020402. 

Litteratur

  • Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third utg.). New York: Springer. ISBN 0-387-95361-2. 
  • Wichura, Michael J. (2006). The coordinate-free approach to linear models. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge: Cambridge University Press. s. xiv+199. ISBN 978-0-521-86842-6. MR 2283455. 
  • Rawlings, John O.; Pantula, Sastry G.; Dickey, David A., red. (1998). «Applied Regression Analysis». Springer Texts in Statistics. doi:10.1007/b98890. 
  • v
  • d
  • r
Statistikk
Deskriptiv statistikk
Kategoriske variabler
Målenivå
  • Nominalnivå
  • Ordinalnivå
Kontinuerlige variabler
Målenivå
  • Intervallnivå
  • Skalanivå
Sentralitet
Spredning
Moment
Statistiske grafer
Statistisk inferens
og
hypotesetest
Inferens
Forsøksdesign
Utvalgsstørrelse
  • Statistisk styrke
  • Effektstørrelse
  • Standardfeil
  • Momentmetodem
  • Tetthetsestimering
Statistiske tester
Overlevelsesanalyse
  • Overlevelsesfunksjon
  • Kaplan–Meier
  • Logrank-test
  • Feilrate
  • Cox-regresjon
Korrelasjon
og
regresjonsanalyse
Korrelasjon
Lineær regresjon
  • Enkel lineær regresjon
  • Minste kvadratsum
  • Generell lineær modell
  • ANOVA
  • ANCOVA
Ikke-standard
  • Ikke-lineær regresjon
  • Ikke-parametrisk
  • Semi-parametrisk
  • Robust
Non-normal feilledd
  • Generalisert lineær modell
  • Binomisk
  • Poisson
  • Logistisk
Multivariat statistikk
Tidsserieanalyse
  • Dekomponering
  • Trendestimering
  • Box–Jenkins
  • ARMA-modeller
  • Spektraltetthetsestimering
  • Kategori
  • Portal