Regresjonsanalyse

Regresjonsanalyse er innen statistikk en kvantitativ analyse av sammenhenger mellom en avhengig variabel og en eller flere uavhengige variabler. I motsetning til korrelasjonsanalyse som kun påviser hvorvidt det er korrelasjon mellom variabler, så kan regresjonsanalyse vise i hvilken grad en variabel samvarierer med en annen variabel. Man skiller ofte mellom lineær regresjon og ikke-lineær regresjon. Regresjonsanalyse brukes mye innenfor statsvitenskap og medisin.

En modell med en enkel forklaringsvariabel (univariat modell) kan beskrives som Y = α + βX med følgende komponenter:

  • Y = Effektvariabelen som blir gitt av vår modell.
  • α (alfa) = Konstant. Dette er verdien Y vil ha dersom X = 0, og således skjæringspunktet på y-aksen.
  • β (beta) = Stigningstallet, eller også kalt helningskoeffisienten. β sier hvor mye i gjennomsnitt verdien til Y øker eller avtar med en enhets endring i X.

I denne modellen er det gitt at kun X (med α og β som koeffisienter) forklarer Y. En slik modell kalles deterministisk. Regresjonsanalysen når den er ikke-deterministisk: Y=α+βX+e, hvor e er et restledd som tar med alle variasjoner som resten av modellen (variabelen X) ikke forklarer. En modell med flere forklaringsvariabler (X1, X2 ...Xk) kalles en multivariat modell.

I matematikk betegner begrepet regresjon eller mer nøyaktig regresjonsanalyse, metoder for kurvetilpasning av innsamlede data. Kurvetilpasningen kan skje i en eller flere dimensjoner, og dataene inneholder i de fleste tilfellene målefeil. Kurvetilpasningen kan uttrykkes matematisk som:

y = f ( x ) + e {\displaystyle y=f(x)+e\quad } i en dimensjon,

y = f ( x 1 , x 2 , . . . , x n ) + e {\displaystyle y=f(x_{1},x_{2},...,x_{n})+e\quad } i n dimensjoner,

hvor y er den målte verdien i et gitt punkt spesifisert ved en eller flere uavhengige variable x. f er funksjonen man ønsker å finne og e er feilen eller residualet til målefeilen.

  • v
  • d
  • r
Statistikk
Deskriptiv statistikk
Kategoriske variabler
Målenivå
  • Nominalnivå
  • Ordinalnivå
Kontinuerlige variabler
Målenivå
  • Intervallnivå
  • Skalanivå
Sentralitet
Spredning
Moment
Statistiske grafer
Statistisk inferens
og
hypotesetest
Inferens
Forsøksdesign
Utvalgsstørrelse
  • Statistisk styrke
  • Effektstørrelse
  • Standardfeil
  • Momentmetodem
  • Tetthetsestimering
Statistiske tester
Overlevelsesanalyse
  • Overlevelsesfunksjon
  • Kaplan–Meier
  • Logrank-test
  • Feilrate
  • Cox-regresjon
Korrelasjon
og
regresjonsanalyse
Korrelasjon
Lineær regresjon
Ikke-standard
  • Ikke-lineær regresjon
  • Ikke-parametrisk
  • Semi-parametrisk
  • Robust
Non-normal feilledd
  • Generalisert lineær modell
  • Binomisk
  • Poisson
  • Logistisk
Multivariat statistikk
Tidsserieanalyse
  • Dekomponering
  • Trendestimering
  • Box–Jenkins
  • ARMA-modeller
  • Spektraltetthetsestimering
  • Kategori
  • Portal
Denne artikkelen er en spire. Du kan hjelpe Wikipedia ved å utvide den.
Oppslagsverk/autoritetsdata
Store norske leksikon · Store Danske Encyklopædi · Encyclopædia Britannica · GND · LCCN · BNF · BNF (data) · NDL · NKC