Inferens i regresjon

Like dokumenter
Kort overblikk over kurset sålangt

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

10.1 Enkel lineær regresjon Multippel regresjon

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Inferens i fordelinger

Sammenhenger. I dette kapitlet er emnet måter å studere sammenheng mellom to variable. Som tidligere er grunnleggende spørsmål:

Statistikk og dataanalyse

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Eksamen desember 2016

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

HØGSKOLEN I STAVANGER

Introduksjon til inferens

Kapittel 3: Studieopplegg

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Sammenhenger. I dette kapitlet er emnet måter å studere sammenheng mellom to variable. Som tidligere er grunnleggende spørsmål:

Eksamensoppgave i TMA4240 Statistikk

2.2 Korrelasjon. Våre øyne ikke gode til å bedømme hvor sterk en sammenheng er Trenger kvantitativt mål på sammenheng Korrelasjon et slikt mål

TMA4240 Statistikk 2014

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.

UNIVERSITETET I OSLO

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Ridge regresjon og lasso notat til STK2120

UNIVERSITETET I OSLO

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

UNIVERSITETET I OSLO

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

TMA4240 Statistikk Høst 2009

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Fasit for tilleggsoppgaver

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

UNIVERSITETET I OSLO

Tilleggsoppgaver for STK1110 Høst 2015

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere

Om eksamen. Never, never, never give up!

STK juni 2016

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

TMA4240 Statistikk Høst 2018

HØGSKOLEN I STAVANGER

Kapittel 4.4: Forventning og varians til stokastiske variable

Løsningsforslag eksamen 25. november 2003

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

UNIVERSITETET I OSLO

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ST0202 Statistikk for samfunnsvitere

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Fasit og løsningsforslag STK 1110

Om eksamen. Never, never, never give up!

7.2 Sammenligning av to forventinger

UNIVERSITETET I OSLO

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Modellvalg ved multippel regresjon notat til STK2120

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Utvalgsfordelinger (Kapittel 5)

Et lite notat om og rundt normalfordelingen.

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

TMA4240 Statistikk Høst 2016

Oppgave N(0, 1) under H 0. S t n 3

EKSAMENSOPPGAVER STAT100 Vår 2011

UNIVERSITETET I OSLO

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgåve i TMA4240 Statistikk

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Eksamensoppgave i TMA4255 Anvendt statistikk

HØGSKOLEN I STAVANGER

TMA4240 Statistikk H2010

Transkript:

Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons variabel og en forklaringsvariabel. Eksempel BMI (body mass index) og fysisk aktivitet, n=100 Respons: BMI Forklaringsvariabel: Fysisk aktivitet målt ved skritteller i en uke. 1

De deskreptive teknikkene og numeriske mål vi har sett vil vise seg nyttige: Spredningsplott Tilpasning av regresjonslinje med minste kvadraters metode Korrelasjon. 2

Husk hvordan gjennomsnitt er behandlet Først som et numerisk mål som beskriver viktige sider ved et datasett, i dette tilfellet senter i data. Dernest betraktet vi data som et tilfeldig utvalg fra en populasjon med forventing μ, og bruker gjennomsnittet av observasjonene som en estimator for μ. Det er det vi kaller en statistisk modell, altså en beskrivelse av hvordan (vi mener) dataene fremkommer ved hjelp av begreper fra sannsynlighetsregning. Senere ble gjennomsnittet x brukt som ingrediens i konfidensintervaller og signifikanstester for parameteren μ. 3

Skal følge samme program for tilpasning av en rett linje til data. Vi vet hvordan vi skal foreta tilpasningen og beregne koeffisientene, b 0 og b 1. Nå skal vi betrakte den tilpassede regresjonslinja som en estimator for en regresjonslinje i en populasjon. Notasjon: Regresjonslinje i populasjon: β 0 + β 1 x Tilpasset regresjonslinje: b 0 + b 1 x Skal utlede signifikanstester og konfidensintervall for β 0 og β 1 4

Enkel lineær regresjon dreier seg om forholdet mellom en responsvariabel y og en forklaringsvariabel x. Her er det viktig å legge merke til at fordelingen til responsvariabelen avhenger av verdien til forklaringsvariabelen. Dette generalisererer situasjonen vi har sett tidligere med to utvalg. Der er det to populasjoner. 5

6

I lineær regresjon kan forklaringsvariabelen ha mange verdier. For hver fast, fiksert verdi defineres en subpopulasjon, som består av alle enhetene som har denne spesielle verdien. 7

Et annet viktig poeng i den situasjonen vi skal se på er at fordelingen avhenger av forklaringsvariabelen gjennom spesifikasjonen av forventningen Dette kalles enkel linær regresjon. μ y = β 0 + β 1 x Linja μ y = β 0 + β 1 x er populasjons regresjonslinja og bestemmes ved konstantleddet β 0 og stigningsforholdet β 1. 8

De responsverdiene som observeres for en bestemt x -verdi, vil variere rundt punktet på linja som bestemmes av verdien. Spredningen i denne variasjonen, målt ved standardavviket, antas å være det samme for alle verdier av x, altså σ. Modellen vi ser på har tre parametre β 0, β 1 og σ. I tillegg vil vi anta at variasjonen i responsen for en fast verdi av forklaringsvariabelen x er normalfordelt, dvs y er N(β 0 + β 1 x, σ) 9

Det er hensiktsmessig å organisere observasjonenen i en matrise, en såkalt datamatrise, som kan beskrives ved Enhet Respons Forklaringsvariabel 1 y 1 x 1 2 y 2 x 2 n y n x n Eksempel: BMI og fysisk aktivitet y: BMI x: gjennomsnittlig antall skritt pr dag 10

Som tidligere da vi så på data av denne typen, starter vi med spredningsplott av verdiene av responsvariabelen verdiene av mot forklaringsvariabelen. Eksempel BMI og fysisk aktivitet. 11

Enkel lineær regresjonsmodell: Gitt n observasjoner av en forklaringsvariabel x og responsvariabelen y (x 1, y 1 ), (x 2, y 2 ), (x n, y n ) er den statistiske modellen for enkel lineær regresjon y i = β 0 + β 1 x i + ϵ i, i=1,, n der avvikene ϵ i antas å være uavhengige normalfordelte variable med forventning 0 og standardavvik σ, dvs. N(0,σ). Her er er verdiene til forklaringsvariabelen, x 1,,x n størrelser som tas som gitte. 12

Vi vil nå bruke det apparatet vi har sett i aksjon i andre sammenhenger til inferens, spesielt konfidensintervaller og hypotesetester, om stigningsforholdet β 1 og skjæringspunktet med y-aksen β 0 for regresjonslinja forventet respons μ y = β 0 + β 1 x for en gitt verdi av forklaringsvaribelen x for en ny responsverdi y for en gitt verdi av forklaringsvaribelen x 13

Men først må parametrene β 0, β 1 og σ estimeres. For å estimere β 0, β 1 bruker vi koeffesientene i regresjonslinja som er tilpasset ved minste kvadratersmetode. Her er en repetisjon av de viktigste resultatene: 14

Eksempel Spredningsplottet nedenfor viser sammenheng mellom endring i vekt i kg og endring i aktivitet som ikke er knyttet til trening, AIT målt i kalorier, i en studie av 16 unge voksne. Ratstløse personer har typisk høy AIT. 15

Kriterium: Minste kvadraters regresjon av y på x er den linja som minimerer summen av kvadratetene av den vertikale avstanden fra datapunktene (x 1, y 1 ),...,( x n, y n ) til linja. 16

Hvis y= b 0 + b 1 x er regresjonslinja, er (x i, y i ) =(x i, b 0 + b 1 x i ) det puktet på regresjonslinja som ligger rett over eller under punktet (x i, y i ), Den vertikale avstanden mellom de to punktene er og kvadratet av avstanden er y i - y i = y i - b 0 + b 1 x i ( y i b 0 + b 1 x i ) 2 slik at summen av kvadratetene av de vertikale avstandene er ( y i b 0 + b 1 x i ) 2 17

Skjæringspunktet b 0 og stigningsforholdet b 1 til regresjonslinja er de verdiene som minimerer denne kvadratsummen. Alle statistikkpakker har rutiner for å beregne disse koeffesientene numerisk. Men de kan også uttrykkes eksplisitt og den hjelper på forståelsen. 18

Minste kvadraters regresjonslinje: y i = b 1 + b 0 x i der b 1 = r s y s x og b 0 = y - b 1 x. Her er som før x gjennomsnitt av x 1,..., x n, y gjennomsnitt av y 1,..., y n, s x standardavvik for x 1,..., x n, s y standardavvik for y 1,..., y n, r korrelasjonen for (x 1, y 1 ),..., (x n y n ) 19

Det kan vises at μ b0 = β 0 og μ b1 = β 1 slik at b 0 og b 1 er forventningsrette estimatorer for β 0 og β 1. Dessuten er både b 0 og b 1 lineære kombinasjoner av y 1,, y n som er normalfordelte og uavhengige. Derfor er også b 0 og b 1 normalfordelte. Ved å appellere til en utvidet form av sentralgrenseteoremet gjelder dette også tilnærmet selv om y 1,, y n og ϵ 1,,ϵ n ikke nødvendigvis er eksakt normalfordelt. Innflytelsesrike observasjoner og outliere kan bety at tilnærmelsen er dårligere. 20

Et annet resultat som kan vises, er et uttrykk for variansen til estimatotren b 1 for stigningsforholdet β 1 : σ b1 2 = σ 2 = σ 2 n s 2 x (x i x ) 2. Dette betyr at fordelingen til b 1 blir med konsentrert rundt forventningen β 1, jo større variasjon det er i verdiene til forklaringsvariabelen. 21

Størrelsen y i = b 0 + b 1 x* er den predikerte verdi av responsen for en gitt verdi x* for forklaringsvariabelen x. Den er en forventningsrett estimator for forventet verdi av responsvariabelen μ y når x=x*. Residualet er definert ved e i = obsertert respons predikert respons = y i - y i = y i - b 0 -b 1 x i Residualene er det empiriske motstykke til modelavvikene eller feileddene ϵ i. Summen av residualene er null, null, μ ϵ =0. e i =0, og forventningen til ϵ i er Men ϵ i er uobserverbare, så residualene brukes for å sjekke modelforutsetningene til ϵ i. 22

Det gjenstår å estimere standardavviket σ ϵ = σ. Estimatet for variansen σ 2 i enkel lineær regresjon er «gjennomsnittet» av de kvadrerte residualene s 2 = ϵ i 2 n 2 = (y i y i ) 2 n 2. Legg merke til at man deler med n-2. Det gjør at s 2 blir en forveningsrett estimator for σ 2. Tidligere brukte vi av samme grunn n-1 for å estimere variansen i et utvalg. Estimatet for standardavviket σ ϵ = σ er s= s 2. 23

Eksempel: BMI og fysisk aktivitet. Det skal ikke stor verdi av n til før det lønner seg å beregne verdien av estimatorene, estimatene, i en enkel lineær regresjon ved hjelp av en statistikkpakke. Her er utskrift fra noen vanlige: Regresjonslinja er BMI = 29.5578 0.655 PA 24

25

26

27

Etter å ha tilpasset modellen og estimert regresjonslinja kan man beregne predikerte verdier og residualer. Hvis PA er 8000 skritt per dag er predikert BMI 29.5578 0.655 x 8= 24.338. Hvis observert BMI er 25.655, er residualet y-y = 25.655-24.338 = 1.317. 28

En viktig del av modeltilpasning er å undersøke hvorvidt modelforutsetningene holder. Det kan omfatte residualsjekk for å avdekke normalitet konstant varians andre mønstre i data, som ikke-linearitet. Første steg er å plotte residualene mot forklaringsvariablene og eventuelt «rekkefølgen» på observasjonene. 29

Eksempel: BMI og fysisk aktivitet. Plott av residual mot forklaringsvariabelen PA 30

Normalfordelingsplott av residualene er også nyttig. 31

Konfidensintervaller for β 0 og β 1 utledes i prinsippet på samme måte som konfidensintervaller for forventning i et utvalg og konfidensintervaller for differansen mellom forventningene i to utvalg. Formlene blir litt mer kompliserte i dette tilfellet. Men alle konfidensintervaller har formen estimat ± t* SE estimat der t* er kritisk verdi i en t-fordeling. 32

Ide: På samme måtesom for et og to utvalg standardiseres estimatorene for β 0 og β 1. Disse estimatorene er normalfordelt som vi har sett. Standardavvikene er multipla av σ, som estimeres med s. Dette gir t-fordelinger med n-2 frihetsgrader. Det finns formler for SE b0 og SE b1, som er multipla av s. De beregnes også rutinemessig av statistikkpakkene som brukes. 33

Et konfidensintervall med konfidenskoeffisient lik C for β 0 har grenser b 0 ± t* SE b0 Et konfidensintervall med konfidenskoeffisient lik C for β 0 har grenser b 1 ± t* SE b1 Her er t* den verdien som gjør at arealet under tetthetskurven til en t(n-2) fordeling mellom -t* og t* er C. 34

For å teste H 0 :β 1 =0 beregnes t-observatoren t= b 1 SE b 1 Antall frihetsgrader er n-2. La T være en tilfeldig variabel som er t(n-2) -fordelt. Da er P-verdiene for en test for H 0 :β 1 =0 35

Hvis alternativet er ensidig H a :β 1 > 0 P(T t). Hvis alternativet er ensidig H a :β 1 < 0 P(T t). Hvis alternativet er tosidig H a :β 1 0 2 P(T t ). 36

Tilsvarende formeler finnes for tester for β 0. Utskrifter inkluderer ofte resultat av test H 0 :β 0 =0, men dette er ofte ikke av så stor praktisk verdi. β 0 =0 svarar til μ y for x=0. Men H 0 :β 1 =0 er av stor interesse. Den svarer til at μ y = β 0 for alle verdier av x, med andre ord at fordelingen til responsen ikke varierer for ulike verdier av forklaringsvariabelen. Da er tilbake i ett utvalg situasjonen. 37

Eksempel: BMI og fysisk aktivitet. Utskriften fra statistikkpakkene inneholder typisk noe av typen: Forklaringsvaribel Koeffisient St. feil T P konstant 29.578 1.412 20.95 0.000 PA -0.6547 0.1583-4.13 0.000 Sjekker at det stemmer: t= b 1 SE b 1 = 0.6547 0.1583 = -4.1358 For H 0 :β 1 =0 og tosidig alternativ H a :β 1 0 er P-verdien 2P(T t )= 2P(T 4.14) =0.000 for en t-fordeling med N-2= 100-2= 98 frihetsgrader. 38

Her er det kanskje mer rimelig med H 0 :β 1 =0 og ensidig alternativ H a :β 1 <0 Dette gir en P-verdi som er halvparten så stor. Med 98 fr. g.: P(T 4.14 ) < 0.0005 Fra tabell D: Med 100 fr.g er P(P(T 3.300) =0.0005 Med 80 fr.g er P(P(T 3.390) = 0.0005 P-verdien er altså svært liten. 39

95% konfidensintervall? Trenger kritisk verdi t* fra t(n-2)=t(98) fordeling. Bare 80 og 100 frihetsgrader tabullert. Bruker 80. Dette er det konservative valg. Fra tabell D er t*=1.99 Grensene er b 1 ± t* SE b1 = -0.655 ± 1.990 0.1583= -0.655 ± 0.314 som gir intervallet (-0.969, - 0.314) som stammer tidligere utskrifter (Exel). 40

Vi skal nå se på to utvidelser: Konfidensintervall for forventet respons μ y når forklaringsvariabelen har en bestemt verdi x* Konfidensintervall for responsen til en ny observasjon når forklaringsvariabelen har en bestemt verdi x* 41

Forventet respons μ y når forklaringsvariabelen har en bestemt verdi x* er μ y = β 0 + β 1 x*. Den estimeres med μ y = b 0 + b 1 x*. Et konfidensintervall med konfidenskoeffisient lik C for μ y har grenser μ y ± t* SE μy. Her er t^* den verdien som gjør at arealet under tetthetskurven til en t(n-2) fordeling mellom -t^* og t^* er C. 42

Eksempel: BMI og fysisk aktivitet. Konfidensintervaller for forventet respons. 43

Eksempel: BMI og fysisk aktivitet. Anta x*= 9000 skritt per dag. Da er konfidensintervallet for forventet verdi av BMI μ y ± t* SE μy = b 0 + b 1 x* ± t* SE μy Estimatet for forventningen er 29.578 0.655 9.000= 23.7 og ved å bruke en statistikkpakke får man at et 95% konfidensintervall er (23.0, 24.4) kr/m 2. 44

Hvis vi ønsker å predikere en ny observasjon når forklaringsvaribalen har verdi x*, er esimatoren den samme som for den forventede verdien, μ y, så y = b 0 + b 1 x*. Men husk at fra formuleringen av modellen y i = β 0 + β 1 x i + ϵ i, Når vi estimerer forventningen tar vi bare hensyn til den systematiske delen β 0 + β 1 x i. Når vi skal finne et konfidensintervall for en ny observasjon, må vi også ta hensyn til den tilfeldige delen. 45

Feilmarginen for å predikere en ny observasjon blir derfor større enn for å estimere forventningen. Siden y er prediksjonen av ny observasjon, mens μ y er en estimator for en forventning, som kan oppfattes som en grense for gjennomsnittet av veldig mange observasjoner, er standardfeilen til y større enn standardfeilen til μ y. Intervaller som brukes for å predikere en framtidig observasjon kalles prediksjonsintervaller. Legg merke til at selv om y er en tilfeldig variabel, er tolkningen av Prediksjonsintervaller den samme som for konfidensintervaller. 46

Prediksjonsintervall: Et prediksjonsintervall med konfidenskoeffisient lik C for en ny observasjon når forklaringsvariabelen antar verdien x=x* har grenser y ± t* SE y. Her er t* den verdien som gjør at arealet under tetthetskurven til en t(n-2) fordeling mellom -t* og t* er C. 47

Eksempel: BMI og fysisk aktivitet. Prediksjonsintervaller for BMI. 48

Eksempel: BMI og fysisk aktivitet. Anta x*= 9000 skritt per dag. Da er prediksjonsintervallet for BMI i en ny observasjon der Forklaringsvariabelen har verdi x* y ± t* SE y = b 0 + b 1 x* ± t* SE y. Estimstet for y er som før 23.7 kg/m 2. Men nå er feilmarginen større slik at et 95% prediksjonsintervall blir (16.4, 31.0) kg/m 2. Dette fås fra en statistikkpakke. 95% konfidensintervall for μ y er (23.0, 24.4) kr/m 2, altså betrektelig kortere. 49

En viktig modelforutsetning er at sammenhengen mellom respons- og forklaringsvariabelen kan beskrives ved en lineær sammenheng, dvs regresjonslinja Når denne forutsetningen ikke er til stede, kan transformasjon av dataene hjelpe. Eksempel: Bilers ytelse MPG: antall miles pr gallon, dvs bensisforbruk MPH: gjennomsnittshastighet. Fra et plott med 60 observasjoner ser man at selv om det er positiv sammenheng, er den ikke helt lineær. 50

Rødt: Minste kvadrater Blått: Glatting

Men MPG mot log MPH ser mye mer lineært ut. Men et plott av MPG mot log (MPH) er langt mer lineært. Rødt: Minste kvadrater Blått: Glatting 52