Om enkel lineær regresjon I

Like dokumenter
Kapittel 1: Beskrivende statistikk

Om enkel lineær regresjon I

Kapittel 1: Beskrivende statistikk

Om enkel lineær regresjon I

Forelesning 19 og 20 Regresjon og korrelasjons (II)

Regler om normalfordelingen

Om enkel lineær regresjon II

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Om enkel lineær regresjon II

Analyse av sammenhenger

Regler om normalfordelingen

Regler om normalfordelingen

TMA4245 Statistikk Eksamen august 2014

Seminaroppgaver for uke 13

TMA4245 Statistikk Eksamen mai 2016

Kapittel 1: Beskrivende statistikk

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

Makroøkonomi - B1. Innledning. Begrep. B. Makroøkonomi. Mundells trilemma går ut på følgende:

Econ 2130 uke 15 (HG)

Oversikt over tester i Econ 2130

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

Løsningskisse seminaroppgaver uke 17 ( april)

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner

Forelesning Punktestimering

Forelesning Ordnings observatorer

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Forelesning Enveis ANOVA

STK1100 våren Konfidensintevaller

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

TMA4240 Statistikk Høst 2016

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

Generell støymodell for forsterkere (Mot Kap.2)

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

Medisinsk statistikk, del II, vår 2009 KLMED 8005

EKSAMEN løsningsforslag

Statistikk med anvendelse i økonomi

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

Randi Johannessen. Mikroindeksformel i konsumprisindeksen. 2001/64 Notater 2001

ARBEIDSHEFTE I MATEMATIKK

Positive rekker. Forelest: 3. Sept, 2004

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

Kapittel 10 fra læreboka Grafer

EKSAMEN Ny og utsatt Løsningsforslag

Mer om utvalgsundersøkelser

Differensligninger Forelesningsnotat i Diskret matematikk Differensligninger

Forelesning Z-, t-test, test for forventningsdifferanser

Avsnitt 8.1 i læreboka Differensligninger

Kapittel 9 ALGEBRA. Hva er algebra?

Påliteligheten til en stikkprøve

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240/4245 Statistikk Eksamen august 2016

FYS3220 Filteroppgave Løsningsforslag. 04_FYS3220 Oppgave Sallen and Key LP til Båndpass filter

Forelesning nr.3 IN 1080 Mekatronikk. Parallelle og parallell-serielle kretser Kirchhoffs strømlov

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

ECON240 Statistikk og økonometri

Løsningsforslag Matematikk4N/4M, TMA4123/TMA4125, vår 2016

Chapter 2 - Discrete Mathematics and Its Applications. Løsningsforslag på utvalgte oppgaver

Lineær regresjonsanalyse (13.4)

Løsningskisse for oppgaver til uke 15 ( april)

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Transkript:

ECON 30 HG, revdert 0 Notat tl kapttel 4 Løvå Om ekel leær regrejo I Iledg Ekel regrejoaale dreer eg om å tudere ammehege mellom e repovarabel,, og e forklargvarabel,, baert på et datamaterale om betår av obervajopar av (, ) (, ), (, ),,(, ). : Ata v er tereert ammehege mellom tdee på 500m og 5000m for køteløpere om er tltrekkelg god form tl å kue delta tore meterkap om EM, VM og lgede. Data er hetet fra europameterkapet (EM) Heerevee 004 og gtt tabell. (Data ka late ed e Ecel-fl på http://folk.uo.o/haraldg/ ) Tabell Reultater fra 500m og 5000m for me fra EM køter Heerevee 004 Ob 5000m 500m Ob 5000m 500m r. Td Sekuder Td Sekuder r. Td Sekuder Td Sekuder Tutert NED 6:7.63 387.63 :47.4 07.4 7 Poutala FIN 7:06.8 46.8 :5.7.7 Verheje NED 6:6.43 386.43 :48.80 08.80 8 Roedahl FIN 7:06.5 46.5 :5.49.49 3 Utdehaage 6:3.93 39.93 :48.90 08.90 NED 9 Vreugdehl BEL 6:58.85 48.85 :53.56 3.56 4 Romme NED 6:9.88 389.88 :50.4 0.4 0 Zoller AUT 7:4.4 434.4 :54.05 4.05 5 Skobrev RUS 6:35.55 395.55 :49.84 09.84 Makovetkj BLR 7:0.0 4.0 :54.75 4.75 6 Lalekov RUS 6:4.84 40.84 :48.0 08.0 Veldkamp BEL 6:48.7 408.7 :54.36 4.36 7 Fabr ITA 6:34.87 394.87 :49.64 09.64 3 Vtípl CZE 7:00.04 40.04 :55.67 5.67 8 Röjler SWE 6:36.68 396.68 :5.46.46 4 Grozea ROU 6:55.8 45.8 :56.5 6.5 9 Freger GER 6:48.76 408.76 :50.34 0.34 5 Boker SUI 6:58.39 48.39 :57.96 7.96 0 Sætre NOR 6:36.5 396.5 :53.65 3.65 6 Pedo UKR 7:09.93 49.93 :57.94 7.94 Dethev RUS 6:38.06 398.06 :5.54.54 7 Valtoe FIN 6:57.6 47.6 :53.6 3.6 Adere NOR 6:47.43 407.43 :50.0 0.0 8 Mazur POL 6:46.9 406.9 :55.8 5.8 3 Zgmut POL 6:40.54 400.54 :5.80.80 4 Ae ITA 6:49.58 409.58 :5.77.77 5 Scheder GER 6:45.05 405.05 :53.85 3.85 6 Ervk NOR 6:37.5 397.5 :09.0 9.0

La betege 5000m-tde ekuder, og 500m-tde ekuder for løper r., =,,,8. Datamateralet vårt ( utvalget) betår altå av = 8 obervajopar, (, ), (, ),,(, ). For få e de om hva lag ammeheg om ka være aktuell, ka ma lage et predgdagram (catter plot) der -ee plotte mot -ee. Fgur [ For å få Ecel tl å tege dette plottet bør v lage to koloer ved de av hveradre, der -ee lgger de ee og -ee de adre koloe. Deretter, marker de to koloee og velg catter fra graf-rutee (på ert-mee).] 500m tder mot 5000m 35.00 30.00 5.00 : 500 m (ek) 0.00 5.00 0.00 05.00 00.00 380.00 390.00 400.00 40.00 40.00 430.00 440.00 : 5000 m (ek) Merk at Ecel valgte orgo puktet (380, 00) tedefor (0, 0). V legger ogå merke tl et elg olert pukt lagt over de øvrge. Det ver eg å gjelde Ekl Ervk om falt på 500m. Etterom dee obervajoe kke er repreetatv for det v er tereert (emlg køtetder for løpere om holder eg på bea), ka v trgt fjere dette obervajoparet fra data. Vårt datamaterale betår dermed av = 7 obervajopar. Fgur tder på at e evetuell ammeheg mellom -ee og -ee e å være av leær tpe. I fgur har jeg plottet dataee på tt (ute Ekl Ervk) med e lagt (mte kvadrater) tredlje om uttrkk for dee ammehege.

3 Fgur 500m mot 5000m (ute Ervk) 0.00 8.00 6.00 = 0.43 + 54.34 R = 0.4576 4.00.00 0.00 08.00 06.00 380.00 390.00 400.00 40.00 40.00 430.00 440.00 For å få fram dette plottet Ecel, laget jeg ført predgdagrammet om over. Deretter høreklkket jeg på et av puktee dagrammet lk at puktee ble markert og valgte add tredle fra mee om kom fram. I opto på amme me peferte jeg at Ecel kal krve ut lgge for de rette tredlje og R om er et mål på hvor tor del av de totale varajoe av -ee data er forklart av tred lje. Sde R = 0.4576, betr det at 45.76% av total-varajoe av -ee data er forklart av tredlja om dkerer e v ammeheg. Tredlja er et ekempel på e mte kvadrater regrejolje, om er betemt om de lja om e v fortad bet bekrver puktee predgplottet. I dette otatet kal v ført og fremt forklare hvorda de tørrelee er bereget. Aale gjelder ku datamateralet elv og ebærer (foreløpg) ge tolkg om populajoe dataee er trukket fra. For å kue tolke reultatee forhold tl populajoe, treger v apparatet etablert kapttel 6 og 7 Løvå. Se ogå avtt 4 edefor for oe merkader om tolkg. Noe relevate utvalgtørreler La (, ), (, ),,(, ) være obervajopar av to varable og (om ka være hva om helt kke ødvedgv tokatke). Da ka v defere og rege ut ( utvalget) ve tørreler om blat aet er vktg regrejoaale (jfr. Løvå kap. 7):

4 Gjeomtt: ) = = ) = = Emprke varaer (ogå kalt utvalgvaraer eller ampelvaraer): ) v) = ( ) = = ( ) = Emprk kovara (ogå kalt utvalgkovara eller ampelkovara): v) = ( )( ) = Emprk korrelajokoeffet (ogå kalt utvalg-korrelajokoeffete eller ampelkorrelajokoeffete): v) r = r = = Merk at de tørrelee, om alltd ka berege ut fra data, er bgget opp på amme måte om tlvarede tørreler defert populajoe, der valge gjeomtt ertatte av forvetger. Hv X og Y er to tokatke varable e populajo, defere populajogjeomttee ved forvetgverder, µ = E( X), µ = EY ( ), X Y ( ), ( ) X = E X E X σy = E Y EY, og (populajo)varaee ved, σ ( ) ( ) (populajo)kovarae ved, cov( XY, ) = E ( X E( X) )( Y EY ( )). cov( XY, ) (Populajo)korrelajokoeffete defere ved ρ = ρ( XY, ) =. var( X) var( Y) I det peelle tlfellet at (, ), (, ),,(, ) ka betrakte om uavhegge obervajoer av ( XY, ), vl utvalg-tørrelee )-v) kue betrakte om alagverder for de tlvarede populajotørrelee (tutvt begruet ved de tore tall lov og mer pret begruet ved tattk teor om etablere delv dette kuret og eere Stat). Egekaper ved korrelajokoeffetee. Korrelajokoeffete, ete det gjelder r eller ρ, er et tall mellom og og måler hvlke grad ammehege mellom og (X og Y populajoe) ka bekrve ved e rett lje. Ektremverdee og varer tl e tuajo der alle obervajoee lgger ekakt på e rett lje. I å fall fe det kotater a og b lk at = a + b for alle =,,, data, eller Y = a + bx for alle mulge obervajoer av X og Y populajoe. Når det gjelder r vl de egekapee bl klargjort dette otatet.

5 Regekempel. For å llutrere bereggee et mdre materale trakk jeg ut ret tlfeldg fem av obervajoparee tabell (mu Ervk). De obervajoumree tabell om ble trukket ut var, ob.r., 4, 7, 5 og 3 tabell, om jeg kalte =,,3, 4,5 tabell edefor. Tabell M-utvalg på fem trukket fra 7 obervajopar. ( ) ( )( ) ( ) 398.06.54 -.58 -.00 58.558 3.9840 5.07 389.88 0.4-0.76-3.30 430.85 0.8636 68.48 3 46.8.7 6.7 -.7 6.5983.608-0.4763 4 48.39 7.96 7.75 4.4 60.45 9.578 34.3037 5 40.04 5.67 9.40.3 88.435 4.5540 0.068 um 053.8 567.68 999.53 40.576 7.4090 Gj.tt 40.636 3.536 De fem etrale tørrelee ka å lett berege: = 40.636 = 3.536 = 999.53/ 4 = 49.783 = 40.576/ 4 = 0.440 = 7.4090 / 4 = 3.853 Korrelajokoeffete mutvalget på 5 blr da 3.853 r = = = 0.633. 49.783 0.440 De tlvarede korrelajoe hele materalet (7 obervajopar) ble 0.676. Sjekk elv dette ved å bruke Ecel. Rute Covarace module Data aal gr deg,, vakt modfert (e fotote 6 de 5). Rute Correlato, ogå Data aal, gr deg r drekte. De fem tørrelee,,,,,, er alt v treger for å berege e ekel regrejo-aale. Det er e kjedelg jobb å berege de fem tørrelee med kalkulator, med tor jae for å rege fel, å dee jobbe er bet å gjøre med computer. Når de ført er bereget, vl alle Jeg lot Ecel trekke ut fem løpere for meg ved å bruke Radom umber geerato med uform fordelg fra module Data aal. Dv. løpere, Dethev (RUS), Romme (NED), Poutala (FIN), Boker (SUI) og Vtípl (CZE) hhv.

6 adre formler om er aktuelle for e ekel regrejo med bare e forklargvarabel,, lett kue berege med kalkulator. Om ma lkevel treger å berege hele regrejoaale med kalkulator, ka følgede bereggformler være ttge: Regel (Utledet appedk) Hv (, ), (, ),,(, ) (a) ( ) = ( ) = = = (b) ( ) = ( ) = = = (c) er obervajopar, gjelder ( ) = ( )( ) = = = 3 Mte kvadrater regrejolje utvalget V har obervajoer av varablee 3 og, (, ), (, ),,(, ), og øker å forklare met mulg av -ee ved hjelp av -ee og e rett lje, ŷ = a + b, der jeg krver ŷ tedefor -e for kke å blade amme med -e om obervere. Med adre ord, for hvert obervajopukt, (, ), ka v krve = a + b + d = ˆ + d for =,,, der ˆ = a + b repreeterer de forklarte dele av, og d ˆ = de uforklarte dele av. (Merk at v alltd ka krve ˆ ˆ ˆ = + = + d.) Se fgur 3. Jeg bruker aførelteg rudt det uggetve uttrkket forklare de forklarg egetlg er et for terkt uttrkk dee ammehege. Et mer valg uttrkk ltterature er predkert for ˆ. De uforklarte dele av, d kalle oftet for redual. Oppgave er å å velge lja ŷ = a + b - dv. å velge koeffetee a og b lk at forklarge blr bet mulg. Eller, agt på e ae måte, lk at redualee, d, om måler de loddrette avtadee tl lja fra obervajopuktee, mmere e eller ae fortad. V er av fgur 3 at for pukter om lgger over lja ( > ˆ ), å blr d > 0, me 3 Merk at jeg bruker må boktaver for og for å dkere at de ka være hvlke om helt varable kke ødvedgv tokatke. For ekempel, kue være e atfaktor e produktfukjo med verder valgt av forkere, me er tørrele på produktet. I å fall er ku å betrakte om tokatk.

7 d < 0 for pukter om lgger uder lja ( < ˆ ). Det tter altå kke å mmere umme av avtadee tl lja, d, de de egatve avtadee vl oppheve de potve. I tedet velger ma å e på de kvadrerte avtadee, d, om fjerer fortegee. (Ma kue aturlgv ogå e på aboluttverdee, d, me det gr e veetlg mer komplert løg.) Fgur 3 E vlkårlg obervajo av (, ) d ˆ = (redual) (, ) ŷ = a + b = a + b ˆ forklart (predkert) 0 Defjo E mte kvadrater regrejolje 4 (MKV), ŷ = a + b, for med he på for dataee, (, ), (, ),,(, ), betemme lk at ( ˆ ) ( ) = = = Q = d = = a b blr mt mulg. 4 Uttrkket regrejo har htork opprele og ge relevat betdg for ekemplee våre. Uttrkket ble ført brukt ve avedeler geetkk og har bltt hegede ved de.

8 Dette er et veldefert mmergproblem om har e etdg løg (e regel ). Det er flere måter å fe mmum av Q= Qab (, ) på. De valgte er å ette de derverte av Q med he på a og b lk ull de de derverte av Q må være ull mmumpuktet. Da får v to lgger tl å betemme a og b (huk at de derverte tl e um er lk umme av de derverte): Q = = = = a a a d ( a b) ( )( a b) ( ) d = = = = Q = = = = b b b d ( a b) ( )( a b) ( ) d = = = = Dermed, ved å ette de to derverte lk 0, får v to lgger tl å betemme a og b: () d = 0 (eller = ( a b) = 0 ) = () d = 0 (eller = ( a b) = 0 ) = Løge er gtt ved regel (e appedk for detaljer): Regel Mkv regrejolje for med he på for data, (, ), (, ),,(, ), er gtt ved lja ŷ = a + b, der a = b og b = Algebrae for å fe løge er kke peelt vakelg, me er kke peum å kue beherke. De er derfor krevet ut appedk om frvllg leg for tereerte tudeter. Fe ogå Løvå appedk B5 (de 450). Regel ver e tereat relajo mellom tggtallet, b, mkv-lja og de emprke korrelajokoeffete, r. De forteller oe om r om v tdlgere bare har begruet tutvt. V ka emlg krve b = = = Sammehege mellom korrelajokoeffete, r, og b, er altå gtt ved (3) b= r

9 Dermed, de og kke ka være egatve, må b og r ha amme forteg. Dette betr at e potv korrelajokoeffet, r, er det amme om at mkv regrejolja for mhp har potv tgg. Hv r < 0, må regrejolja helle edover ( b < 0 ), og hv r = 0, er regrejolja flat ( b = 0 ). Regeekempel fortatt: Sde v har allerede har bereget de fem gruleggede tørrelee, fort gjort å berege mkv-lja: 7.409 b = = = 0.75 999.53 a = b = 3.536 (0.75)(40.636) = 6.7,,,,, er det De beregete mkv-lja blr ålede ˆ = 6.7 + (0.75) I fgur 4 har jeg latt Ecel tege mkv-lja predgdagrammet for mutvalget. Fgur 4 Mutvalg - 5 obervajopukter 0 8 6 4 -hatt = 0.75 + 6.7 0 08 380.00 390.00 400.00 40.00 40.00 430.00 Det ka ogå være truktvt å e hvor me av hver ekelt blr forklart (predkert) av. V ka å berege både ˆ og d, om er vt tabell 3:

0 Tabell 3 Predkert = a + b Ob. r. 398.06.54.9-0.38 389.88 0.4 0.88-0.64 3 46.8.7 5.59-3.3 4 48.39 7.96 4.5 3.44 5 40.04 5.67 4.73 0.94 ˆ Redual d = ˆ V er at obervajo, og 5 e rmelg bra forklart, me obervajo 3 og 4 er dårlgere forklart. V forlater regeekempelet og tller det aturlge pørmålet om e foruftg måte å lage et amlet mål på hvor me forklarer av datamateralet. V tar da utgagpukt et uttrkk for total varajo av -ee materalet og pør hvor tor adel av dee totale varajoe er forklart av -ee va de predkerte -ee. Som uttrkk for total varajo -ee bruke å kvadratumme SS = ( ) T = der otajoe SS T tår for det egelke um of quare total og er veldg valg tattk og økoometrk ltteratur. Merk at SS = ( ) og eholder amme formajo om T varamålet (de er et fat tall for et gtt datamaterale). Tlvarede deferer v (total)varajoe av de forklarte (predkerte) dele av, emlg ˆ : R ( ˆ ˆ) um of quare of regreo måler totalvarajoe av de = SS = forklarte (predkerte) dele. Kalle ofte for forklart varajo. Tlvarede deferer v e kvadratum for varajoe av de uforklarte dele, d. E = ( ) = = = ( de () mplerer at d = 0 SS d d d ). Står for um of quare of error om måler totalvarajoe av de uforklarte dele (redualee).

De varajomålee er budet amme ved følgede fudametale etg (regel 3) bevt appedk: Regel 3 (a) SST = SSR + SSE Regeformler: (b) SS = ( ) (c) T E = m = = = SS Q d ( ) ( r ) (der Q m er mmumverde for Q) Vårt mål på adele av de totale varajoe ( data) forklart av va mkv-lja blr å Defjo Mål på forklart varajo av data: SS SS R T om følge regel 3(a) må være et tall mellom 0 og. Ved å bruke regeformlee regel 3, får v ( ) ( ) R T E E r T T T ( ) SS SS SS SS = = = = ( r ) = r SS SS SS V har dermed bevt Regel 4 Adel forklart varajo av mkv-lja, ŷ = a + b, er gtt ved SSR r SS = T der r er (de emprke) korrelajokoeffete for data (, ), (, ),,(, ) Merk at regel 4 gr e tolkg av de emprke korrelajokoeffete r mellom to varable og emlg at r ka tolke om et mål på hvor me av varajoe av data blr forklart av ( data) om v prøver å bekrve met mulg av -ee ved e rett lje, ŷ = a + b. Om v omvedt forøker å forklare ved data ved e mkv regrejolje, ˆ = a+ b, vl v på gru av mmetre r få amme var: ee blr forklart ved de rette lja ˆ = a+ b, der (ved formlee ovefor der -ee og -ee btter pla). 00 r % av varajoe - b = / = r ( / ) og a = b Merk at r ka alltd rege ut år v har data, (, ), (, ),,(, ), me ka kke alltd tolke om e korrelajokoeffet for ekempel e tuajo der -ee er gtte tall (om valgte verder av e atfaktor) valgt ut av e forøkleder, me -ee er tlvarede verder av e repo (output). I e lk tuajoe har verde v får ved å rege

ut r ge aturlg tolkg om e korrelajokoeffet. Me tolkge av r regel 4 er fortatt megfull. Det gr emlg ofte god meg å forøke å forklare oe oberverte verder av produktet,, ved oe utvalgte verder av atfaktore,, ved e rett lje peelt tuajoer der de valgte -ee kke varerer for me, om er uder forøkleder kotroll. Regeekempel fortatt. I mutvalget på 5 obervajopukter fat v e korrelajokoeffet på r = 0.633 ( r = 0.400689 ) lk at 40% av varajoe 500m tdee mutvalget blr forklart av 5000m tdee va mkv regrejolje. V vlle ha fått amme var (40%) om v omvedt hadde forøkt å forklare 5000m-tdee ved 500m-tdee. I det opprelge utvalget på 7 obervajopukter (ute Ervk) ble r = 0.676 ( r = 0.456976 ), lk 45.7% av varajoe 500m-tdee data blr forklart av 5000mtdee. Noe geerelle egekaper ved de emprke korrelajokoeffete. Tl lutt er det verdt å eve at oe geerelle egekaper ved de emprke korrelajokoeffete, r, baert på data, (, ), (, ),,(, ), om ble evt begele av avtt, følger drekte av regel 3: Sde SS E = d kke ka være egatv, følger av regel 3(c) at r 0, dv. = være oppflt. V er ogå av amme lgg at ektremtlfellet, at SS E = r = (dv. r må r = ± ) mplerer = d = 0. Sde alle leddee umme er kke-egatve, er dette ku mulg hv alle d = 0, =,,, er oppflt. Sde d = a b, må å fall alle (, ) oppflle, = a + b, =,,, - dv. alle obervajopuktee lgger (ekakt) på e rett lje. 4 Noe ord om tolkg av reultatee avtt og 3. V er at v å har to forkjellge måter å uttrkke grade av leær ammeheg mellom to varable, og, baert på data, (, ), (, ),,(, ) : () Berege (de emprke) korrelajokoeffete, r. () Berege mkv-regrejolje av med he på, baert på data, (, ), (, ),,(, ). Spørmål : Så hva er de bete måte? Svaret på det avheger av problemtllge. Merk at r er helt mmetrk bgget opp og gr amme var uaett om v øker å forklare ved hjelp av eller, omvedt, om v øker å forklare ved hjelp av. Metode () er foruftg oe (mmetrke) tuajoer. Metode (), dermot, er mer kredderdd for de (kakje mer valge) ammetrke tuajoe der v har e avhegg varabel (repovarabel),, v øker å forklare ved hjelp av e forklargvarabel,, (jamfør, for ekempel, de adre

3 merkade etter regel 4). Uder () vl ammehege faktk e forkjellg ut, avhegg av om v prøver å forklare ved hjelp av, eller om v prøver å forklare ved hjelp av. I regeekemplet prøvde v ( mutvalget) å forklare (500m-td) ved (5000m-td), kakje motvert ut fra at 5000m-løpet går dage før 500m-løpet for me. Aale reulterte mkv-regrejolje, (a) ˆ = 6.7 + (0.75) På de ae de, er det kke oe om hdrer o å være tereert det omvedte problemet, emlg å forklare 5000m-tde ved pretajoe på 500m. V ka fort berege mkv-regrejolje for med he på ved mpelthe å btte om og alle formlee (merk at r å fall kke edrer eg (hvorfor)?). V har alt v treger tallee uder tabell avtt, og får (jekk elv!) mkv-lja for med he på : (b) ˆ = 54.38 + (3.40) Merk at tggtallet (b) kke er lk /(tggtallet (a)), om vlle vært tlfelle derom alle obervajopuktee hadde lgget ekakt på e rett lje. De to varee er altå forkjellge (år r < ) og ålede avhegg av problemtllge. Spørmål : Hvorda tolke reultatee ovefor forhold tl populajoe data er hetet (trukket) fra? Svaret avheger terkt av vår tattke modell for populajoe - dv. av hvlke forutetger v er vllge tl å potulere om populajoe. Hv v kke er vllg tl å forutette oe om populajoe, vl aale ovefor være helt tom dv. kke oe om helt om populajoe v er tereert. Med adre ord, ute oe deer om populajoe har v kke oe grulag for å tolke reultatee ovefor utover datamateralet elv. Så hva er populajoe her? Dette er kke oe trvelt pørmål. Speelt pørmålet om avgreg ka være problematk. Hvlke køteløpere kal være repreetert populajoe? Bare de 7 om deltok ved EM Heerevee 004, eller adre ogå? De valge måte å ærme eg dette problemet på, er førte omgag å hoppe bukk over problemet med avgreg og rett og lett ertatte populajoe med e tattk modell. E tattk modell for e lk populajo omfatter grovt ett to tg, () e lte over hvlke tokatke (og adre tper) varable om våre data ata å være obervajoer av, og () et ett av forutetger v er vllg tl å gjøre om alghetfordelgee for de tokatke varablee om går. I det peelle tlfellet at (, ), (, ),,(, ) ka betrakte om uavhegge og ret tlfeldge obervajoer av et tokatk varabel-par ( XY, ), om dkutert førte del av avtt, vl populajoe være repreetert ved de tokatke varablee X og Y amme med de forutetgee v er vllg tl å forutette om alghetfordelge tl ( XY, ). Er dette e rmelg modell for vår tuajo? Tvlomt! 5 For det førte er det kke rmelg å ata 5 For mutvalget på 5 v brukte om regeekempel, kue dette opplegget pae. Populajoe v trekker fra er da gtt ved de opprelge 7 obervajopuktee, og utvalget er trukket repreetatvt dv. lk at alle mulge utvalg på 5 fra de 7 er lke alge.

4 at køteløpere er tlfeldg trukket ut de er vel arere behedg valgt ut av forkjellge lad køteforbud. For det adre vrker det tvlomt å ata at alle tdee oppådd data tammer fra amme fordelg og med at det er tore dvduelle forkjeller teeve mellom de forkjellge køteløpere. Et alteratv om tar he tl de vedgee ka være de ekle regrejomodelle om Løvå etter opp avtt 7.3.. I de modelle ertatte Y med tokatke varable, Y, Y,, Y, e for hver køteløper, og obervajoe oppfatte om e obervajo av Y. På de ae de oppfatte -ee (5000m-tdee) om gtte tall (om ka være rmelg her de v øker å forklare Y -ee ved -ee). Sammehege uttrkke ved å potulere (derα kalle alfa og β kalle beta ) Y = α + β + e for =,,, der e, e,, e ata å være tokatk uavhegge retledd om alle forutette å ha forvetg, Ee ( ) = 0, og amme vara, var( e ) = σ. Dette mplerer at Y har forvetg EY ( ) = α + β + Ee ( ) = α + β om altå varerer med 5000m-tde. V er dermed at fordelge tl Y varerer med de forvetge varerer med. Y er altå e tokatk varabel om måler 500m-tde for e løper om dage før har oppådd e 5000m-td på. Salghetfordelge for Y ata å være et uttrkk for utallge tlfeldgheter om ka plle ved et lkt 500m-løp om dagform, e kvaltet, ov. Dee modelle, om altå ata å repreetere populajoe dataee er trukket fra, eholder tre ukjete parametre, αβ, og σ de fortad at dere ae verder er ukjete. Modelle er de eklete varate av e regrejomodell, og de eete om behadle dette kuret. Det ver eg (jfr. kapttel 7 Løvå) at hv dee modelle ka ae om e akeptabel bekrvele av populajoe dataee, (, ), (, ),,(, ), er trukket fra, å vl mkvregrejolje ovefor ve eg være det bete etmatet for (de ukjete) regrejolja, = α + β populajoe, og v ka tolke dataee forhold tl dee modelle, ved bruk av teore kapttel 6 og 7. V vl komme tlbake tl dette et eere otat år relevat teor fra kapttel 6 er etablert. Øvele Ecel Du treger module Data aal for å løe oppgave. Sjekk at Data aal lgger på data-mee. Hv kke, må de legge tl ( add ): I te Ecel verjo: Start fra offce butto (e rkel øvert tl vetre på Ecel-arket). Klkk å på ecel opto helt edert på mee om kommer fram. Og vdere: offce butto ecel opto add- marker Aal toolpack Klkk Go.. merk av Aal toolpack klkk OK.

5 (I eldre Ecel: Fra mee: tool add- merk av Aal toolpack klkk OK.) ) Lat ed køtedataee fra http://folk.uo.o/haraldg/. ) Lag to kolloer ved de av hveradre -ee (5000m) og -ee (500m), målt ekuder (ute Ekl Ervk). 3) Bereg,,,, [Få fra Decrptve Stattc eller fra Covarace 6, begge ruter Data aal ] 4) Bereg a, b, SST, SSR, SS E fra de fem verdee 3). 5) Kjør Ecel regrejorute ( regreo Data aal ) og detfer a, b, SST, SSR, SS E utkrfte. 6) Reproduer fgur ( avtt ) 6 E lte modfkajo: Covarace gr kke ekakt,,, me,, multplert med ( ) / om ebærer at Ecel der deler ummee på tedefor. For å få fram våre multplere tallee Covarace med ( ). ho o. og,,, bør ma altå fra Decrptve Stattc dermot er defert om

6 Appedk Det kreve kke dette kuret at ma beherker algebrae bak formlee ovefor. Det om kreve er at ma ka bruke formlee og tort ett kjøer hva de tår for. På de ae de er kke algebrae verre e at tudeter på forutatt vå for Eco 30 bør kue følge med på de, og oe vl (forhåpetlgv) være gjerrge over å vte hvorda formlee har opptått. Uaett lpper ma kke ua e grudgere treg dee algebrae eere (økoometr-) kur. Algebrae er preget av ummer. For dem om føler eg utrgge med umme-mapulajoer har jeg oppummert de vktgte reglee avtt A. A (a) (b) (c) Noe regler for ummer Hv uttrkk umme uttrkk elv er e um betåede av flere ledd, gjelder = ummeteget ku for det førte leddet uttrkk altå tl førte plu eller mu dukker opp uttrkket. Hv ma øker at ummeteget kal omfatte mer e bare førte ledd, må ma bruke parete. [Ekempel: 3 betr (+ + + ) 3. Med adre ord, 3 = hører kke med uder ummeteget. Om ma øker at 3 kal være med uder ummeteget, må ma bruke parete: ( 3) = 3+ 3+ + 3 = (+ + + ) 3 ] = Hv c er e kotat, er [ = = c = c c = c + c + + c = c ] E felle faktor e um ka ette utefor umme: [ c + c + + c = c ( + + + ) ] c = c = = (d) Hv abcd,,, er kotater, gjelder ( a + b + c + dz ) = a + b + c + d z = = = = [ Se ved å krve ut umme tl vetre og orde om på leddee. V vet jo at edrg av rekkefølge av leddee e um kke edrer umme, om for ekempel, 3 5= 3 + ( 5) = 5+ 3. ]

7 A Bev for regel 3 (Frvllg leg) Regel : Det er ok å ve (c) ( ) = ( )( ) =, de (a) og (b) følger av = = (c) ved å ette = for alle (c): V bruker A og får A( d) ( )( ) = ( + ) = + = = = = = Nå er = (av defjoe av gjeomtt) og = = =, og v får ( )( ) = + = = = = Bev lutt. Regel : Oppgave er å løe lggee () og () med he på a og b, der () d = 0 (eller = ( a b) = 0 ) = () d = 0 (eller = ( a b) = 0 ) = Av () og A(d) får v A( d) 0 = ( a b ) = a b = a b = = = Deler v med på begge der, får v 0 = a b, om gr (4) a = b Av () og A(d) får v (5) A( d) a b a b a b = = = = = 0 = ( ) = ( ) =

8 Av regel fer v uttte at om ver at = ( ) + og = ( ) + = =. Ved tllegg =, får v ved ettg (5) = (4) ( ) ( ) ( ) 0 = ( ) + a b ( ) + = = ( ) + b b ( ) + = = ( ) + + b b( ) b = ( ) b( ) = ( )( b ) = (6) b = er løge. Stregt tatt er det ødvedg å ve at løge gtt ved (4) og (6) faktk betemmer et mmum for Q. Jeg hopper over de dele og hever tl Sdæter for dette (for å lppe å brge matre av aederverte av Q og de determat. Om ma lkevel vl gjøre det, er det kke vakelg å fe de ae-derverte og e at både determate og hoveddagoalelemetee er potve, om er e tltrekkelg betgele for mmum her.) Bev lutt. Regel 3: (a) SST = SSR + SSE Reultatet følger gje okå drekte av relajoee () og (). Det førte v merker o, er at -ee og ˆ -ee må ha amme gjeomtt, ŷ =. Dette følger av () de 0 = d ( ˆ ) ˆ = = ˆ =. Deler v begge der på, får v ŷ, eller = = = = =. Dermed ka v forekle R ( ˆ ). = SS = SS R tl Ved å legge tl og trekke fra ˆ, får v for alle ˆ ˆ ˆ = + = + d om gr ( ) = ( ˆ ) + d + ( ˆ ) d Ved å ta umme av begge der får v (jfr A) = =

9 SS = SS + SS + ( ˆ ) d T R E = Bevet vl være fullført om v ka ve at de te umme er ull. Dette følger av () og () ved: A( d) () A( d) ( ˆ ) d = ˆ d d = ˆ d = ( a + b ) d = ad + b d = = = = = = = = og bevet for (a) er fullført. = = (),() = a d + b d = 0 (b) følger av defjoe på Bev for (c):. Ved å legge tl og trekke fra d og ette for a fra (4), får v for hver d = a b = + ( b) b = + b b = = b ( ) Dermed m = = ( ( )) Q = d = b = A = ( ) b ( ) b( )( ) = = = + = ( ) b ( ) b( ) = + = (6) =( ) + ( ) 4 = + = = ( ) ( ) ( ) = = r Altå SS = Q = r E m ( ) ( ) Bev lutt.