ECON 3 HG a 3 Supplemet tl sste forelesg 3 vår 4 eksempler på test-dskusjoer klusve ltt om p-verder Eksempel - Er gjeomsttshøyde for kver Norge økede? et er velkjet at gjeomsttshøyde for meesker Europa har økt jevlg over td uder 9-hudretallet Er dee tedese fortsatt tl stede? Sde v har samlet data for mødres og døtres høyder, ka v for eksempel spørre om dette datamateralet tyder på e fortsatt økede tedes blat kver Norge år det gjelder høyde La for datter r utvalget X betege mors høyde og Y datters høyde for =,,,, der = 6 - det v slår samme data fra - 3 V atar uavhegghet og felles fordelg for X -ee og tlsvarede for Y -ee Skrv forvetgee som µ = EX ( ) og µ = EY ( ) for døtree E økede tedes ka dee modelle uttrykkes som at µ > µ, eller, mao, µ > At det kke er oe økede tedes uttrykkes ved µ = et er aturlg å å tolke problemstllge som et hypoteseprøvgsproblem der hypotese µ > plasseres alteratvet : H : µ µ mot H : µ > Som mål på hvor mye evdes det er data for påstade H : µ >, vl v berege p- verde basert på data og e passede test esto lavere p-verde er, desto mer evdes er det data for H La for par r høydeforskjelle mellom mor og datter være, = Y X et er å rmelg å ata (som vl være vår modell) at,,, er ~ ud (uavhegge og detsk fordelt) med V kue lke gjere brukt lkhetsteg H stedefor, som vrker mer logsk og med at mulghete µ < eppe er aktuell Nå vser det seg mdlertd at samme test med samme egeskaper, samme H formuleres med = eller med Grue tl at v bruker koklusjo og samme p-verd ka beyttes ete er at hypotesee å har samme form som er behadlet kapttel 6 Løvås og testoverskte på ettet et gjør altså kke oe forskjell prakss om H omfatter oe uteressate mulge verder for µ
Regel 4 θ µ µ ), og var( ) = σ Både θ = µ og felles forvetg, E( ) E( Y X ) E( Y ) E( X ) parametere θ for µ parametre, og problemet er å teste H : θ mot H : θ > = = = = (der v har ført σ ases som ukjete V ser at v er stuasjo 3 tabell testoverskte på ettet og at testervatore er ˆ θ θ Z =, der θ =, ˆ θ = = SE( ˆ, og ˆ S SE( θ ) =, der S = ( ) θ ) = ermed Z = = et er klart (jfr begruelse for tabell testoverskte) at S S v skal forkaste H for tlstrekkelg store erverte verder av Z (dvs Z, også kalt zo testoverskte), og at de krtske verde basert på sgfkasvået, er z (de øvre - kvatle N(, )-fordelge) Testkrteret for e (tlærmet) -vå test blr således () hvs Z ette krteret er ekvvalet med testkrteret > z = () Forkast H hvs ˆ < der ˆ er p-verde som bereges ut fra data som P ( ) θ= θ Z > z o der z beteger de erverte verde av Z som er det tallet v får år v setter data Z (også kalt Z oe steder) Sde Z er (tlærmet) N(, ) -fordelt år θ = θ =, ka v bruke tabell 3 bak Løvås tl å fe ˆ Beregg: Ut fra data fer v (sjekk selv med data på http://folkuoo/haraldg/ ) ved Excel de erverte verdee, = 65, S = 6388,, 65 som gr ervert verd av Z: z = 6 = 95 6388 Av dette fer v p-verde: Pθ = Tabell 3 Løvås ˆ = ( Z > 3) 93 = 968 skusjo: Ut fra krteret () vl e p-verd på 97% tls at v kke ka forkaste H om v bruker sgfkasvå for eksempel 5% eller % Hadde v akseptert et sgfkasvå på % (som vlle vært uvalg), vlle v kuet forkaste H Kovesjoelt ases e p-verd på 97% valgvs et for tyt evdesgrulag for å påstå H : θ > Resultatet ases kkesgfkat Følger av defsjoe av ˆ som det mste vået ut fra data som leder tl forkastg av H
3 På de ae sde lgger 97% såpass ær sgfkasområdet at årsake tl kke-forkastg godt kue være at θ er bare ltt større e slk at H bare så vdt er sa oe som slett kke er utekelg over bare e geerasjos tdsforskjell et vlle kreve lagt flere ervasjoer e vårt materale for å kue avsløre e θ som er postv me ær Hvs for eksempel de sae verde av θ var 5 cm (dvs at gjeomsttshøyde har økt med 5 cm fra mødre- tl dattergeerasjoe), så vlle sasylghete for å oppdage dette (dvs forkaste H ) med e 5% vå test kke være større e ca 6% 3 For å ha e rmelg sjase å avsløre det dette tlfelle, vlle v derfor trege lagt flere ervasjoer e våre 6 ervasjospar E aturlg koklusjo på aalyse e evetuell rapport vlle derfor være å s at det kke er formasjo ok data tl å kue påstå at det har vært e økg av gjeomsttshøyde samme med e abefalg å hete flere ervasjoer for å få avklart problemet Eksempel - Om T-testg Grue tl at v kue bruke e Z-test eksempel (der v reger som om populasjosstadardavvket, σ, for var kjet lk estmatet, S, ), er at v hadde så mage ervasjoer som 6 Hvs v hadde hatt færre ervasjoer, for eksempel bare = stedefor 6, vlle kke leger Z-teste være velbegruet sde tlleggs-uskkerhete som oppstår ved å erstatte σ med estmatet S,, kke leger er eglsjerbar V ka dette tlfellet bruke e T-test stedet, dersom det er rmelg å forutsette tllegg tl forutsetgee eksempel at ekeltervasjoee,, er ormalfordelte, ~ N( θ, σ ), =,,, La problemet uttrykt ved H, Hvære det samme som eksempel Testervatore vl å være de samme som Z eksempel (bare at det å er mer valg å kalle de T), ˆ θ θ = = = =, T Z SE( ˆ θ ) S S me fordelge for T er å t -fordelt (stedefor N(, ) -fordelt) hvs θ = θ, oe som gjør at de krtske verde blr edret tl t, (stedefor z ) e krtske verde, c= t,, er emlg løsge av lgge Pθ= θ(forkast H ) = Pθ= θ( T > c) = med hesy på c ee teste er oppsummert uder stuasjo tabell testoverskte For eksempel, hvs v øsker vå 5% ( = 5) og =, blr Z-teste som () ovefor fortsatt (3) hvs Z > z5 = 645 3 ette er e styrkeberegg som du ka sjekke selv: Ata de sae verde av θ er θ = 5 og at v velger vå 5% a er de krtske verde z = 645, slk at H forkastes hvs Z > 645 erk at hvs θ = 5, er 5 5 5 kke leger Z ~ N(, ) ermot er W = ~ N(, ), og Z = W + ermed S S 5 P (forkaste H ) = PZ ( > 645) = P W> 645 6 PW ( > 65) = 6 θ = 5, S der v, for ekelthets skyld, har erstattet S med estmat-verde 6388
4 mes de mer korrekte T-teste blr år = (der altså Z og T er lke) (4) hvs T > t9, 5 = 833 (fra tabell 5 bak Løvås) Som tabell testoverskte vser, ka p-verde bereges ved ˆ = Pθ= θ( T > t ) o, der t o beteger de erverte verde av T bereget ut fra data Hvs v tllegg tl modelle eksempel atar at er ormalfordelt (som er e rmelg forutsetg dette tlfellet), er testervatore T = Z ~ t6 -fordelt hvs θ = θ T-fordelge ka bereges ved TISTfuksjoe Excel Bruker v de og de ervert verde av T, t = z = 95, får v de mer korrekte p-verde: ˆ = P ( T > t ) = P ( T > 95) = 986 θ= θ o θ= θ som er praktsk talt det samme som de tlærmete p-verde, 968, v fkk eksempel basert på N(, )-fordelge e llustrerer at tlærmelse brukt eksempel er fullt tlfredsstllede år v har så mage ervasjoer som 6 For sammelgges skyld ata at v hadde oppådd samme ervert verd av T (95), me bare basert på = ervasjoer a vlle de mer korrekte p-verde være basert på t 9 -fordelge som følge TIST Excel blr: ˆ = P ( T > t ) = P ( T > 95) = 4 θ= θ o θ= θ mes de tlærmete p-verde fra eksempel fortsatt vlle være 97 Her er forskjelle kke leger eglsjerbar Tl eksame har v kke tlgag på Excel Hvs v treger å berege e p-verd basert på e t- fordelg, ka v bare bruke de begresete formasjoe gtt tabell 5 bak Løvås I eksempel 66 (sde 5) gr Løvås eksempel på e slk bestemmelse ute forklarg, og flere studeter har lurt på hvorda ha kommer fram tl svaret Problemet er å udersøke om data (8 ervasjoer) tyder på at forvetet vekt på hamburgere er mdre e påstått vekt g Hvs X beteger vekt av hamburger utvalget, beyttes modelle: X, X,, X ~ ud ( = 8 ) og ormalfordelt, X ~ N ( µσ, ) V skal teste H : µ mot H: µ < V er å stuasjo tabell testoverskte på ettet med alteratv tabell I det geerelle opplegget blr θ = µ, θ ˆ ˆ = µ =, θ = µ = X, og ( ˆ S SE θ ) = Testervatore T ˆ θ X 8 θ = = SE( ˆ θ ) S er t-fordelt med 7 frhetsgrader hvs de sae verde av µ er µ = θ = E -vå test består å forkaste H hvs T blr tlstrekkelg lte, slk at testkrteret er hvs T < t, der de krtske verde, t,, er løsge av lgge Pµ = (forkast H) = Pµ = ( T < c) = med hesy på c P-verde bereges ved P ( ) µ = T < t o der t o er de erverte verde av T Løvås fer t o = 43, slk at p-verde blr
5 ˆ = ( T < 43) der T ~ t7 -fordelt hvs µ = Pµ = ee aslår Løvås tl ute forklarg Ha har da brukt formasjoe om t 7 - fordelge tabell 5 bak Løvås Tabelle gr t 7, som oppfyller PT ( > t7, ) = for oe utvalgte ermed ka v plukke ut følgede sasylgheter fra t 7 -fordelge: PT ( > t) 5 5 5 5 t 7 45 895 365 998 3499 Sde t-fordelge er symmetrsk om, blr p-verde, ˆ = PT ( < 43) = PT ( > 43) Tabelle gr PT ( > 365) = 5 og PT ( > 998) =, som tlser at PT> ( 43) lgger mellom og 5 dvs ærhete av tatt på øyemål som er Løvås aslag (erk at leær terpolasjo vlle atakelg g et bedre aslag, me er kke pesum slk at øyemålsmetode er fullt akseptabel tl eksame) E p-verd på % vl ormalt tolkes som sterk evdes for H sde valgte sgfkasvåer helt ed mot % vlle lede tl forkastg av H erkad I regresjosmodelle som er behadlet pesum vl testg av e av parametree forvetge tl Y være e t-test med det samme opplegget som t-testg av µ ˆ θ θ Testervatore har samme form som før, T = Har ma derfor reget ut de SE( ˆ θ ) erverte verdee av ˆ θ og SE( ˆ θ ), har ma ok formasjo tl å kue gjeomføre teste e eeste forskjelle er at ma bruker t-fordelg med frhetsgrader stedefor (Se regeeksempel regresjo II otatet (eller Løvås kapttel 7)) et ka eves at følge vderegåede teor blr atall frhetsgrader bestemt av atall ukjete parametre forvetge tl respose ette atallet trekkes fra I regresjosmodelle er det to ukjete parametre forvetge, mes µ -modelle er det bare e ukjet parameter forvetge ( µ ) Eksempel 3 P-verder er yttge P-verde, ˆ, er defert som det mste sgfkasvået som leder tl forkastg av H ˆ er bestemt av data og teste som beyttes Hvs det er bare e krtsk verd teste, ka ˆ bereges som de som gjør at de krtske verde faller samme med de erverte verde av testervatore Hvs teste har et valgt sgfkasvå på, er teste ekvvalet med testkrteret: hvs ˆ < ette betyr at hvs v får oppgtt p-verde for e test, ka v gjeomføre teste ute å kjee hverke tl testervator eller krtsk verd et er ok å sjekke om p-verde er mdre eller kke det vået som v har valgt ( ) Hvs p- verde er mdre e forkaster v H For eksempel: I eksempel påsto jeg at forutsetge at dfferese fra eksempel er ormalfordelt, er e rmelg forutsetg et er mage tester for å sjekke statstsk realsme
6 av forutsetge sse testee er ofte ltt komplserte og lagt utefor pesum å kjee tl Imdlertd er det pesum å forstå betydge av e p-verd, slk at om v få oppgtt e p-verd basert på e slk test, ka v lkevel tl e vss grad vurdere realsme av forutsetge Excel har kke mplemetert oe slke tester så vdt jeg vet me programmet STATA (som brukes Stat kurset) har flere For eksempel bruker v Shapro-Wlk teste STATA, som er aerkjet som e god test, på de 6 - -ervasjoee eksempel, vser utskrfte at p-verde er 34 Nullhypotese ( H ) er at -ee er trukket fra e eller ae ormalfordelg mes alteratvet ( H ) er at de er trukket fra e fordelg som kke er ormal ee p-verde lgger lagt ua sgfkate verder - slk at v ka kokludere: et er kke oe evdes data som tyder på at forutsetge om ormalfordelg er urealstsk Adre ormalfordelgstester STATA vser seg å g lgede resultater Eksempel 4 Tosdg testg e bomsk modell Ata v er teressert å sjekke om e gtt terg er rettferdg med hesy på å produsere seksere V kaster terge = gager og regstrerer atall seksere v får La X være atall seksere v får E åpebart (hvorfor?) rmelg modell er: X ~ b( p, ) der p er sasylghete for å få sekser et ekelt kast, og = Hvs terge er rettferdg mhp seksere, er p = 6 ette 4 vl utgjøre vår ullhypotese, H Hvs p 6 aser v terge kke rettferdg mhp seksere V skal altså teste H : p = p mot H : p p der p = 6 V er å e stuasjo beskrevet tabell 3 testoverskte kombert med alteratv 3 tabell I det geerelle opplegget er ˆ X θ p, θ p 6, θ pˆ og SE( ˆ θ) p ( p ) = = = = = = hvs 5 p = p Betgelse for å kue beytte ormaltlærmelse, var( X ) 5 er klart oppfylt sde var( X) = p( p) er godt over 5 for p ærhete av /6 Testervatore er Z ˆ θ θ X p X p X p = = = = SE( ˆ θ ) p( p) p( p) p( p) 4 Ved tosdge problemer plasseres alltd lkhetsalteratvet ( θ = θ ) H V har altså ved tosdge problemer kke det samme dlemmaet som oppstår esdge problemer om hvlke av de to hypotesee som skal utgjøre H 5 Jamfør merkad 4 etter tabell 3 testoverskte
7 tlærmet som er (tlærmet) stadard ormalfordelt, Z ~ N (, ), hvs p= p Velger v sgfkasvå 5%, får v de to krtske verdee, ± z =± z5 =± 96, fra N(, ) - fordelge Testkrteret for vår 5%-vå test blr dermed (jamfør tabell testoverskte) dvs hvs Z < 96 eller Z > 96 X p X p hvs < 96 eller > 96 p ( p ) p ( p ) For å få e mer praktsk avedelg forkastgsregel dette tlfellet, ka det være e de å overføre krteret tl et krterum for X drekte Krteret er klart ekvvalet med hvs X < p 96 p( p) eller X > p + 96 p( p) som ved settg av = og p = 6 gr hvs X < 936 eller X > 397 eller, sde X bare ka ta hele tall som verder, (*) hvs X 9 eller X 4 V har å overført teste på e ekel form V har fått e regel som ser at X-verder blat tallee,,,,3 er forelg med hypotese at terge er rettferdg mhp seksere, mes X-verder utefor dsse gr sterk evdes (med vå tlærmet 5%) for at terge kke er rettferdg et omelle vået v har brukt, = 5, er pga dverse tlærmelser og tlpasger, bare tlærmet Sde Excel ka berege bomske sasylgheter, ka v å bestemme sgfkasvået for teste (*) mer eksakt La s betege det sae vået for teste Ved hjelp av BINOIST-fuksjoe Excel fer v (sjekk selv): s p= /6 p= /6 p= /6 p= /6 p= /6 = P (forkaste H ) = P ( X 9) + P ( X 4) = P ( X 9) + P ( X 3) = = + 96 = 59 V ser at det omelle vået gr e rmelg god tlærmg tl det vrkelge vået dette tlfellet