Oversikt over tester i Econ 2130

Like dokumenter
Oversikt over tester i Econ 2130

Oversikt over tester i Econ 2130

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Eksempel 1 - Er gjennomsnittshøyden for kvinner i Norge økende?

Om enkel lineær regresjon II

Om enkel lineær regresjon II

Om enkel lineær regresjon II

Regler om normalfordelingen

Econ 2130 uke 15 (HG)

Løsningskisse seminaroppgaver uke 17 ( april)

Regler om normalfordelingen

Regler om normalfordelingen

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Oversikt over konfidensintervall i Econ 2130

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Løsningsforslag Eksamen i Statistikk Nov 2001 Oppgave 1 a) Det fins 8 mulige kombinasjoner. Disse finnes ved å utelate ett og ett tall.

TMA4245 Statistikk Eksamen mai 2016

Statistikk med anvendelse i økonomi

TMA4245 Statistikk Eksamen august 2014

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

STK1100 våren Konfidensintevaller

Seminaroppgaver for uke 13

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk

1. Konfidens intervall for

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Estimering. Målemodellen. Kp. 5 Estimering. Målemodellen.

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT. Innleveringssted: Ekspedisjonen i 12. etasje (mellom ) OG Fronter (innen klokken 15).

Forelesning 19 og 20 Regresjon og korrelasjons (II)

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

TMA4240 Statistikk Høst 2016

EKSAMEN løsningsforslag

Analyse av sammenhenger

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

TMA4245 Statistikk Eksamen 21. mai 2013

Forelesning Ordnings observatorer

Forelesning Enveis ANOVA

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Oversikt over konfidensintervall i Econ 2130

(ii) Anta vi vet om en observasjon av X at den ikke er større enn 5. Hva er da sannsynligheten for at den er lik 5? (Hint: Finn PX ( = 5 X 5) ).

Forelesning Punktestimering

Econ 2130 uke 13 (HG)

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Oversikt over konfidensintervall i Econ 2130

Mer om Hypotesetesting (kap 5) Student t-fordelingen. Eksamen. Fordelingene blir like ved stor n:

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Econ 2130 Forelesning uke 11 (HG)

Oversikt over konfidensintervall i Econ 2130

Statistikk og økonomi, våren 2017

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner

Forelesning 3 mandag den 25. august

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Positive rekker. Forelest: 3. Sept, 2004

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ECON240 Statistikk og økonometri

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Om enkel lineær regresjon I

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Om enkel lineær regresjon I

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

STK1100 våren 2017 Estimering

Mer om utvalgsundersøkelser

Gråtonehistogrammer. Histogrammer. Hvordan endre kontrasten i et bilde?

Forelesning Z-, t-test, test for forventningsdifferanser

Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

TMA4240 Statistikk Høst 2016

Kap. 9: Inferens om én populasjon

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Estimering 1 -Punktestimering

Estimering 1 -Punktestimering

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

TMA4245 Statistikk Eksamen mai 2017

TMA4240 Statistikk Høst 2015

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

i B maksimal b Fundamentalteoremet for lineærprogrammering Den leksikografiske metode Blands pivoteringregel MoD233 - Geir Hasle - Leksjon 4 2

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

Kap. 9: Inferens om én populasjon

TMA4245 Statistikk Eksamen august 2015

Transkript:

1 HG Revdert aprl 217 Overskt over tester Eco 213 La være e ukjet parameter (populasjos-størrelse) e statstsk modell. Uttrykket ukjet parameter betyr at de sae verde av populasjoe er ukjet. Når v setter opp e statstsk modell (som represeterer populasjoe v trekker data fra), atar v utgagspuktet at modelle er sa for e vss (ukjet) verd av parametere og usa for alle adre verder. Aførselstegee rudt sa ovefor skyldes at begrepet sa parameterverd ku gr god meg dersom forutsetgee som er foretatt modelle er realstske forutsetger om populasjoe. I dette kurset har de hypotesee v tester om (de sae ukjete verde av) tre alteratve former beskrevet tabelle uder. Merk at står for e kjet (!) hypotetsk verd som er bestemt av de uderlggede problemstllge: De sae verde av ka godt være lk, me behøver slett kke være det! Problemet er ettopp at v kke vet hvor de sae verde av befer seg. Alteratvt problem H H 1 1 2 3 Type Esdg problem Esdg problem Tosdg problem La ˆ ˆ være e passede estmator for, slk at W er tlærmet (evetuelt eksakt) N(,1) -fordelt ( oe tlfeller t-fordelt), uasett hva de ukjete verde av θ er, og der er e eller ae estmert versjo av stadardfele tl ˆ. V bruker W tl å lage et 1 kofdestervall for θ. Vår testobservator, Z ˆ får v da ved å bytte ut med W. Z ka brukes som testobservator alle de tre alteratve problemee.

2 Merk (NB!) forskjelle mellom Z og W: W er e kke-observerbar stokastsk varabel med samme (tlærmet) kjete fordelg uasett hva de sae verde av er. Z, dermot, er e observerbar (sde er e kjet verd bestemt av problemet) stokastsk varabel som er (tlærmet) N(, 1) -fordelt (eller t-fordelt) bare hvs (for så fall, og bare da, er Z W ). Hvs de sae verde er forskjellg fra, har Z e ae sasylghetsfordelg. Sde ˆ er e estmator for de ukjete (sae) verde av, har v ˆ, dvs. ˆ faller ærhete av θ, hvorav Z ˆ faller ærhete av som er > hvs og < hvs. Derfor bør v forkaste H problem-alteratv 1 hvs Z er tlstrekkelg stor postv ( Z c1 ). I alteratv 2 bør v forkaste H hvs Z er tlstrekkelg stor egatv ( Z c2 ), og alteratv 3 bør v forkaste H hvs Z ete er tlstrekkelg stor egatv eller tlstrekkelg stor postv ( Z c3 eller Z c4 ). c1, c2, c3, c 4 er passede krtske verder. Som det beste kompromss mellom to motstrdede krav tl kotroll av sasylghete for fel av type I og fel av type II, vser det seg at de krtske verdee c1, c2, c3, c 4 alle de tre alteratvee ekelt ka bestemmes som løsge av lgge P ( ), der er det valgte sgfkasvået.. Merk at sasylghete lgge ku bereges det speselle tlfellet at. Da er Z (tlærmet) N(,1) -fordelt. For eksempel alteratv 3 får v P ( ) P ( Z c ) P ( Z c ). Velger v 2 for begge sasylghetee (som ka vses er det beste valget) får v 3 4 c3 z 2 og c4 z 2..

3 Tabell 1 Strukture av Z-tester (Jfr. stuasjo 1 og 3 tabell 2 og alle tre stuasjoer tabell 3) Alteratv H H 1 Testobservator 1 Z 2 3 -vå test: hvs P verd z er observert verd av Z) ˆ Z z P ( ) Z z o Z ˆ Z z P ( Z z ) o Z ˆ Z z 2 eller Z z 2 2 P ( Z z ) o Mer kokret skrver v ut edefor hvorda Z-testee ser ut for alteratv 1 forskjellge modell-stuasjoer tabell 2 og 3. Alle testee er såkalte Z-tester. Eeste utak er stuasjo 2 tabell 2 (t-test) der eeste forskjell er at N(,1) -fordelge er byttet ut med t 1 -fordelge. ( o Tester om forskjellge varater av ud-modelle I alle ud modellee går forutsetge: (*) X1, X 2,, X er uavh. og detsk fordelte med EX ( ) og var( X ) 2

4 Tabell 2 Tester for H: mot H1: (som er alteratv 1 tabell 1) år ud-forutsetge (*) gjelder pluss forskjellge atakelser om fordelge tl hver ekelt X (Jfr. regel 6.18 og 6.19 Løvås.) Tlsvarede for alteratv 2 og 3 tabell 1 - der samme testobservator brukes me med forkastgskrterer som beskrevet tabell 1. ˆ Testobservator Forkastgkrterum Sgfkas- ( zo, t P verd Stuasjo Forutsetger (modell) W ~ N(, 1) ( ˆ ) o er Z (alteratv 1 vå uasett θ observert tabell 1) (grulag for KI) 1 (*) pluss atakelse: X ~ N(, ), 1,2,, 2 (*) pluss atakelse: X ~ N(, ), 1,2,, 3 Bare (*) der X er vlkårlg fordelt 4 Bare (*) der X er vlkårlg fordelt verd av ZT), Vlkårlg Kjet X X Z z ~ N(, 1) Z Eksakt P ( ) Z z o Vlkårlg Ukjet X X T t Eksakt ~ t 1, P 1 T ( ) T t o S S stor, Ukjet X tlærmet X Z z 3 ~ N(, 1) Z Tlærmet P ( ) Z z o S S (tl ød 2) lte Ukjet Ikke pesum (kke-parametrske metoder f.eks. Løvås avs. 8.5) Merkad 1. I prakss er atakelg stuasjo 3 de vktgste/valgste. Løvås er dessverre ltt kapp omtale av dee. Ha ever de ku avsttet etter regel 6.19. Merkad 2. Styrkefuksjoe er hos Løvås bare agtt stuasjo 1. De ka aturlgvs også bestemmes de adre stuasjoee, me er ltt mer komplserte og kke pesum.

5 Merkad 3. Når det gjelder de to regresjosparametree, og, regresjosmodelle, E( Y ) x, er møsteret for testg det samme som ovefor. Hvs står for e av dsse to parametree og ˆ er (mste kvadraters) estmator, blr W ( ˆ ) / ( ˆ ) t-fordelt med 2 frhetsgrader (merk 2-tallet!) for små ( 3), og tlærmet N(, 1) fordelt hvs er stor ( 3 ). Det sste gjelder selv om Y -ee kke er ormalfordelte. Av dette ka v lage kofdestervall for, ˆ t ˆ 2, 2 ( ), (kke samme som regresjoslja), og lage testobservator Z ( ˆ ˆ ) / ( ), som brukes på samme måte som ovefor. For eksempel, hvs H :, H1 :, forkastes H på vå (kke samme som kostatleddet regresjoslja) hvs Z t2, (eller Z z hvs 3 som gr tlærmet vå ). Detaljer om beregg av ˆ og ( ˆ ) ka fes regresjo II otatet på ettet. Regeeksempel 1 Er et gtt felt drvverdg for utvg av kadmum? V har data fra = 3 steprøver: La X være % kadmum prøve, 1,2,,3. Ata det er evdes data for at X kke er ormalfordelt. Sde er så stor som 3, treger v kke å vte oe om fordelge tl X for å kue gjeomføre e test. 2 MODELL: X1, X 2,, X er ud med E( X ) (ukjet), var( X ) (ukjet), der er gjeomsttlg % kadmum feltet. Feltet reges drvverdg hvs 8. V øsker å teste H : 8 ( ) mot H1 : 8 ( ), der altså hypotese at feltet er drvverdg ( 8 ) er lagt alteratvet ( H 1 ). X tlærmet Testobservator Z ~ N(,1) hvs 8. (der v altså har erstattet de ukjete σ med S og utytter det matematske resultatet fra S X vderegåede teor at de stokastske varabele W er tlærmet stadard ormalfordelt for 3 uasett hva de ukjete verde av µ S er. Dee egeskape tl W brukte v tl å lage et 1 kofdestervall for µ.).

6 tabell E4 Løvås Velg vå.1 z 2.326 (krtsk verd). (Tlærmet) 1%-vå test blr dermed: " hvs Z z 2.326". Data gr:.1.1 X obs 8 9.6 8 3, X obs 9.6, Sobs 3.1 Zobs 2.827 S 3 3.1 3 obs Koklusjo: (dvs. v har sterk evdes (vå 1%) for at feltet er drvverdg). Noe tester for dskrete modeller (bomsk, hypergeometrsk og posso) basert på tlærmg tl ormalfordelge. Se tabell 3 uder:

7 Tabell 3 Z-tester for alteratv 1 ( H : mot H1 : ) tabell 1, basert på regel 5.2 (ormaltlærmg for bomsk, hypergeometrsk og posso fordelg). Sgfkasvå tlærmet. (Tlsvarede for problem-alteratv 2 og 3 tabell 1 med samme testobservator, Z, og krtske verder som beskrevet tabell 1). Modell Estmator ˆ ˆ tlærmet W ~ N(, 1) uasett θ (følger av regel 5.2) Testobservator ( ˆ ) Z Betgelse for ormaltlærmelse Forkastgkrterum P verd ( z o er observert verd av Z ) X ~ b(, p ) X var( X ) 5 ( p(1 p) 5 p p(1 p) tlærmet ~ N(,1) Z p p (1 p ) Z P ( Z z ) z p p o X ~ hypergeom. (, M, N) ( p M N) X var( X ) 5 p p(1 p) N N 1 tlærmet ~ N(,1) Z p p(1 p) N N 1 Z P ( Z z ) z p p o X ~ pos( t) 1 ˆ X t var( X ) 5 ( t 5) ˆ tlærmet t ~ N(, 1) ˆ Z Z z P t ( ) p p Z zo Merkad 4 Merk at v (som Løvås) har brukt p og stedet for ormalfordelge lgge P ( ) og ˆ evere på Z. Dette er for å forbedre tlærmelse tl tl bestemmelse av de krtske verde. (Derfor treger v kke å estmere 1 Husk at otasjoe X ~ pos( m ) er valgt slk at det som står på m s plass alltd er lk EX ( ) (som også er lk var( X ) posso-fordelge). Hvs det for eksempel e oppgave fremgår at X ~ pos(3,7), følger automatsk at E( X ) var( X ) 3,7. Av modelle tabelle følger således at E( X ) var( X ) t.

8 her.) E alteratv test (kke evt pesum) er å bruke og ˆ stedefor p og. De test-varate har tlærmet de samme egeskapee som de foreslåtte og dukker av og tl opp ltterature. Regeeksempel 2 Tosdg test e bomsk modell Ata v er teressert å sjekke om e gtt terg er rettferdg med hesy på å produsere seksere. V kaster terge 1 gager og regstrerer atall seksere v får. La X være atall seksere v får. E åpebart (hvorfor?) rmelg modell er: X ~ b(, p ) der p er sasylghete for å få sekser et ekelt kast, og 1. Hvs terge er rettferdg m.h.p. seksere, er p 16. Dette 2 vl utgjøre vår ullhypotese, H. Hvs p 16aser v terge kke rettferdg m.h.p. seksere. V skal altså teste H : p p mot H : p p 1 der p 16. V er å e stuasjo beskrevet tabell 3 testoverskte kombert med alteratv 3 tabell 1. I det geerelle opplegget er ˆ X ˆ p(1 p) p, ˆ p 1 6, p og ( ) hvs 3 p p Betgelse for å kue beytte ormaltlærmelse, var( X ) 5 er klart oppfylt sde var( X ) 1 p(1 p) er godt over 5 for p ærhete av 1/6. Testobservatore er ˆ X p X p X p Z ( ˆ ) p(1 p) p(1 p) p (1 p) tlærmet som er (tlærmet) stadard ormalfordelt, Z ~ N (, 1), hvs p p. Velger v sgfkasvå 5%, får v de to krtske verdee, z z, fra N(,1) -fordelge. Testkrteret for vår 5%-vå test blr dermed (jamfør tabell 1 testoverskte) 2.25 1.96 hvs Z 1.96 eller Z 1.96 2 Ved tosdge problemer plasseres alltd lkhetsalteratvet ( ) H. V har altså ved tosdge problemer kke det samme dlemmaet som oppstår esdge problemer om hvlke av de to hypotesee som skal utgjøre H. 3 Jamfør merkad 4 etter tabell 3.

9 eller X p X p hvs 1.96 eller 1.96 p (1 p ) p (1 p ) V kue ha stoppet her. Imdlertd, for å få e mer praktsk avedelg forkastgsregel dette tlfellet, ka det være e de å overføre krteret tl et krterum for X drekte som følger: Krteret er klart ekvvalet med hvs X p 1.96 p (1 p ) eller X p 1.96 p (1 p) som ved settg av 1 og p 1 6 gr hvs X 9.36 eller X 23.97 eller, sde X bare ka ta hele tall som verder, (*) hvs X 9 eller X 24 V har å overført teste på e ekel form. V har fått e regel som ser at X-verder blat tallee1,11,12,,23 er foreelg med hypotese at terge er rettferdg m.h.p. seksere, mes X-verder utefor dsse gr sterk evdes (med vå tlærmet 5%) for at terge kke er rettferdg. Det omelle vået v har brukt,.5, er pga dverse tlærmelser og tlpasger, bare tlærmet. Sde Excel ka berege bomske sasylgheter, ka v å bestemme sgfkasvået for teste (*) mer eksakt. La betege det sae vået for teste, som er sasylghete s Pp 1/6(forkaste H). Ved hjelp av BINOM.DIST-fuksjoe Excel fer v (sjekk selv): P (forkaste H ) P ( X 9) P ( X 24) P ( X 9) 1 P ( X 23) s p1/6 p1/6 p1/6 p1/6 p1/6.211.962.59 V ser at det omelle vået (5%) gr e rmelg god tlærmg tl det sae vået (5.9%) dette tlfellet. s