TMA4240 Statistikk Høst 2016

Like dokumenter
i x i

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN I FAG TMA4240 STATISTIKK

TMA4245 Statistikk Eksamen august 2014

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2009

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk Høst 2018

Fasit for tilleggsoppgaver

TMA4245 Statistikk Eksamen desember 2016

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Eksamensoppgave i TMA4245 Statistikk

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010 (22)

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

HØGSKOLEN I STAVANGER

Løsning eksamen desember 2017

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2015

ST0202 Statistikk for samfunnsvitere

Hypotesetest: generell fremgangsmåte

LØSNINGSFORSLAG ) = Dvs

Eksamensoppgave i TMA4245 Statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk Høst 2009

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgåve i TMA4245 Statistikk

Kapittel 9 og 10: Hypotesetesting

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Hypotesetesting. mot. mot. mot. ˆ x

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Eksamensoppgave i ST0103 Brukerkurs i statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

HØGSKOLEN I STAVANGER

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2015

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk H2010

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

6.2 Signifikanstester

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

TMA4240 Statistikk 2014

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Eksamensoppgåve i TMA4240 Statistikk

ECON240 VÅR / 2016 BOKMÅL

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Eksamen desember 2015

Kapittel 3: Studieopplegg

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kapittel 9 og 10: Hypotesetesting

Inferens i fordelinger

Hypotesetesting av λ og p. p verdi.

Transkript:

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper som nullhypotese og alternativ hypotese, testobservator, forkastning og akseptanse, og kritisk verdi. Oppgave 1 La X 1,..., X 5 være uavhengige og normalfordelt med ukjent forventningsverdi µ og ukjent varians σ 2. Observerte verdier for X 1,..., X 5 er: i 1 2 3 4 5 x i 5.00 4.48 5.60 4.25 5.44 a) Angi rimelige estimatorer for forventningsverdien µ og for variansen σ 2. Hva blir estimatene med dataene gitt over? b) Utled et 95% konfidensintervall for µ basert på observasjonene over. Forklar kort hvordan en fra dette konfidensintervallet kan avgjøre konklusjonen i en hypotesetest (signifikansnivå 5%) med alternativ hypotese H 1 : µ µ 0 for ulike verdier for µ 0. Oppgave 2 På ein av vegane inn til Trondheim er UP interessert i å måle effekten av ei holdingskampanje der målet var å få folk til å redusere farten på ei bestemt vegstrekning. På ein dag blei farten på 12 bilar målt. Vi skal gå utifrå at desse målingane er uavhengige og normalfordelte variable med forventing µ og standardavvik σ. Dei tolv observerte fartsmålingane er gitt nedanfor. x i : 75 61 85 65 69 82 70 67 62 93 77 74 Det oppgis at 12 i=1 x i = 880 og 12 i=1 (x i x) 2 = 1034.7. a) Forklar kva parameteren µ betyr i denne samanhengen. Skriv opp rimelege estimatorar for µ og σ i denne situasjonen. Kva blir estimata? b) Forklar kva som meinast med type 1 feil når vi utfører ein hypotesetest. Frå tidlegare undersøkingar har ein at gjennomsnittsfarten (av veldig mange bilar) var på 77 km/t. Tyder resultata frå desse målingane på at forventa fartsnivå på strekninga er lågare enn 77km/t? Formuler spørsmålet som ein hypotesetest, gjennomfør testinga og gje konklusjonen. Bruk 5% signifikansnivå. anb11-oppg-b 25. oktober 2016 Side 1

I punkt c) kan du gå utifrå at σ = 10km/t. c) Forklar kva vi meiner med type 2 feil og kva som er samanhengen mellom denne og styrken til ein test. Gå utifrå at forventa fart til bilane er gått ned til 74km/t. Finn sannsynet for at vi i testen i b) vil påstå at forventa fart til bilane er blitt lågare enn 77km/t. Finn deretter ut kor manga bilar vi må måle farten til for å få ein test som har styrke minst 0.90 når forventa fart µ = 74km/t. Signifikansnivået skal framleis vere 5%. Oppgave 3 Vi skal i denne oppgaven se for oss at vi kaster en mynt flere ganger. Mynten har 0.5 sannsynlighet for utfall mynt og 0.5 sannsynlighet for kron. Vi antar at utfallene av ulike myntkast er uavhengige. a) Anta at vi kaster mynten 5 ganger. Hva er sannsynligheten for å få 5 kron? Hva er sannsynligheten for å få 3 kron? Hva er sannsynligheten for å få minst 4 kron på rad, det vil si en sekvens (streak) av bare kron utfall som minst er av lengde 4? Vi kaster mynten 30 ganger. Fordelingen til lengste sekvens med kron er vanskelig å regne ut. I stedet kan vi bruke Matlab til å generere 30 stokastiske og uavhengige myntkast. La 0 betegne hendelsen mynt mens 1 betegner hendelsen kron. b) Lag en funksjon i Matlab som genererer 30 stokastiske og uavhengige myntkast. Tell opp den lengste sekvensen av kron eller mynt i rekken av myntkast, og la funksjonen returnere denne tallverdien. c) Bruk funksjonen du lagde i forrige deloppgave til å generere 1000 rekker med myntkast. Registrer den lengste sekvensen av kron eller mynt for hver av de 1000 rekkene, og fremstill resultatene i et histogram. Bruk også resultatene til å anslå sannsynligheten for å få en lengste sekvens på 5 eller 6 kron eller mynt etter hverandre. d) Miriam har fått hjemmelekse å kaste en mynt 30 ganger. Resultatet er som følger, der 0 betyr mynt og 1 betyr kron : (0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1). Læreren mistenker at Miriam har jukset og bare funnet på tallene istedenfor å faktisk kaste en mynt, og læreren vil undersøke dette. Formuler dette som en hypotesetest om lengste sekvens av kron. Bruk resultatene fra forrige deloppgave til å svare. Oppgave 4 Produsenten av en bestemt bilmodell hevder at denne modellen kan forventes å kjøre minst 16 km pr. liter bensin på motorvei. Forbrukerorganisasjonen FO tester denne påstanden ved å kjøre et tilfeldig utvalg biler av denne modellen en passende distanse på en representativ motorvei og måle bensinforbruket.

På bakgrunn av erfaringer fra tidligere forsøk av samme type, antar FO at bensinforbruket til en tilfeldig valgt bil av den modellen som testes, kan modelleres med god tilnærmelse som en normalfordelt tilfeldig variabel X med forventningsverdi µ og varians σ 2, dvs. X N(µ, σ 2 ). Både forventningsverdien µ og standardavviket σ er i utgangspunktet ukjente størrelser. Av praktiske grunner begrenser FO størrelsen på det tilfeldige utvalget til n = 20 biler. Etter forsøket ble alle målingene analysert, og resulterte i en gjennomsnittsverdi x = 15.56 og et sample (empirisk) standardavvik s = 0.94. a) Sett opp en hypotesetest for dette forsøket. La produsentens påstand representere nullhypotesen. Hvilken testobservator vil du bruke for å kontrollere hypotesen? Gi en kort begrunnelse for valget ditt. I forhold til et valgt signifikansnivå α = 0.05, vil du akseptere produsentens påstand? b) Finn P-verdien (signifikanssannsynligheten) for testen i punkt a) som svarer til de observerte verdiene. Hvilken tilnærmelse kan du gjøre for at testobservatoren skal bli normalfordelt? Hvilken P-verdi får du hvis du bruker denne tilnærmelsen? c) Bestem teststyrken for den alternative hypotesen H 1 : µ = 15.5 for signifikansnivå α = 0.05 ved å bruke den samme normaltilnærmelsen som i punkt b). Gi et forslag til hvordan teststyrken kan økes. Oppgave 5 Ved verdensmesterskap på enkeltdistanser på skøyter går hver deltager to 500 meters løp, ett løp hvor deltageren har indre bane i siste sving og ett løp hvor deltageren har ytre bane i siste sving. Rekkefølgen av deltagerne baserer seg på summen av tidene på de to løpene. Tilsvarende regel benyttes også i olympiske leker. Denne regelen ble innført fra og med verdensmesterskapet på Hamar i 1995. Tidligere ble rekkefølgen av deltagerne basert på kun et løp for hver deltager. Bakgrunnen for regelen om at hver deltager skal gå to løp er at det kan være en fordel å ha siste ytre siden løperne har stor fart i siste sving og i indre bane er krumningen større enn i ytre bane. I et mesterskap med n deltagere, la Y i og Z i betegne løpstidene for løper nummer i for løpene med henholdsvis siste ytre og siste indre. La videre X være antall av de n løperne som har sin raskeste løpstid i løpet med siste ytre, dvs. X er antall løpere som har Y i < Z i. Vi antar at X er binomisk fordelt, dvs. P (X = x) = b(x; n, p) der p = P (Y i < Z i ). a) Angi hvilke forutsetninger som må være oppfylt i situasjonen beskrevet over for at antagelsen om at X er binomisk fordelt skal være korrekt. Dersom n = 20 og p = 0.7, finn sannsynlighetene P (X 10) og P (X 8 X 10). b) Skriv opp rimelighetsfunksjonen (likelihoodfunksjonen) for p og benytt denne til å vise at sannsynlighetsmaksimeringsestimatoren for p blir p = X n. Vis at p er en forventningsrett estimator for p og at Var( p) = p(1 p)/n.

Videre i denne oppgaven skal vi benytte resultater fra 500 meter for menn i olympiske leker i Sochi i Russland i februar 2014 til å vurdere om det er grunnlag for å hevde at det er en fordel å gå siste ytre. Her var det n = 39 løpere som fullførte begge løpene, og av disse var det x = 24 som hadde sin raskeste løpstid i løpet med siste ytre. I de videre utregningene kan du om nødvendig gjøre approksimasjoner, men du må i så fall begrunne disse. c) Formuler en hypotesetest for situasjonen. Spesifiser H 0 og H 1, velg en passende testobservator og utled en beslutningsregel når signifikansnivået er α = 0.05. Hva blir konklusjonen av testen for resultatene fra Sochi. Regn også ut testens p-verdi basert på resultatene fra Sochi. Vi skal i resten av denne oppgaven betegne testen du formulerte over som Test 1. Man kan formulere en alternativ test for samme situasjon, som vi skal kalle Test 2, ved å definere differansene D i = Y i Z i for i = 1, 2,..., n, der Y i og Z i altså er løpstiden for løper nummer i i løpene med henholdsvis siste ytre og siste indre. Man kan da lage en test ved å ta utgangspunkt i D = 1 n n i=1 D i. d) Formuler en hypotesetest for situasjonen med utgangspunkt i D. Spesifiser H0 og H 1, velg en passende testobservator og utled en beslutningsregel når signifikansnivået er α. Av de 39 løperne i Sochi var det to som falt i et av sine løp. Dersom vi ser bort fra disse to løperne gir resultatene i Sochi n = 37, 37 i=1 d i = 2.654 og 37 i=1 d2 i = 1.552. Hva blir da konklusjonen av Test 2 med resultatene fra Sochi når α = 0.05? Avrund om nødvendig til nærmeste frihetsgrad oppgitt i tabell. Det oppgis at teststyrken (sannsynligheten for å forkaste H 0 når H 1 er riktig) for Test 2 når n = 37, E(D i ) = 0.07 og Var(D i ) = 0.2 2 er lik 0.67. Disse verdiene for E(D i ) og Var(D i ) er cirka hva man får når man estimerer basert på resultatene av de 37 løperne i Sochi som ikke falt. Det kan også nevnes at med disse verdiene for E(D i ) og Var(D i ) blir p = P (Y i < Z i ) = 0.64 hvis man antar at D i er normalfordelt. e) Finn teststyrken for Test 1 når n = 39 og p = 0.64. Fasit Figur 1 viser boxplot og histogram over d i for de 37 løperne i Sochi som ikke falt. Diskuter basert på konklusjonene du fant for Test 1 og Test 2, de utregnede teststyrkene for disse testene, samt plottene i Figur 1, hva du totalt sett ville konkludert med i den aktuelle situasjonen. De to løperne i Sochi som falt, falt begge i løpet hvor de hadde siste indre, har dette noen betydning for din konklusjon? 1. b) [4.23, 5.68] 2. a) x = 73.3, s = 9.7 b) H 0 : µ = 77 mot H 1 : µ < 77, Forkaster ikke H 0 c) Må måle farten på 96 bilar eller fleir 3. a) 0.031,0.313,0.09 c) Ca. 0.443

0.4 0.2 0.0 0.2 0 2 4 6 8 10 0.4 0.2 0.0 0.2 0.4 Figur 1: Boxplott og histogram over differansene d i for de 37 løperne i 500 meter for menn i Sochi som ikke falt. I boxplottet er differansene langs y-aksen, mens i histogrammet er differansene langs x-aksen. 4. a) Forkaster H 0 b) 0.025, 0.0183 c) 0.767 5. a) 0.048, 0.98 c) Ikke forkast H 0, 0.075 d) Forkast H 0 e) 0.545