TMA4240 Statistikk 2014

Like dokumenter
år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2009

i x i

TMA4240 Statistikk Høst 2016

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk Eksamen desember 2015

TMA4245 Statistikk Eksamen august 2014

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk Høst 2009

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2012

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4240 Statistikk

HØGSKOLEN I STAVANGER

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

TMA4245 Statistikk Vår 2015

TMA4240 Statistikk Høst 2016

Fasit for tilleggsoppgaver

HØGSKOLEN I STAVANGER

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk H2010 (20)

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4240 Statistikk Høst 2015

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk 2014

Eksamensoppgave i TMA4245 Statistikk

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Løsningsforslag eksamen 27. februar 2004

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

EKSAMEN I FAG TMA4240 STATISTIKK

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

EKSAMEN I TMA4240 Statistikk

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Løsningsforslag, eksamen statistikk, juni 2015

LØSNINGSFORSLAG ) = Dvs

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

Løsningsforslag eksamen 25. november 2003

HØGSKOLEN I STAVANGER

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Kapittel 2: Hendelser

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

vekt. vol bruk

TMA4240 Statistikk Høst 2008

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Løsningsforslag til oppgaver brukt i STA100

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Hypotesetest: generell fremgangsmåte

TMA4240 Statistikk H2010 (22)

Transkript:

TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten av ei holdingskampanje der målet var å få folk til å redusere farten på ei bestemt vegstrekning. På ein dag blei farten på 12 bilar målt. Vi skal gå utifrå at desse målingane er uavhengige og normalfordelte variable med forventing µ og standardavvik σ. Dei tolv observerte fartsmålingane er gitt nedanfor. x i : 75 61 85 65 69 82 70 67 62 93 77 74 Det oppgis at 12 i=1 x i = 880 og 12 i=1 (x i x) 2 = 1034.7. a) Forklar kva parameteren µ betyr i denne samanhengen. Skriv opp rimelege estimatorar for µ og σ i denne situasjonen. Kva blir estimata? b) Forklar kva som meinast med type 1 feil når vi utfører ein hypotesetest. Frå tidlegare undersøkingar har ein at gjennomsnittsfarten (av veldig mange bilar) var på 77 km/t. Tyder resultata frå desse målingane på at forventa fartsnivå på strekninga er lågare enn 77km/t? Formuler spørsmålet som ein hypotesetest, gjennomfør testinga og gje konklusjonen. Bruk 5% signifikansnivå. I punkt c) kan du gå utifrå at σ = 10km/t. c) Forklar kva vi meiner med type 2 feil og kva som er samanhengen mellom denne og styrken til ein test. Gå utifrå at forventa fart til bilane er gått ned til 74km/t. Finn sannsynet for at vi i testen i b) vil påstå at forventa fart til bilane er blitt lågare enn 77km/t. Finn deretter ut kor manga bilar vi må måle farten til for å få ein test som har styrke minst 0.90 når forventa fart µ = 74km/t. Signifikansnivået skal framleis vere 5%. Oppgave 2 Et viktig kriterium for god drikkevannskvalitet er at antall kolibakterier ikke er for høyt. For å overvåke dette tas det jevnlige prøver av vannet og antall kolibakterier i disse bestemmes. Erfaring tilsier at antall (X) kolibakterier i v liter drikkevann er poissonfordelt med parameter λv, dvs. P(X = x) = (λv)x exp( λv) ; x = 0, 1, 2,... x! ov12-oppg-b 15. oktober 2014 Side 1

a) Skriv ned E(X). Bruk dette til å gi en tolkning av parameteren λ. Dersom λ = 3 og v = 0.5, bestem sannsynlighetene P(X = 0) og P(X > 3). b) Dersom λ = 3 og v = 0.5, bestem P(X > 3 X > 0). La X 1 og X 2 være antall kolibakterier i to uavhengige prøver på henholdsvis v 1 = 1 og v 2 = 2 liter vann. For λ = 3, bestem sannsynlighetene P(X 1 + X 2 > 3) og P(X 1 + X 2 > 3 X 1 > 0 X 2 > 0). Parameteren λ vil normalt være ukjent og det er av interesse å estimere denne fra data. Anta at det for dette formål tas n prøver av drikkevannet og antall kolibakterier i hver prøve bestemmes. La v i betegne antall liter vann i prøve nummer i og la X i være antall kolibakterier i denne prøven. Det antas at X 1, X 2,..., X n er uavhengige. c) Vis at sannsynlighetsmaksimeringsestimatoren for λ blir i=1 λ = X i i=1 v. i Vis videre at λ er forventningsrett og at Var( λ) = λ i=1 v. i I resten av oppgaven kan du uten bevis benytte at λ er tilnærmet normalfordelt med forventning og varians som gitt i punkt c). Helsemyndighetene har fastsatt at en øvre grense for hvilken verdi λ kan ha for at vannet skal sies å være av god drikkevannskvalitet. Grenseverdien er λ 0 = 3 og ut fra målingene X 1, X 2,..., X n er det ønskelig å avgjøre om det er grunn til å påstå om denne verdien er overskredet. d) Formuler dette som en hypotesetest og lag en test for dette formål basert på λ med (tilnærmet) signifikansnivå α. Hva blir konklusjonen på testen når α = 0.025, n = 10, v 1 = v 2 =... = v 10 = 2.0 og observert antall kolibakterier i de 10 prøvene er Det oppgis at i=1 x i = 78. 6 12 14 11 8 3 8 4 4 8 Vi antar fortsatt at vi tar n = 10 prøver, hver på v = 2.0 liter. I stedet for å lage et forkastningskriterium basert på λ slik du har gjort i punkt d), kan man da alternativt definere Z = antall prøver der {X i > λ 0 v = 6} og forkaste H 0 dersom Z k der k er en konstant som må bestemmes. e) Bestem største verdi k slik at denne testen får signifikansnivå α 0.025. Hva blir konklusjonen på testen når dataene er som gitt i punkt d)?

f) Anta så at λ = 3.5, dvs antall kolibakterier i drikkevannet overskrider grensen satt av helsemyndighetene. For hver av de to testene diskutert over, bestem sannsynligheten for at det for høye innholdet av kolibakterier vil bli oppdaget dersom man tar n = 10 prøver, hver på v = 2.0 liter. Oppgave 3 En 45-åring startet med løpetrening for 9 år siden, og har hvert år siden deltatt i samme mosjonsløp. Anvendt tid, i minutter, er gitt i tabellen nedenfor. år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 Det oppgis at 9 i=1 x i = 369, 9 i=1 y i = 360.37, 9 i=1 (x i x) 2 = 60, 9 i=1 (y i ȳ) 2 = 63.28 og 9 i=1 (x i x)(y i ȳ) = 9 i=1 (x i x)y i = 52.57. Vi skal anta at observasjonene kan ses på som realisasjoner av uavhengige normalfordelte variable Y 1,..., Y 9, hvor E(Y i ) = α + βx i og Var(Y i ) = σ 2. a) Skriv opp de vanlige forventningsrette estimatorene ˆα, ˆβ og ˆσ 2 for α, β og σ 2. Regn ut estimatene for α og β for de gitte dataene. Plott datasettet og den estimerte regresjonslinjen. Det oppgis at estimatet for σ 2 er 1.568 2. b) Regn ut et uttrykk for variansen til estimatoren ˆβ. Gjennomfør en test av H 0 : β = 0 mot H 1 : β 0, på signifikansnivå 1%. Hva blir den praktiske fortolkningen av testen over? Løperen ønsker å predikere anvendt tid på mosjonsløpet neste gang (alder x 0 = 46 år). c) Regn ut predikert tid. Det oppgis at Var(ˆα + ˆβx 0 ) = σ 2 ( 1 n + (x 0 x) 2 i=1 (x i x) 2 ). Utled et 95% prediksjonsintervall for Y ved x 0 = 46 år. Hva blir intervallet med de oppgitte data? Hvis løperen ber deg predikere anvendt tid om 15 år (alder 60 år), hva vil du svare da? Oppgave 4 Kari har nylig kjøpt seg en ny bil. Nå ønsker hun å undersøke bilens bensinforbruk ved landeveiskjøring. La x være lengden av en tur (i mil) og Y tilhørende bensinforbruk (i liter). Kari forutsetter at hun selv velger lengden på turene og betrakter derfor ikke x som en stokastisk variabel, mens hun antar at Y er en normalfordelt stokastisk variabel med E(Y ) = βx og Var(Y ) = xσ 2. Dessuten antar hun at bensinforbruk på forskjellig turer er uavhengige stokastiske variable. Du skal i hele oppgaven forutsette det kjent at σ 2 = 0.1 2.

a) Hvilken tolkning har parameteren β i modellen? Som et alternativ til antagelsen om E(Y ) gitt over, kunne en satt E(Y ) = α + βx. Hvorfor er det, slik Kari har gjort, mest rimelig å velge α = 0. Hvorfor er det rimelig å anta at variansen til Y er proporsjonal med x? b) Anta i dette punktet at β = 0.75. Hva er sannsynligheten for at Kari på en 5 mil lang tur vil bruke mer enn 4 liter bensin? Betrakt to kjøreturer på henholdsvis x 1 = 5 og x 2 = 10 mil. Hva er sannsynligheten for at totalt bensinforbruk på de to turene er mindre enn 12 liter? Betrakt igjen to kjøreturer på henholdsvis x 1 = 5 og x 2 = 10 mil og la Y 1 og Y 2 være tilhørende bensinforbruk på de to turene. Hva er sannsynligheten for at bensinforbruket på turen på 10 mil er mer enn dobbelt så stor som bensinforbruket på turen på 5 mil? (dvs. finn P(Y 2 2Y 1 > 0)) For å undersøke bilens bensinforbruk, kjører Kari n = 6 turer av forskjellig lengde og måler bensinforbruket for hver tur. Målingene hennes gir følgende resultat Lengde (mil) 5 10 20 50 100 150 Bensinforbruk (liter) 2.73 5.97 11.64 30.20 59.16 85.92 For å estimere β, betrakter Kari to estimatorer, β = i=1 Y i i=1 x i og β = 1 n n i=1 Y i x i, der x i og Y i er henholdsvis lengde av og bensinforbruk på tur nr i. c) Vis at E( β) = β og Var( β) = σ 2 i=1 x i Finn også forventningsverdi og varians for estimatoren β. Hvilken av de to estimatorene vil du foretrekke? (Begrunn svaret) Selgeren som solgte bilen til Kari opplyste at bilens bensinforbruk ved landeveiskjøring var 0.56 liter/mil. Kari ønsker å benytte sine observasjoner til å sjekke om det er grunnlag for å påstå at bilens bensinforbruk er høyere enn hva selgeren opplyste. d) Formuler dette som et hypotesetestingsproblem. Ta utgangspunkt i estimatoren β og lag en test med signifikansnivå 5%. Hva blir konklusjonen på testen med observasjonene gitt over? e) Ta utgangspunkt i estimatoren β og utled et 95%-konfidensintervall for β. Hva blir intervallet med observasjoner som gitt over? Fasit 1. a) x = 73.3, s = 9.7 b) H 0 : µ = 77 mot H 1 : µ < 77, Forkaster ikke H 0 c) Må måle farten på 96 bilar eller fleir

2. a) 0.223, 0.066 b) 0.0849, 0.9788, 0.987 d) Forkaster H 0 e) k = 9, Forkaster ikke H 0 f) 0.2676, 0.1482 3. a) α = 75.96, β = 0.876 b) Var( β) = σ 2 / i=1 (x i x) 2, Forkast H 0 c) 35.66, [31.09, 40.23] 4. b) 0.131, 0.974, 0.5 c) E( β) = β, Var( β) = (σ 2 /n) i=1 (1/x i), foretrekker β d) H 0 : β = 0.56 mot H 1 : β > 0.56, Forkast H 0 e) [0.573, 0.595]