EKSAMEN I TMA4245 Statistikk



Like dokumenter
EKSAMEN I TMA4245 Statistikk

EKSAMEN I EMNE TMA4245 STATISTIKK

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

EKSAMEN I TMA4240 Statistikk

EKSAMEN I FAG TMA4240 STATISTIKK

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Eksamen desember 2015

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk Høst 2009

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

HØGSKOLEN I STAVANGER

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen desember 2016

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

TMA4240 Statistikk Høst 2009

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1: Feil på mobiltelefoner

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

TMA4240 Statistikk Høst 2015

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Eksamensoppgave i TMA4295 Statistisk inferens

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2015

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk 2014

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

EKSAMEN I EMNE TMA4245 STATISTIKK

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

TMA4240 Statistikk Høst 2018

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2012

Eksamensoppgåve i TMA4245 Statistikk

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

TMA4240 Statistikk Høst 2016

Eksamensoppgave i ST0103 Brukerkurs i statistikk

i x i

TMA4245 Statistikk Eksamen desember 2016

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

UNIVERSITETET I OSLO

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4245 Statistikk Eksamen august 2014

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

HØGSKOLEN I STAVANGER

Eksamensoppgave i SØK Statistikk for økonomer

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

i=1 t i +80t 0 i=1 t i = 9816.

TMA4240 Statistikk Høst 2015

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4245 Statistikk Høst 2016

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Turid Follestad (98 06 68 80/73 59 35 37) Hugo Hammer (45 21 01 84/73 59 77 74) Eirik Mo (41 10 66 33/73 55 02 39) Henning Omre (90 93 78 48/73 59 35 31) EKSAMEN I TMA4245 Statistikk Torsdag 7. juni 2007 Tid: 09:00 13:00 Tillatte hjelpemidler: Gult A5-ark med egne håndskrevne notater (stemplet ved Institutt for matematiske fag) Tabeller og formler i statistikk (Tapir forlag) K. Rottmann: Matematisk formelsamling Kalkulator: HP30S BOKMÅL Sensur: 28. juni 2007 Oppgave 1 Pengespillet I et TV-program får et visst antall deltakere sjansen til å vinne et større pengebeløp. For hver deltaker består spillet av en serie påfølgende runder, der deltakeren i hver runde får presentert en oppgave. For hver oppgave deltakeren klarer, får han/hun et gitt beløp. Spillet avsluttes når deltakeren første gang ikke greier oppgaven, og deltakeren får da med seg beløpet vunnet i de øvrige rundene. Vi antar at ingen deltaker trekker seg frivillig underveis. La p være sannsynligheten for IKKE å klare oppgaven i hver enkelt runde, og la videre X være antall runder for en tilfeldig valgt deltaker. Antall runder X defineres her slik at deltakeren går ut etter å ha klart oppgavene i de X 1 første rundene, men ikke oppgaven i runde X. Vi antar at sannsynligheten p er lik for hver runde og for hver deltaker, og at resultatene for hver runde er uavhengige.

Side 2 av 5 I denne situasjonen er X geometrisk fordelt med parameter p, slik at punktsannsynligheten f(x; p) og den kumulative fordelingsfunksjonen F (x; p) = P (X x) for X er a) Anta bare i dette punktet at p = 0.10. f(x; p) = p(1 p) x 1, x = 1, 2,... F (x; p) = 1 (1 p) x, x = 1, 2,... Forklar hvorfor X er geometrisk fordelt med parameter p i denne situasjonen. Beregn sannsynligheten for at deltakeren går ut i første runde. Beregn sannsynligheten for at deltakeren er med i spillet når det er gått fem runder. Hva er sannsynligheten for at han/hun kommer videre til niende runde men ikke klarer oppgaven i niende runde, gitt at deltakeren var med i spillet når det var gått fem runder? Det viser seg at deltakerne jevnt over henger med lenger enn forventet, og det begynner å bli dyrt for TV-selskapet. De vil undersøke om de har feilvurdert vanskelighetsgraden, og vil beregne et anslag for p, som nå ansees som ukjent. La X 1, X 2,..., X n være antall runder for hver av n tilfeldig valgte deltakere, der X i, i = 1,..., n er uavhengige og geometrisk fordelte med samme parameter p. b) Utled et uttrykk for sannsynlighetsmaksimeringsestimatoren (maximum likelihood estimator) for p basert på det tilfeldige utvalget. Hva blir estimatet dersom n = 8, og antall runder for de 8 deltakerne er 4, 22, 9, 11, 15, 5, 26 og 17? TV-selskapet bruker to personer, A og B, til å lage oppgavene. Selskapet ønsker å undersøke om vanskelighetsgraden er avhengig av hvem av dem som lager oppgavene. De ser på resultatene fra n 1 tilfeldig valgte deltakere som har oppgaver fra oppgavelager A, og n 2 fra oppgavelager B. La Z 1 og Z 2 være antallet blant disse som klarer færre enn fem oppgaver fra henholdsvis oppgavelager A og B. Vi antar at Z 1 og Z 2 er uavhengige. c) Forklar hvorfor Z 1 og Z 2 er binomisk fordelte med parametre (n 1, q 1 ) og (n 2, q 2 ), der q 1 og q 2 er sannsynligheten for å klare færre enn fem oppgaver i de to gruppene. Som estimatorer for q 1 og q 2 skal vi bruke ˆq 1 = Z 1 n 1 og ˆq 2 = Z 2 n 2.

Side 3 av 5 Utled et tilnærmet 95% konfidensintervall for q 1 q 2 basert på normaltilnærming til binomisk fordeling. Beregn intervallet numerisk når n 1 = n 2 = 64, og observerte verdier for Z 1 og Z 2 er z 1 = 34 og z 2 = 18. Gir det estimerte konfidensintervallet TV-selskapet grunnlag for å si at oppgavene fra A og B har ulik vanskelighetsgrad? Begrunn svaret. Oppgave 2 Radar En havneby observerer ankommende skip ved å bruke radar. Vi antar for enkelhets skyld at skipene alltid ankommer fra nord. Radaren er plassert 1 kilometer vest for havna. Det er ønskelig å oppdage ankommende skip så tidlig som mulig av praktiske og sikkerhetsmessige årsaker. Når skipet første gang fanges inn på radaren, observerer radaren vinkelen Y [0, π/2), Båt X Y Nord Radar 1 km Havn Figur 1: Illustrasjon til oppgave 2. som vist i Figur 1. Radaren observerer kun vinkelen Y, og ikke avstanden til skipet. Vinkelen Y varierer fra skip til skip av mange årsaker. La den kumulative fordelingsfunksjonen til Y være F (y; β) = P (Y y) = 1 exp { y/β}, y [0, π/2), 1 exp { π/(2β)}

Side 4 av 5 der β > 0 er en parameter. a) Anta bare i dette punktet at β = π/8. ( Regn ut P Y > π ) ( π, P 4 4 < Y < π ) ( og P Y > π 3 4 Y < π ). 3 b) Vis at sannsynlighetstettheten f(y; β) til Y er f(y; β) = 1 exp { y/β}, β β exp { π/(2β)} y [0, π/2). Havnebyen er mer interessert i avstanden til havna når skipet først oppdages enn vinkelen Y som radaren observerer. La X betegne denne avstanden, som vist i Figur 1. Utled et uttrykk for sannsynlighetstettheten til X. Det oppgis at d dx (tan(x)) = 1 cos 2 (x) og d d (arc tan(x)) = dx dx (tan 1 (x)) = 1 1 + x. 2 Oppgave 3 Ultralydavbildning med kontrastmiddel En måte å oppdage tidlig utvikling av kreftceller i leveren på er å studere tettheten av blodkar. Mikroskopiske gassbobler tilsettes blodet, og sees ved å sende ultralyd mot forskjellige deler av leveren. Mange gassbobler et sted gir kraftig høyfrekvent (annenharmonisk) ekko, som indikerer mange blodkar og mulig kreft. La Y i, i = 1,..., n være styrken på det høyfrekvente ekkoet i desibel (20 log 10 av amplituden) som apparatet registrerer for n målinger. Vi vil anta at målingene Y i er uavhengige og identisk normalfordelte, med varians σ 2. a) Anta bare i dette punktet at σ 2 = 0.01 2 og at alle ekkodataene skaleres så forventningsverdien til Y i er eksakt 1.0. Regn ut sannsynligheten for at en enkelt ultralydmåling er større enn 1.0. Regn ut sannsynligheten for at avviket i absoluttverdi fra 1.0 i en enkelt måling er større enn 0.02. Hvis en tar to uavhengige målinger fra samme sted i leveren, hva er da sannsynligheten for at gjennomsnittet avviker i absoluttverdi mer enn 0.02 fra 1.0? Absorbsjon og spredning gjør ultralydsignalet svakere fra punkter i leveren langt fra måleapparatet. Vi setter opp en lineær regresjonsmodell Y = α + βx + E, med n par av målinger (x i, Y i ), i = 1,..., n, der Y i er målt som før, og x i er en kjent forklaringsvariabel basert på

Side 5 av 5 dybden i kroppen ekkoet kommer fra. Feilene E i er uavhengig normalfordelte med forventningsverdi 0.0 og ukjent varians σ 2. Parametrene α og β avhenger av fysiologien til pasienten, og er ukjente. Vi vil bruke følgende estimatorer for α og β: A = α = Ȳ B x, B = β = (x i x)y i (x i x) 2, der Ȳ = 1 n Y i og x = 1 n x i. Det oppgis at E(B) = β og Var(B) = σ 2 (x i x) 2. b) Utled uttrykk for E(A), Var(A) og Cov(A, B). Ta med mellomregning/omforminger du bruker for å komme fram til svarene på enkleste form og bruk uten bevis at B og Ȳ er uavhengige. Sannsynlighetsmaksimeringsestimatoren (maximum likelihood estimator) for σ 2 basert på n målinger med forskjellige x i er σ 2 = 1 n n (Y i A Bx i ) 2. Metoden er på prøvestadiet og testes bare på friske testpersoner. For en frisk pasient, skal variansen ikke overstige 0.01 2. (For disse pasientene er fordelingen av blodkar jevn/homogen, og variansen i målingene skyldes da bare tilfeldig variasjon i tettheten av gassbobler i blodet.) Hvis resultatet av n = 30 uavhengige målinger på en testperson gir grunnlag for å forkaste hypotesen om at σ 2 = 0.01 2 og hevde at σ 2 > 0.01 2, sendes testpersonen til en dyr kreftundersøkelse. c) Utled et uttrykk for forventningsverdien til σ 2. Formulér problemstillingen over som en hypotesetest, og beregn kritisk område (forkastningsområde) for σ 2 for testen. La signifikansnivået være 0.01.