UNIVERSITETET I OSLO



Like dokumenter
UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN I TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Kontinuerlige sannsynlighetsfordelinger.

EKSAMEN I EMNE TMA4245 STATISTIKK

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

Høgskolen i Gjøviks notatserie, 2001 nr 5

STK juni 2018

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4245 Statistikk

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Sannsynlighetsregning og Statistikk.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Løsningsforslag Til Statlab 5

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

UNIVERSITETET I OSLO

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

UNIVERSITETET I OSLO

Eksamensoppgåve i TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

UNIVERSITETET I OSLO

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Prøvemidtveiseksamen TMA4240 Statistikk H2004

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

UNIVERSITETET I OSLO

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i SØK Statistikk for økonomer

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Bootstrapping og simulering Tilleggslitteratur for STK1100

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Oppfriskning av blokk 1 i TMA4240

UNIVERSITETET I OSLO

Oppgave 1: Feil på mobiltelefoner

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Litt mer om eksponensialfordelingen

UNIVERSITETET I OSLO

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk H2010

vekt. vol bruk

Foreleses onsdag 13.oktober, 2010

STK Oppsummering

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Regneøvelse 29/5, 2017

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Konfidensintervall for µ med ukjent σ (t intervall)

TMA4245 Statistikk Vår 2007

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4240 Statistikk Høst 2015

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Eksamensoppgave i TMA4295 Statistisk inferens

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

Høye skårer indikerer høye nivåer av selvkontroll.

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST101 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Mandag 29. november 1993. Tid for eksamen: 09.00 15.00. Oppgavesettet er på 6 sider. Vedlegg: Ingen. Tillatte hjelpemidler: ST101 formelsamling, kalkulator, Rottmanns Mathematische Formelsamlung, Jahren og Knutsens Formelsamling i matematikk (Tapir forlag). Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Oppgave 1. Brystkreft er en av de vanligste kreftformer hos kvinner. Ved hjelp av en spesiell form for røntgenundersøkelse, mamografi, kan kreftsvulsten iblant oppdages i et tidligere stadium enn det som ellers ville vært tilfellet. Dermed øker sjansen for helbredelse. Vi vil i denne oppgaven foreta noen beregninger knyttet til slike mamografiundersøkelser. De følgende (noenlunde realistiske) anslag vil bli benyttet i beregningene: Hvis en kvinne har brystkreft vil sannsynligheten for at dette oppdages ved en mamografiundersøkelse være 0,80. Hvis kvinnen ikke lider av brystkreft, vil det likevel være en sannsynlighet på 0,10 for at undersøkelsen indikerer at kvinnen har brystkreft. Sannsynligheten for at en tilfeldig valgt kvinne over 40 år har brystkreft anslås til 0,005. a) En kvinne over 40 år møter til mamografiundersøkelse. Hva er sannsynligheten for at undersøkelsen gir et positivt resultat (dvs. indikerer at hun har brystkreft)? Hva er sannsynligheten for at den gir et negativt resultat (dvs. indikerer at hun er frisk)? (Fortsettes side 2.)

Eksamen i ST101, Mandag 29. november 1993. Side 2 b) Hvis kvinnen får et positivt resultat på mamografiundersøkelsen, hva er da sannsynligheten for at hun virkelig lider av brystkreft? Hvis kvinnen får et negativt resultat, hva er sannsynligheten for at hun virkelig er frisk? c) En dag møter 25 kvinner over 40 år til mamografiundersøkelse, og for alle gir undersøkelsen et negativt resultat. Hva er sannsynligheten for at minst én av dem likevel har brystkreft? d) Tenk deg at 50 000 kvinner over 40 år blir innkalt (og møter) til mamografiundersøkelse. Hva er det forventede antallet med brystkreft blant disse kvinnene? Hva er det forventede antallet ekte positive? Hva er det forventede antallet falske positive? (Ekte positiv betyr at undersøkelsen indikerer brystkreft hos en kvinne som faktisk har brystkreft. Falsk positiv betyr at undersøkelsen indikerer brystkreft hos en kvinne som faktisk er frisk.) e) Det utføres i dag ikke masseundersøkelser med mamografi i Norge hvor alle kvinner over 40 år jevnlig innkalles til undersøkelse. Diskuter hvilken betydning beregningene over har når en skal vurdere om slike masseundersøkelser bør settes i gang. Oppgave 2. Anta at X er Laplace-fordelt (eller dobbelteksponensielt fordelt) med parametre µ og σ, dvs. at X har sannsynlighetstettheten f X (x) = 1 2σ e 2 x µ / σ < x <, (1) hvor < µ < og σ > 0. a) Vis at den kumulative fordelingen til X blir { 1 2 F X (x) = e 2 (x µ) / σ for x < µ 1 1 2 e 2 (x µ) / σ for x µ b) Bestem medianen og øvre og nedre kvartil til Laplace-fordelingen (1). c) Vis at EX = µ og VarX = σ 2. (Du kan her ta for gitt at xe x dx = 1 0 og x 2 e x dx = 2; jfr. resultatene om gamma-funksjonen i starten av 0 Oppgave 3.) (Fortsettes side 3.)

Eksamen i ST101, Mandag 29. november 1993. Side 3 La nå X 1, X 2,..., X n være uavhengige og identisk fordelte med sannsynlighetstetthet (1). Vi vil først betrakte to estimatorer for µ, nemlig gjennomsnittet µ = X og den empiriske medianen µ. Det kan vises at E µ µ og Var µ 1 4nf X (µ) 2 når n er tilstrekkelig stor. Du kan ta dette resultatet for gitt nedenfor. d) Hva blir (tilnærmet) den relative effisiensen av µ relativt til µ? Hvilken av de to estimatorene vil du foretrekke? Vi vil så studere to estimatorer for standardavviket σ, nemlig det empiriske standardavviket S = 1 n (X i X) n 1 2 (2) i=1 og den (normerte) empiriske kvartildifferansen σ = Q 3 Q 1. (3) 2 log 2 Her er Q 1 og Q 3 nedre og øvre empiriske kvartil. e) Gi en begrunnelse for at σ er en rimelig estimator for σ. Vi vil basere sammenligningen av de to estimatorene på stokastisk simulering, og vil i denne forbindelse nøye oss med å betrakte situasjonen der n = 20 og µ = σ = 1. (Verdien av µ spiller forøvrig ingen rolle her.) Med datamaskin er det derfor generert n = 20 uavhengige (pseudo) stokastiske variable med sannsynlighetstetthet (1) med µ = σ = 1. På grunnlag av disse er så verdien av estimatorene (2) og (3) beregnet. Dette er gjentatt 1000 ganger. På figuren på neste side er det gitt histogrammer over disse 1000 estimatene. f) Forklar hvordan et slikt simuleringsforsøk kan oss informasjon om fordelingene til estimatorene (2) og (3) (når n = 20 og µ = σ = 1). Bruk histogrammene til å gi et (grovt) anslag på sannsynligheten for at estimatorene (2) og (3) vil avvike høyst 0.2 fra den sanne verdien σ = 1. Hvilken av de to estimatorene vil du foretrekke? g) Mange programpakker (blant annet BLSS) har ikke innebygd muligheten for å generere (pseudo) stokastiske variable fra Laplace-fordelingen (1). Hvordan kan vi likevel trekke slike (pseudo) stokastiske variable såsant programpakken kan generere uniformt (0,1)-fordelte (pseudo) stokastiske variable? (Fortsettes side 4.)

Eksamen i ST101, Mandag 29. november 1993. Side 4 Figur: Histogram over 1000 simulerte verdier av estimatorene S (øverst) og σ (nederst). (Fortsettes side 5.)

Eksamen i ST101, Mandag 29. november 1993. Side 5 Oppgave 3. Vi minner om at en stokastisk variabel X med sannsynlighetstetthet f X (x) = { λ r Γ(r) xr 1 e λx for x > 0 0 ellers (4) sies å være gammafordelt med parametre r > 0 og λ > 0. Her er Γ(r) = 0 u r 1 e u du gamma-funksjonen. Vi minner også om at gamma-funksjonen (blant annet) tilfredsstiller (r, s > 0) (i) Γ(1) = 1 (ii) (iii) Γ( 1 2 ) = π Γ(r + 1) = rγ(r) Γ(r)Γ(s) (iv) = 1 Γ(r+s) 0 ur 1 (1 u) s 1 du Hvis vi i (4) spesielt har r = n/2 og λ = 1/2, hvor n er et heltall, sier vi at X er kjikvadratfordelt med n frihetsgrader. Vi vil først i denne oppgaven utlede noen resultater om gammafordelingen. a) La X være gammafordelt med parametre r og λ. Vis at E(X k ) = Γ(r + k) λ k Γ(r). For hvilke verdier av k gjelder dette resultatet? Bestem EX og VarX. b) La X 1 og X 2 være uavhengige og gammafordelte stokastiske variable med parametre r 1 og λ for X 1 og r 2 og λ for X 2. Vis at da er X 1 + X 2 gammafordelt med parametre r = r 1 + r 2 og λ. Generaliser resultatet til n uavhengige gammafordelte variable. (Det kreves ikke et formelt induksjonsbevis her.) Vi vil så benytte disse resultatene til å studere noen transformasjoner av standard normalfordelte stokastiske variable. c) La Z være standard normalfordelt. Vis at da er Z 2 kjikvadratfordelt med 1 frihetsgrad (dvs. gammafordelt med parametre r = 1/2 og λ = 1/2). d) La Z 1, Z 2,..., Z n være uavhengige og standard normalfordelte. Vis at da er n i=1 Z2 i kjikvadratfordelt med n frihetsgrader (dvs. gammafordelt med parametre r = n/2 og λ = 1/2). Bruk dette til å vise at E( n i=1 Z2 i ) = n og Var( n i=1 Z2 i ) = 2n. (Fortsettes side 6.)

Eksamen i ST101, Mandag 29. november 1993. Side 6 Vi vil til slutt i denne oppgaven betrakte en produsent av vekter som ønsker å fastlegge hvilken presisjon vektene har. For dette formålet tar han et tilfeldig utvalg på n vekter av den løpende produksjonen. Med hver av disse veier han én gang et lodd med kjent vekt µ 0 kg. Vi lar Y i være den registrerte vekten (i kg) med i-te vekt, og antar at Y 1, Y 2,..., Y n er uavhengige og identisk N(µ 0, σ 2 )-fordelte. Her er altså µ 0 en kjent størrelse, mens σ er en ukjent parameter som vi ønsker å estimere. e) Vis at σ 2 = 1 n n (Y i µ 0 ) 2 i=1 er en forventningsrett estimator for σ 2. f) Vis at n σ 2 /σ 2 er kjikvadratfordelt med n frihetsgrader og bestem Var( σ 2 ). Er σ 2 konsistent? g) Utled et 100(1 α)% konfidensinterval for σ. Intervallet skal uttrykkes ved hjelp av n, σ, c 1 og c 2. Her er c 1 og c 2 gitt ved at P(χ 2 n c 1 ) = P(χ 2 n c 2 ) = α/2, hvor χ 2 n er kjikvadratfordelt med n frihetsgrader. SLUTT