EKSAMEN I TMA4240 Statistikk



Like dokumenter
EKSAMEN I TMA4240 Statistikk

EKSAMEN I EMNE TMA4245 STATISTIKK

EKSAMEN I EMNE TMA4245 STATISTIKK

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk Høst 2018

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

EKSAMEN I TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk 2014

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

TMA4245 Statistikk Eksamen august 2014

HØGSKOLEN I STAVANGER

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST0103 Brukerkurs i statistikk

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2015

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk. Øving nummer 7. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2015

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

TMA4240 Statistikk Høst 2016

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

EKSAMEN I FAG TMA4240 STATISTIKK

i x i

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Fasit for tilleggsoppgaver

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen august 2014

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

UNIVERSITETET I OSLO

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk Høst 2009

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2016

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Kapittel 2: Hendelser

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Om eksamen. Never, never, never give up!

Matteknologisk utdanning

TMA4240 Statistikk Høst 2015

Faktor - en eksamensavis utgitt av ECONnect

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

HØGSKOLEN I STAVANGER

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2007

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO Matematisk Institutt

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

6.2 Signifikanstester

EKSAMEN I TMA4285 TIDSREKKJEMODELLAR Fredag 7. desember 2012 Tid: 09:00 13:00

Om eksamen. Never, never, never give up!

TMA4240 Statistikk H2010 (22)

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i TMA4295 Statistisk inferens

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Henning Omre (909 37848) Mette Langaas (988 47649) EKSAMEN I TMA4240 Statistikk 18. desember 2010 Tid: 9:00 13:00 Antall studiepoeng: 7.5 Hjelpemidler: Kalkulator HP30S eller Citizen SR-270X med tomt minne. Statistiske tabeller og formler, Tapir forlag. K. Rottman: Matematisk formelsamling eller Matematische Formelsammlung. Ett gult ark (A5 med stempel) med egne håndskrevne formler og notater. Sensurfrist: 18. januar 2011. Eksamensresultatene blir annonsert fra http://studweb.ntnu.no/. BOKMÅL

TMA4240 Statistikk Side 2 av 5 Oppgave 1 Høysnue og eksem Vi betrakter en populasjon av 11-årige barn. I denne populasjonen har man sett på forekomsten av høysnue og eksem. Definer to hendelser: E: et tilfeldig valgt barn fra populasjonen har eksem. H: et tilfeldig valgt barn fra populasjonen har høysnue. La oss anta at vi i denne populasjonen har følgende sannsynligheter: P (E) = 0.04 P (H) = 0.07 P (E H) = 0.009 a) Tegn et Venn-diagram med de to hendelsene. Er hendelsene E og H uavhengige? Begrunn svaret. Blant de barna i populasjonen som ikke har eksem, velger vi tilfeldig ut ett barn. Hva er sannsynligheten for at dette barnet ikke har høysnue? Oppgave 2 Avissalg Vi ser på salg av lokalavisa ved en liten aviskiosk i løpet av en dag. Vi antar at vi har et ubegrenset antall aviser tilgjengelig for salg slik at avisa ikke blir utsolgt. La X være antallet eksemplarer av avisa som blir solgt i løpet av en tilfeldig valgt dag, og anta at X er Poisson-fordelt med forventningsverdi E(X) = µ. a) Anta i dette punktet at forventet salg er µ = 10 eksemplarer, og at vi ser på salget en tilfeldig valgt dag. Hva er sannsynligheten for at det denne dagen blir solgt akkurat 10 eksemplarer? Hva er sannsynligheten for at det denne dagen blir solgt 13 eller flere eksemplarer?

TMA4240 Statistikk Side 3 av 5 Man vet fra tidligere år at forventet avissalg er omtrent det samme for alle hverdager i løpet av høsten. La X 1, X 2,..., X n være uavhengige Poisson-fordelte stokastiske variabler som angir salg for n tilfeldig valgte hverdager om høsten. Anta at forventet salg er µ for alle hverdagene, men at denne parameteren ikke er kjent. En estimator for µ er X = 1 n ni=1 X i. b) Finn forventningsverdi og varians til X. Bruk sentralgrenseteoremet til å lage et tilnærmet 95% konfidensintervall for µ. Beregn konfidensintervallet numerisk når n = 30 og 1 30 30 i=1 x i = 10.75. Eieren av aviskiosken ønsker å bestemme hvor mange aviser som skal kjøpes inn fra utgiveren en valgt dag. Anta at forventet antall aviser som kan selges den dagen, µ, er kjent. Deretter er det to motstridende hensyn som må tas: Hvis man ved aviskiosken blir utsolgt for avisen mister man potensiell fortjeneste. Hvis man ved aviskiosken ikke selger alle avisene som man kjøper inn, vil man tape penger fordi det ikke gis full kompensasjon for aviser som returneres til utgiver. La fortsatt X betegne salget hvis man har et ubegrenset antall aviser tilgjengelig. Anta videre at Y = min(x, a) er salget hvis man har kjøpt inn a aviser for salg. Vi antar som tidligere at X er Poisson-fordelt, og lar forventningsverdien være µ = 10. c) Finn sannsynlighetsfordelingsfunksjonen til Y, P (Y = y) for y = 0, 1,..., a. Vis at E(Y ) = a a 1 y=0(a y)p (X = y). Vi kan velge a ut fra betrakninger om total fortjeneste for aviskiosken. Aviskiosken betaler 5 kr for hver avis og selger avisa for 12 kr. De usolgte avisene får aviskiosken returnert og får 3 kr for hver avis. Vis at total fortjeneste er 9Y 2a. Hvor mange aviser a bør aviskiosken kjøpe inn slik at forventet total fortjeneste skal bli størst mulig? Hint: Kall den forventede totale fortjenesten for h(a). Undersøk for hvilke a differansen h(a) h(a 1) er positiv og negativ.

TMA4240 Statistikk Side 4 av 5 Oppgave 3 Kovarians Vi har to tilfeldige (stokastiske) variabler X og Y. La X ha forventningsverdi E(X) = 10 og varians Var(X) = 4, og Y ha forventningsverdi E(Y ) = 8 og varians Var(Y ) = 9. Videre er kovariansen mellom X og Y gitt som Cov(X, Y ) = 5. a) Regn ut tallverdiene for uttrykkene: E(2X Y ) Var(2X Y ) E ((X 3)(Y 5)) Oppgave 4 Forsøksgården På en forsøksgård utføres forsøk med produksjon av biomasse. Anta at biomassen, Y, av en plante er normalfordelt (gaussisk fordelt) med forventningsverdi E(Y ) = 5 og varians Var(Y ) = 4. a) Regn ut følgende tre sannsynligheter: P (Y > 6) P (4 < Y 6) P (Y > 6 Y > 4) Anta nå at biomassen Y av en bestemt plante er avhengig av kultiveringsperioden x. For planten defineres kultiveringsperioden som tiden fra planten kan observeres over jordsmonnet til tidspunktet for biomassemåling. Anta videre at sammenhengen mellom biomasse Y og en gitt kultiveringsperiode x kan modelleres som en lineær regresjon, uten konstantledd og med feilledd som er avhengig av kultiveringsperioden, Y = βx + ε(x) for x > 0, der ε(x) er normalfordelt (gaussisk fordelt) med forventningsverdi E(ε) = 0 og varians Var(ε) = τ 2 x 2. Det betyr at standardavviket til feilleddet er proporsjonalt med kultiveringsperioden x. Biomassemålingen gjøres kun for positive kultiveringsperioder, x > 0. Modellparameterene β og τ ansees som ukjente.

TMA4240 Statistikk Side 5 av 5 Et forsøksopplegg med n = 5 uavhengige målinger ved kultiveringsperioder x 1, x 2,..., x 5 og tilhørende biomasser Y 1, Y 2,..., Y 5 resulterte i følgende observasjoner: i 1 2 3 4 5 x i 3 6 7 10 14 y i 1.0 5.0 3.0 3.0 10.0 Det oppgis at 5 i=1 y i x i = 2.61 og 5 i=1 y 2 i x 2 i = 1.59. b) Hvilken sannsynlighetsfordeling har Y i gitt x i? Utled uttrykk for estimatorer for β og τ 2, for eksempel ved å bruke sannsynlighetsmaksimeringsmetoden (maximum likelihood method). Bruk tallverdier fra tabellen over til å beregne estimater for β og τ 2. Følgende estimator for β skal benyttes i resten av oppgaven: B = 1 n c) Anta i dette punktet at τ 2 = 0.04 er kjent. Vi ønsker å utføre hypotesetesten n i=1 Y i x i H 0 : β = 0.50 mot H 1 : β > 0.50 Utled en forkastningsregel med signifikansnivå 0.05. Bruk tallverdiene i tabellen over til å utføre testen. Utled et uttrykk for styrken til testen over når β = 0.7, og regn ut tallsvar når n = 5.

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 Bokmål Faglig kontakt under eksamen: Arvid Næss 99 53 83 50 Jarle Tufto 99 70 55 19 Ola Diserud 93 21 88 23 EKSAMEN I EMNE TMA4245 STATISTIKK XX. august 2010 Tid: 09:0013:00 Hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S Gult, stemplet A5-ark med egne håndskrevne notat. Oppgave 1 La X være en stokastisk variabel med sannsynlighetstetthet (ST): f X (x) = 1 2πτx e 1 2τ 2 (ln x ν)2, x > 0, = 0, x 0, (1) der τ > 0 og ν er reelle tall, og ln x betegner den naturlige logaritmen til x. Dersom en tar n uavhengige jordprøver i et bestemt distrikt, hver på én kilo, og betegner det målte nikkelinnholdet angitt i mg i de respektive prøvene med x 1,..., x n, har det vist seg at x 1,..., x n kan betraktes som et utfall av uavhengige og identisk fordelte stokastiske variabler X 1,..., X n med ST som gitt i ligning (1). a) Vis at når X har ST gitt ved ligning (1), så er Y = ln X normalfordelt med forventningsverdi ν = E[Y ] og varians τ 2 = Var[Y ].

TMA4245 Statistikk Side 2 av 3 ( ) ln x ν b) Vis at F X (x) = Prob(X x) = Φ, der Φ betegner den kumulative sannsynlighetsfordelingen til en stokastisk variabel Z N(0, τ 1). Innfører en Y j = ln X j, j = 1,..., n, blir altså Y 1,..., Y n uavhengige og identisk fordelte stokastiske variabler, og Y j N(ν, τ 2 ), j = 1,..., n. c) Anta at ν = 1.0 og τ = 0.8. Bestem Prob(X 1 1.0) og Prob(X 1 X 2 1.0). d) Anta fortsatt at ν = 1.0 og τ = 0.8 samt at n = 5. Hvor stor er da sannsynligheten for at målt nikkelinnhold i minst 4 av 5 jordprøver skal være mindre enn 2.72 mg? e) Vis at µ = E[X] = e ν+τ 2 /2, σ 2 = Var[X] = e 2ν( e 2τ 2 e τ 2 ) Hint: En måte å gå fram på, er å innføre t = (ln x ν)/τ som ny integrasjonsvariabel. f) Anta at en har målt nikkelinnholdet x 1,..., x n i n jordprøver og ønsker en anslagsverdi for µ basert på disse målingene. En mulig estimator er ˆµ = 1 n n X j = X. j=1 Kommentér kort hvilke egenskaper denne estimatoren har, og gjennomfør estimeringen når n = 10 og observasjonsmaterialet er som angitt til slutt i denne oppgaven. g) Et alternativ til estimatoren ˆµ får en ved først å bestemme sannsynlighetsmaksimeringsestimatorene (SME) ˆν og ˆτ 2 for ν og τ 2, og så utnytte resultatet i punkt e). Bestem ˆν og ˆτ 2. Hvilke egenskaper har disse estimatorene? Angi til slutt en estimator µ for µ basert på ˆν og ˆτ 2. Gjennomfør estimeringen av µ når observasjonsmaterialet er som angitt til slutt i oppgaven. h) Gå ut fra at τ 2 er kjent og lik τ 2 0. På grunnlag av det tilfeldige utvalget x 1,..., x n ønsker en å teste H 0 : µ µ 0 mot der µ 0 er et gitt tall. H 1 : µ > µ 0 Bruk resultatet i punkt e) til å uttrykke H 0 og H 1 ved hjelp av ν, og vis at testproblemet er ekvivalent med å teste H 0 : ν ν 0

TMA4245 Statistikk Side 3 av 3 mot H 1 : ν > ν 0 der ν 0 er et kjent tall. Utnytt dette til å angi en rimelig test for H 0 mot H 1. Velg signikansnivå α. i) Utled et uttrykk for teststyrken for testen i punkt h) under alternativhypotesen µ = γµ 0 (γ > 1) når α = 0.05, τ 2 0 = 0.36. Hvor stor må n minst være for at testen med en sannsynlighet på minst 0.90 forkaster H 0 når µ = 1.5µ 0? j) Gå fortsatt ut fra at τ 2 er kjent og lik τ0 2. Utled først et 100(1 α)% kondensintervall for ν, og bruk resultatet til å bestemme et tilsvarende kondensintervall for µ. Hva blir kondensintervallet for µ når n = 10, α = 0.05, τ 2 0 = 0.36 og observasjonsmaterialet er som angitt til slutt i oppgaven? x j 57 38 150 29 65 44 36 24 51 131 y j = ln x j 4.04 3.64 5.01 3.37 4.17 3.78 3.58 3.18 3.93 4.48 Tabell 1: Observasjonsmateriale 10 j=1 y j = 39.58 10 j=1 (y j y) 2 = 3.2360

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 Bokmål Faglig kontakt under eksamen: Arvid Næss 73 59 70 53/ 99 53 83 50 Jarle Tufto 99 70 55 19 Ola Diserud 93 21 88 23 EKSAMEN I EMNE TMA4245 STATISTIKK 3. juni 2010 Tid: 09:0013:00 Hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S Gult, stemplet A5-ark med egne håndskrevne notater. Oppgave 1 En sjelden genvariant a disponerer for en bestemt sykdom. I en populasjon er den relative frekvensen av individ som bærer to kopier av genvarianten (individ av genotype aa) 0.0001, frekvensen av individ som bærer én kopi (genotypen Aa) er 0.0198 og frekvensen av individ som ikke har den sjeldne genvarianten (genotypen AA) er 0.9801. Anta at sannsynligheten for at sykdommen kommer til uttrykk blant personer med genotype aa, aa og AA er henoholdvis 0.6, 0.02 og 0.01. a) Hva er sannsynligheten for at sykdommen kommer til uttrykk i et tilfeldig valgt individ fra populasjonen? b) Hva er de respektive sannsynlighetene for at et individ er av genotypene aa, Aa og AA gitt at sykdommen har kommet til uttrykk i individet? Oppgave 2 En fabrikk produserer en spesiell type maskinkomponenter. Tiden fra en komponent blir tatt i bruk til den bryter sammen for første gang, kaller vi levetiden for komponenten. Erfaring har vist at levetiden T, målt i uker, kan modelleres som en kontinuerlig

TMA4245 Statistikk Side 2 av 3 stokastisk variabel med sannsynlighetstetthet (sannsynlighetsfordeling): f T (t) = 2λte λt2, t 0, = 0, ellers, (1) der λ > 0 er en ukjent parameter. a) Bestem kumulativ fordelingsfunksjon (KF) F T (t) til T, og beregn P (20 < T 30) når λ = 1.5 10 3. b) Parameteren λ skal estimeres på basis av levetidene T 1,..., T n for n > 2 tilfeldig valgte komponenter. T 1,..., T n antas uavhengige og identisk fordelte med sannsynlighetstetthet f T (t). Vis at sannsynlighetsmaksimerings-estimatoren (SME) for λ blir Λ = c) La X være χ 2 -fordelt med 2n frihetsgrader (n > 2). Vis at n n i=1 T. i 2 (2) E(X 1 ) = 1 2(n 1) og E(X 2 ) = 1 4(n 1)(n 2). (3) Vis at Y = 2λT 2 er χ 2 -fordelt med 2 frihetsgrader (husk at T 0). Bruk så dette resultatet sammen med ligning (3) til å undersøke om Λ er forventningsrett. Om nødvendig, korrigér for å få en estimator som er forventningsrett. Bestem også denne estimatorens varians. (Hint: De resultatene som kan hjelpe deg her, står i 'Tabeller og formler i statistikk'.) d) Utled et 100(1 α)% kondensintervall for λ. Bestem intervallet numerisk når α = 0.05, n = 5 og de observerte verdiene er 23.63 35.97 18.65 18.18 11.59 e) En dag oppdages feil ved produksjonsprosessen. Komponentene testes ved at 5 komponenter velges tilfeldig fra dagsproduksjonen, og levetiden bestemmes for disse ved akselerert levetidstesting. Observasjonene brukes til å teste mot H 0 H 1 : λ λ 0 = 1.5 10 3 : λ > λ 0 = 1.5 10 3

TMA4245 Statistikk Side 3 av 3 Påvis at 2λ n 0 i=1 T i 2 kan brukes som testobservator, og bestem det kritiske området for testen for signikansnivå α. Konkludér for α = 0.05 når observasjonene er 12.06 18.02 19.86 16.60 9.36 Komponentene blir pakket i kasser med 5 komponenter i hver kasse. Fabrikken garanterer at alle komponentene i en kasse har levetid på minst a uker. Fabrikken får reklamasjon på en kasse hvis én eller ere av de 5 komponentene i kassen har levetid kortere enn a uker. f) Hvis λ = 1.5 10 3, hvor stor kan a velges for at sannsynligheten for reklamasjon skal være høyst 0.05? Du kan anta uavhengige levetider. g) La a og λ være som i punkt f), og anta at i et visst tidsrom selges 1000 kasser. La U være antall kasser som det blir reklamert på. Hvilke forutsetninger må en gjøre for at U skal være binomisk fordelt? Anta at disse forutsetningene er oppfylt og bestem P (U 60) ved å bruke tilnærming til normalfordeling.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 4 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4240 STATISTIKK Onsdag 2. desember 2009 Tid: 09:00 13:00 Hjelpemidler: Kalkulator HP30S eller Citizen SR-270X med tomt minne. Statistiske tabeller og formler, Tapir forlag. K. Rottman: Matematisk formelsamling. Ett gult ark (A5 med stempel) med egne håndskrevne formler og notater. Sensur er ferdig: 23. desember 2009. Oppgave 1 La X være en kontinuerlig fordelt stokastisk variabel med sannsynlighetstetthet { k (4x + 1) for x [0, 1], f(x) = 0 ellers, der k er en konstant. a) Regn ut hvilken verdi konstanten k må ha. Skisser f(x). Finn den kumulative fordelingsfunksjonen F(x) = P(X x). Finn sannsynlighetene ( P X > 1 ) 4 ( og P X > 1 2 X > 1 ). 4

TMA4240 Statistikk Side 2 av 4 La også Y være en kontinuerlig fordelt stokastisk variabel, og la betinget sannsynlighetstetthet for Y gitt X = x være gitt ved { 4x+2y for y [0, 1], f(y x) = 4x+1 0 ellers. b) Finn simultan sannsynlighetstetthet for X og Y. Finn marginal sannsynlighetstetthet for Y. Finn sannsynligheten P(Y X). Oppgave 2 Telefonproblemer En gruppe bestående av n studenter sitter en dag og diskuterer at de har store problemer med å komme gjennom på telefon til et bestemt firma. Firmaet har ikke et system med telefonkø slik at når man ringer firmaet får man enten opptattsignal eller man får kontakt med firmaets sentralbord. Flere av studentene klager på at de tilsynelatende alltid får opptattsignal. Studentene bestemmer seg for å gjøre en del forsøk for å få bedre oversikt over situasjonen. Hver av de n studentene skal flere ganger ringe til firmaet og notere opp om de får opptattsignal eller kontakt med sentralbordet. Hver student skal fortsette med å ringe inntil han/hun har fått snakket med sentralbordet k ganger og så rapportere tilbake til gruppen totalt antall ganger han/hun har ringt til firmaet. Anta at vi nummererer studentene fra 1 til n og la X i være antall telefonoppringninger student nummer i rapporterer tilbake til gruppen. La p betegne sannsynligheten for å få snakke med sentralbordet hvis man ringer en gang til firmaet. Studentene, som ikke er så veldig gode i statistikk, konkluderer raskt med at X 1, X 2,...,X n er et tilfeldig utvalg fra en negativt binomisk fordeling med parametre k og p, dvs. ( ) x 1 f(x) = p k (1 p) x k, x = k, k + 1,.... k 1 a) Hvilke forutsetninger, i tillegg til de som er spesifisert over, må være oppfylt for at studentenes konklusjon om at X 1, X 2,...,X n er et tilfeldig utvalg fra en negativt binomisk fordeling skal være korrekt? Anta nå at disse forutsetningene er oppfylt, og dessuten at k = 2 og p = 0.1. Finn da sannsynlighetene P(X 1 = 2) og P(X 1 4 X 1 > 2).

TMA4240 Statistikk Side 3 av 4 I resten av denne oppgaven skal vi anta at forutsetningene spesifisert i punkt a) er oppfylt slik at studentenes konklusjon er korrekt. Videre skal vi forutsette at k er et kjent tall, mens p er ukjent og skal estimeres. b) Utled sannsynlighetsmaksimeringsestimatoren (SME) for p ut fra dataene X 1, X 2,...,X n og vis at den kan skrives på formen p = nk n i=1 X. i En tid senere ser studentene en reportasje på fjernsyn der en representant for firmaet blir intervjuet angående nettopp den situasjonen studentene var opptatt av. Representanten for firmaet innrømmer at det kan være noe vanskelig å komme gjennom til dem på telefon, men hevder bestemt at p 0.1. Studentene bestemmer seg for å teste om dataene de har samlet inn gir grunnlag for å hevde at firmaets påstand er feil. c) Formuler studentenes problemstilling som et hypotesetestingsproblem. Dvs, velg nullhypotese og alternativ hypotese, velg testobservator, og bestem forkastningskriterium. Regn ut (tilnærmet) p-verdi for testen når k = 2, n = 50 og studentenes observasjoner gav n i=1 x i = 779. Vil du konkludere med at firmaets påstand er feil? (Grunngi svaret)

TMA4240 Statistikk Side 4 av 4 Oppgave 3 Smeltepunktbestemmelse En metallurg har vært med på å utvikle en ny legering og skal presentere ulike egenskaper ved legeringen til sine kolleger. Vi skal her se på bestemmelse av smeltepunktet til legeringen. Til å bestemme smeltepunktet til legeringen har metallurgen to målemetoder. Vi kaller disse henholdsvis målemetode A og målemetode B. På grunn av målefeil kan gjentatte målinger av smeltepunktet ved målemetode A antas å være realisasjoner av uavhengige og normalfordelte variabler med forventningsverdi µ og varians σa 2. Metallurgen ønsker å estimere forventningsverdien µ. Tilsvarende kan gjentatte målinger av smeltepunktet ved målemetode B antas å være realisasjoner av uavhengige og normalfordelte variabler med forventningsverdi µ og varians σb 2. Vi skal i denne oppgaven anta at variansene σa 2 og σ2 B har kjente verdier, mens den felles forventningsverdien µ er ukjent og skal estimeres. Til dette formål gjør metallurgen n målinger med målemetode A og m målinger med målemetode B. La X 1, X 2,...,X n betegne resultatene av målingene ved metode A og la Y 1, Y 2,...,Y m betegne resultatene av målingene ved metode B. Vi skal også anta at X 1, X 2,...,X n er uavhengig av Y 1, Y 2,...,Y m. Som estimator for µ benytter metallurgen der a og b er to konstanter. µ = a X + bȳ = a n n X i + b m i=1 m Y i, i=1 a) Benytt regneregler for forventningsverdi og varians til å vise at E ( µ) = (a + b)µ og Var ( µ) = a2 σ 2 A n + b2 σ 2 B m. b) Bestem verdier for konstantene a og b slik at µ blir en best mulig estimator for µ. Videre i oppgaven skal du fremdeles ta utgangspunkt i µ = a X +bȳ, dvs du skal ikke benytte de optimale verdiene for a og b du fant i punkt b). c) Hvilken type sannsynlighetsfordeling har µ? Begrunn svaret. Utled et (1 α) 100% konfidensintervall for µ. d) Bestem hvordan konstantene a og b bør velges for at konfidensintervallet du utledet i punkt c) skal bli kortest mulig. Sammenlign med resultatet i punkt b) og kommenter.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: John Tyssedal 73 59 35 34/ 41 64 53 76 Jo Eidsvik 73 59 01 53/ 90 12 74 72 EKSAMEN I EMNE TMA4245 STATISTIKK 15. mai 2009 Tid: 09:00 13:00 Hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S / CITIZEN SR-270X Gult, stemplet A5-ark med egne håndskrevne notat. Sensuren faller: 9. juni 2009 Oppgave 1 Vannverket Et vannverk har to pumper for å pumpe vann fra en drikkevannskilde til et vannreservoar. For å kunne pumpe vann må minst en av pumpene fungere. For en vilkårlig dag la A 1 være hendelsen at pumpe 1 fungerer, og la A 2 være hendelsen at pumpe 2 fungerer. Fra tidligere vet en at P (A 1 ) = 0.8, P (A 2 ) = 0.8 og P (A 1 A 2 ) = 0.9. a) Er hendelsene A 1 og A 2 uavhengige? Er hendelsene A 1 og A 2 disjunkte? Grunngi svarene. Finn sannsynligheten for at vannverket kan pumpe vann en vilkårlig dag, det vil si finn P (A 1 A 2 ).

TMA4245 Statistikk Side 2 av 5 Vannverket blir pålagt krav om at de over tid skal kunne pumpe vann i 997 av 1000 dagar. De bestemmer seg for å intallere en pumpe til slik at de kan pumpe vann dersom minst en av de tre pumpene fungerer. Den nye pumpen skal fungere uavhengig av de to andre. La A 3 være hendelsen at den nye pumpen fungerer. b) Hvor stor må P (A 3 ) være for at sannsynligheten for å kunne pumpe vann en vilkårlig dag skal være 0.997? Anta at sannsynligheten for at vannverket kan pumpe vann en dag er uavhengig av om det kunne pumpe de foregående dagene. La X være antall dagar til første gang vannverket ikke kan pumpe vann. Hvilken fordeling har X? Grunngi svaret. Hva blir E(X) etter at den tredje pumpen er installert? Oppgave 2 Avviksrapporter Knut har ansvar for internkontrollen i en større bedrift, og er opptatt av hvor mange meldinger om alvorlige avvik som kommer inn. La N vere antall meldinger som kommer inn i et tidsrom av lengde t. Vi antar at meldingene kommer inn uavhengig av hverandre, og at N er poissonfordelt med parameter λt; f(n; λt) = (λt)n n! Det er kjent at λ = 1.5 meldinger / uke. exp( λt) n = 0, 1, 2,... a) Hva er sannsynligheten for at det i et tidsrom på en uke ikke kommer inn noen meldinger om alvorlige avvik? Hva er sannsynligheten for at det i et tidsrom på fire uker kommer inn flere enn to slike meldinger? b) Knut reiser på ferie. Når han kommer tilbake tre uker senere, er det kommet inn en melding om alvorlig avvik. Hva er sannsynligheten for at meldinga kom inn i den første uka han var på ferie? Grunngi svaret. La T være tiden fra Knut reiser på ferie til denne meldinga kom inn. Finn fordelinga til T. Vis utledninga og argumenter for resultatet. Knut har inntrykk av at avvik ikke blir meldt inn fordi det er tidkrevende, og han innfører et nytt system for innmelding av alvorlige avvik. Det første året (52 uker) det nye systemet var i bruk kom det inn N = 104 meldinger.

TMA4245 Statistikk Side 3 av 5 Knut ønsker å estimere λ basert på disse dataene. c) Vis at sannsynlighetsmaksimeringsestimatoren for λ er ˆλ SME = N 52 Finn forventning og varians for ˆλ SME. Er ˆλ SME forventningsrett? Hva blir sannsynlighetsmaksimeringsestimatet for λ? Oppgave 3 Kontrastmiddel Effekten av ulike typer kontrastmiddel brukt ved røntgenundersøkelser av hender skal studeres. Kontrastmiddelet injiseres i håndflaten før røntgenbildet tas. En ønsker å minske strålingsfaren ved å ta få bilder - helst bare ett av hver hånd. For å måle effekten har en utviklet et kontrastmål for et bilde av en hånd. Uten kontrastmiddel benevnes målet K 0 og det varierer fra person til person, men kan ansees som identisk for begge hendene på en person. Tidligere erfaring tilsier at K 0 er normalfordelt med forventningsverdi µ 0 og standardavvik σ 0. Det vil si at K 0 er n(k 0 ; µ 0, σ 0 ). a) Anta i dette punktet at µ 0 = 25 og σ 0 = 4. Finn følgende sannsynligheter: P (K 0 30) P (20 K 0 < 30) Anta nå at µ 0 og σ 0 er ukjente. En studie på 10 forsøkspersoner brukes til å kartlegge kontrastmålet. Et røntgenbilde uten bruk av kontrastmiddel tas av en av hendene til hver av de 10 forsøkspersonene. Det resulterer i 10 uavhengige observasjoner av kontrastmålet K 0, se tabell 1. Forsøksnr. i 1 2 3 4 5 6 7 8 9 10 k 0 (i) 21 28 19 23 31 32 28 23 28 27 Tabell 1: Målt kontrast uten bruk av kontrastmiddel. Her blir k 0 = 1/10 10 i=1 k 0(i) = 26 og 10 i=1 (k 0(i) k 0 ) 2 = 166. b) Utled et 90% konfidensintervall for forventet kontrastmål µ 0, og finn tallsvar.

TMA4245 Statistikk Side 4 av 5 Ved bruk av kontrastmiddel endres kontrasten i røntgenbildene slik at kontrastmålet blir: hvor R er effekten av kontrastmiddelet. K = K 0 + R Anta at R er normalfordelt med forventning µ R og standardavvik σ R, dvs n(r; µ R, σ R ). Videre antar vi at K 0 og R har en korrelasjon på ρ 0R, og at også K er normalfordelt n(k; µ K, σ K ). c) Utled uttrykk for forventningen µ K og standardavviket σ K til kontrastmålet ved bruk av kontrastmiddel. Vi ønsker nå å sammenlikne kontrastmålene ved bruk av to ulike kontrastmiddel, type A og type B. La effekten av hver av disse være R A og R B, og tilsvarende blir kontrastmålene: K A = K 0 + R A K B = K 0 + R B Vi antar at alle variablene er normalfordelte, og at R A og R B er uavhengige. For å undersøke kontrastmålene for de to ulike kontrastmidlene gjennomfører vi et forsøksopplegg: For hver type gjør vi 10 forsøk. For de 20 forsøkspersonene injiseres kontrastmiddelet i en hånd, et røntgenbilde tas, og kontrastmålet registreres. Dette gir et sett av uavhengige observasjoner av K A og K B, se tabell 2 og 3. Forsøk nr (i) 1 2 3 4 5 6 7 8 9 10 k A (i) 29 38 26 32 40 43 37 31 38 36 Tabell 2: Målt kontrast ved bruk av kontrastmiddel A. Her blir k A = 1/10 10 i=1 k A(i) = 35. Forsøk nr (i) 1 2 3 4 5 6 7 8 9 10 k B (i) 44 37 46 40 33 29 36 42 35 38 Tabell 3: Målt kontrast ved bruk av kontrastmiddel B. Her blir k B = 1/10 10 i=1 k B(i) = 38. Anta i punkt d) og e) at standardavvikene til K 0 og R er kjente, σ 0 = 4 og σ R = 2, at korrelasjonen mellom K 0 og R er kjent, ρ 0R = 5/16, og at standardavviket σ R og korrelasjonen ρ 0R er lik for de to kontrastmiddlene, det vil si Var(R A ) = Var(R B ) = 2 2 og Corr(K 0, R A ) = Corr(K 0, R B ) = 5/16. Følgende hypotese fremsettes: Forventet kontrastmål ved bruk av kontrastmiddel type A og type B er identiske. Denne hypotesen skal testes mot alternativet at de to forventningene er ulike.

TMA4245 Statistikk Side 5 av 5 d) Test hypotesen over på signifikansnivå 0.1 ved å bruke dataene i tabell 2 og 3. Utled styrken for denne testen for forskjell i forventet kontrastmål lik 2. Et alternativ forsøksopplegget er at 10 forsøkspersoner får injisert kontrastmiddel type A i ene hånden og type B i andre hånden. Deretter blir det tatt røntgenbilde av begge hendene. Dette forsøksopplegget ble gjennomført, og gav observasjoner som i tabell 4. Person (i) 1 2 3 4 5 6 7 8 9 10 k A (i) 29 38 26 32 40 43 37 31 38 36 k B (i) 32 41 28 29 42 41 40 34 42 41 Tabell 4: Målt kontrast for person nr i ved bruk av kontrastmiddel type A, k A (i), og type B, k B (i). Her blir k A = 1/10 10 i=1 k A(i) = 35 og k B = 1/10 10 i=1 k B(i) = 37. Vi skal nå teste samme hypotese som under punkt d). e) Forklar kort hvorfor dette er et bedre forsøksopplegg. Utfør en ny test på hypotesen fremsatt i punkt d) der du nyttiggjør deg dette forsøksopplegget. Bruk dataene fra tabell 4. Sammenlikn dette med resultatet i punkt d) og kommenter. Utled styrken for denne testen for forskjell i forventet kontrastmål lik 2. Sammenlikn med styrkeresultatet i punkt d) og kommenter. Regn ut hvor mange forsøkspersoner vi måtte ha i forsøksopplegget i punkt d) for å få samme styrke som over.

Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 4 Nynorsk Fagleg kontakt under eksamen: Ingelin Steinsland 73 55 02 39/ 92 66 30 96 Jo Eidsvik 73 59 01 53/ 90 12 74 72 EKSAMEN I EMNE TMA4240 STATISTIKK 1. desember 2008 Tid: 09:00 13:00 Hjelpemiddel: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S Gult, stempla A5-ark med eigne handskrevne notat. Sensuren fell: 22. desember 2008 Oppgåve 1 Sykkelruter Solan og Fabian bur i same kollektiv. Dei syklar begge til universitetet, men dei har ulike ruter. Vi antar at tida (i minutt) kvar av dei bruker er normalfordelt. For Solan X N(µ 1, σ 2 ) og for Fabian Y N(µ 2, σ 2 ). Merk at vi antar felles varians. a) Anta i dette puntet at X N(6, 1 2 ) og Y N(7, 1 2 ). Kva er sannsynet for at Fabian bruker meir enn seks minutt på turen? Kva er sannsynet for at Solan bruker mindre enn sju minutt gitt at han bruker mindre enn 8 minutt? Ein dag startar dei samtidig, kva er sannsynet for at minst ein av dei er på universitetet før det er gått seks minutt?

TMA4240 Statistikk Side 2 av 4 b) Solan har på eit vor-spiel vedda på at hans rute er raskare enn Fabian si. Ettermiddagen etterpå bestemmer dei at begge skal samla inn data for alle sykkelturane i ei veke. Deretter skal dei gjere ein hypotesetest med signifikansnivå α = 0.05. Dataene er gjeve i tabell 1. Anta at observasjonane er uavhengige og at σ 2 = 1 2. x 1 x 2 x 3 x 4 x 5 x 6 x 7 y 1 y 2 y 3 y 4 y 5 y 6 y 7 y 8 7.0 6.8 5.4 7.3 5.9 8.4 6.2 7.1 4.1 6.4 6.9 6.6 6.7 6.0 6.7 Tabell 1: Observerte tider for Solan (x 1, x 2,..., x 7 ) og Fabian (y 1, y 2,..., y 8 ). Vi får x = 1 7 i=1 7 x i = 6.31, ȳ = 1 8 i=1 8 y i = 6.81, 7 i=1 (x i x) 2 = 5.44 og 8 i=1 (y i ȳ) 2 = 6.91 Formuler hypotesetesten, og test hypotesa med gjeve data. Kva er styrken på denne testen dersom sannsynsfordelingane til X og Y er som i punkt a). c) Vi vil i dette punktet sjå på antakinga σ 2 = 1. På grunnlag av data i punkt b), estimer σ 2, og finn eit 95% konfidensintervall. Kan du på grunnlag av konfidensintervallet seie at variansen er signifikant forskjellig frå 1? d) På grunn av trafikken trur Fabian at sykkelturen tar lengre tid dess seinare han kjem seg ut om morgonen. Han bruker ei veke på å samle inn data om starttidspunkt (t i minutt etter kl 7 : 00) og sykkelturtid (y i ), sjå tabell 2. t i 0 15 30 45 60 y i 5.6 5.5 6.1 7.5 7.4 Tabell 2: Starttidspunkt t i i minutt etter kl 7 : 00 og lengde på sykkeltur y i i minutt. Vi får; t = 30, ȳ = 6.42, 5 i=1 (t i t) 2 = 2250 og 5 i=1 (t i t)y i = 84 Sett opp ein enkel lineær regresjonsmodell for sykkelturtida, og spesifiser antakingane dine. Sett og opp minste-kvadratersestimatorar for parametra i modellen (du treng ikkje vise korleis desse kjem fram). Du kan seinare i oppgåva utan bevis bruke at desse estimatorane er forventningsrette. Anta i resten av dette punktet, og i punkt e), at støyledda ɛ i regresjonsmodellen er normalfordelte med forventning 0 og kjent varians 0.5 2. Formuler Fabian sin teori som ein hypotesetest, og utfør testen med signifikansnivå på 1%. e) Ein dag startar Fabian kl 8 : 30. Prediker basert på modellen i punkt d) kor lang tid han vil bruke, og finn eit 95% prediksjonsintervall for sykkelturtida denne dagen. Kommenter.

TMA4240 Statistikk Side 3 av 4 Oppgåve 2 Ras ved sprengningsarbeid Det overraskende raset i Løsberga ved Steinkjer førte til stenging av vei og jernbane, med kostnad ca 1 million per dag. Etter dette (og andre ras) har nasjonal rassikringsgruppe levert krav til samferdselsminister Navarsete om en milliard kroner. I denne oppgaven skal vi studere en tenkt situasjon med kjent sannsynlighet for ras i forbindelse med sprengning. Et firma har i oppdrag å utbedre en bilvei. Arbeidet medfører sprengningsarbeid, med risiko for ras. Fra basis kunnskap om geologien i området antar de sannsynlighet for ras p = P (X = 1) = 0.15. Her er stokastisk variabel X = 1 dersom det raser, mens X = 0 ellers. a) Anta, kun i dette punktet, at det i sprengningsarbeidet langs veistrekningen finnes 4 slike mulige rassteder, og at eventuelle ras her vil skje uavhengige av hverandre. S er antall ras av de fire mulige rasene. Argumenter for at antall ras er binomisk fordelt med parametre n = 4 og p = 0.15. Hva er sannynligheten for at det går ingen ras? Gitt at det blir minst ett ras, hva er sannsynligheten for at det blir flere enn ett ras? Videre i oppgaven ser vi kun på et av de mulige rasstedene. Dersom det raser her, blir det uforutsett stenging av vei, omdirigering av trafikk, dekking av skader, etc. Dette har total kostnad 40 millioner kroner. Dersom det ikke raser, er ingen skade skjedd, og kostnad 0 kroner. Det er også mulig å legge om veien i anleggsperioden. Dette har en fast kostnad på 7 millioner kroner. Et ras vil da ikke gi ytterligere kostnad. Strategi A er å sprenge uten omlegging av veien. Strategi B er midlertidig omlegging av veien. b) Beregn forventet kostnad Z under Strategi A. Finn også standardavviket til kostnad. Bør veien legges midlertidig om? Begrunn svaret. For 5 millioner kroner kan det gjøres grundige geologiske undersøkelser som gir et sikkert svar om det vil rase eller ikke. Basert på resultatet av en slik undersøkelse vil man vite om strategi A eller strategi B bør velges. Hva er forventet kostnad dersom man gjennomfører denne grundige undersøkelsen? Bør den grundige undersøkelsen gjennomføres? Begrunn svaret. For 1 million kroner kan geologer undersøke området med enkle metoder og gi en kvalifisert uttalelse om ras (Y = 1) eller ikke ras (Y = 0). Denne enkle metoden er ikke sikker, og vi antar at de treffer med sannsynlighet P (Y = 1 X = 1) = P (Y = 0 X = 0) = γ > 0.5. Vi skal først estimere sannsynligheten γ fra data der vi kjenner utfallet av X, om det gikk ras eller ikke. Firmaet har brukt geologene i lignende, uavhengige, situasjoner 15 ganger tidligere.

TMA4240 Statistikk Side 4 av 4 I sju av tilfellene gikk det ras X i = 1, i = 1,..., 7. Uttalelsene til geologene var da som følger: Y 1 = 0, Y 2 = 1, Y 3 = 0, Y 4 = 1, Y 5 = 1, Y 6 = 1, Y 7 = 1. I åtte av tilfellene gikk det ikke ras X i = 0, i = 8,..., 15. Uttalelsene til geologene var da som følger: Y 8 = 1, Y 9 = 0, Y 10 = 0, Y 11 = 0, Y 12 = 1, Y 13 = 0, Y 14 = 1, Y 15 = 0. En estimator for γ er: 15 i=1 ˆγ = I i 15 der I i = 1 dersom Y i = X i, og I i = 0 dersom Y i X i. Vi antar at I i, i = 1,..., 15 er uavhengige. c) Er ˆγ sannsynlighetsmaksimeringsestimatoren (SME) til γ? Også kalt maximum likelihood estimator. Svar ved å finne SME til γ. Regn ut estimatet for γ basert på estimatoren ˆγ. d) Beregn forventning og varians til ˆγ. Firmaet vurderer nå å samle inn slike relativt billige data fra geologene. e) Bruk i dette punktet den estimerte verdien av γ fra punkt c). Bruk Bayes formel til å regne ut sannsynligheten for ras når geologene uttaler ikke ras. Regn videre sannsynligheten for ras når geologene uttaler ras. Firmaet ønsker å regne forventet kostnad før geologene eventuelt kalles inn. Argumenter for at forventet kostnad er: C = 1 + 1 min[7, E(Z Y = y)]p (Y = y), y=0 der Z er kostnad ved strategi A. Videre er min[a, b] = a dersom a < b, og min[a, b] = b, dersom a > b. Hva blir forventet kostnad C? Bør undersøkelsen gjennomføres? Begrunn svaret.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 Bokmål Faglig kontakt under eksamen: Henning Omre mtel 90937848 EKSAMEN I EMNE TMA4240 STATISTIKK 14. august 2008 Tid: 09:00 13:00 Hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S Gult, stemplet A5-ark med egne håndskrevne notater. Sensuren faller: 4. september 2008 Oppgave 1 Brødristere En fabrikk produserer brødristere på samlebånd, og ferdig monterte brødristere kommer sekvensielt ut fra produksjonsprosessen. Umiddelbart deretter blir hver enhet kvalitetssikret. Benevn hendelsen - feil på vilkårlig brødrister - for F, og anta at alle feil blir identifisert i kvalitetstesten. Av erfaring vet en at tre av hundre brødristere har feil, dvs P (F ) = 0.03 for en vilkårlig enhet. Anta videre at feilen oppstår uavhengig av hverandre. En kvalitetsingeniør starter morgenskiftet. a) Hva er sannsynligheten for at hun/han finner feil på de to første brødristerene? Hva er sannsynligheten for at hun/han finner feil på to av de syv første brødristerene? Hva er sannsynligheten for at de to første brødristerene har feil gitt at det er to feil på de syv første brødristerene?

TMA4240 Statistikk Side 2 av 3 b) Hva er sannsynligheten for at hun/han må teste mer enn fem brødristere før den første feilen finnes? Hva er sannsynligheten for at feil på to påfølgende brødristere ikke forekommer blant de fem første enhetene? Det kan oppstå to typer feil på brødristerene, benevn dem F 1 og F 2, og en har F = F 1 F 2. F 1 er skjønnhetsfeil og F 2 er funksjonsfeil. Det er mye enklere å identifisere skjønnhetsfeil, F 1, enn funksjonsfeil, F 2. Erfaring tilsier at to av hundre brødristere har skjønnhetsfeil, dvs P (F 1 ) = 0.02 for en vilkårlig enhet. Videre er det avhengighet mellom feiltypene slik at P (F 2 F 1 ) = 0.4. c) For å effektivisere kvalitetssikringsprosessen velger en å teste kun for skjønnhetsfeil F 1. Hva er da sannsynligheten for at en brødrister med feil slipper igjennom kvalitetssikringen? Hvor stor andel av funksjonsfeilene F 2 blir da avslørt i kvalitetstesten? Oppgave 2 Sensoren En sensormåling, X, av en verdi a antas å være Gaussisk (normal) fordelt, forventningsrett og ha varians σ 2. Det vil si at X er n(x; a, σ). a) Anta bare i dette punket at a og σ 2 er kjente og har verdier a = 2.0 og σ 2 = 0.04. Regn ut følgende sannsynligheter: P (X 1.9) P (1.8 X 2.4) P (X 2.4 X 1.9) Anta heretter at både a og σ 2 er ukjente konstanter. Anta videre at X 1,..., X 10 er n = 10 uavhengige sensormålinger med fordeling n(x; a, σ). Det oppgis at 10 i=1 x i = 21.0 og 10 i=1 x2 i = 45.0. Betrakt følgende estimator for den ukjente målevariansen σ 2 : med X = 1 n n i=1 X i. ˆσ 2 = 1 n 1 n (X i X) 2 (1) i=1

TMA4240 Statistikk Side 3 av 3 b) Spesifiser sannsynlighetsfordelingen til den tilfeldige variabelen: V = (n 1)ˆσ2 σ 2 = n ( Xi X ) 2 (2) i=1 σ Skriv opp uttrykket for den tilhørende sannsynlighetstettheten, dvs f(v). Vi at estimatoren ˆσ 2 er en forventningsrett estimator for variansen σ 2. Utled et uttrykk for variansen til estimatoren ˆσ 2. c) Utled et uttrykk for 0.90-konfidensintervall for σ 2. Regn ut tallsvar basert på tallverdiene gitt over. d) Utled et uttrykk for sannsynlighetstettheten til estimatoren ˆσ 2. Hvilken klasse av fordelinger tilhører denne tettheten? Spesifiser også de tilhørende parameterverdiene. Bruk disse resultatene til å vise at estimatoren ˆσ 2 er forventningsrett for σ 2, samt til å utlede variansen til estimatoren ˆσ 2. Hvorfor er ikke denne sannsynlighetstettheten for ˆσ 2 velegnet til å lage konfidensintervaller fra? Oppgave 3 SME-utledning Betrakt en Paretofordelt variabel X, med ukjent parameter β. Herav: f(x; β) = β 2β x β+1 ; 2 < x < (3) Anta at X 1,..., X n er uavhengige tilfeldige variable fra f(x; β) a) Utled sannsynlighetsmaksimeringsestimatoren for β.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 4 Bokmål Faglig kontakt under eksamen: EKSAMEN I EMNE TMA4245 STATISTIKK august 2008 Tid: 09:00 13:00 Hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S Gult, stemplet A5-ark med egne hndskrevne notater. Sensuren faller: august 2008 Oppgave 1 Vi skal i denne oppgaven se på høydefordelingene til menn og kvinner. Anta at høyden til menn er normalfordelt med forventningsverdi µ M = 179 og varians σ 2 M = 62, og at høyden til kvinner er normalfordelt med forventningsverdi µ K og varians σ 2 K a) Finn sannsynligheten for at en tilfeldig valgt mann er over 185 cm. Finn sannsynligheten for at en mann er over 185 cm gitt at han er over 179 cm. b) La µ K = β µ M, der β er en ukjent parameter vi ønsker å estimere. Anta at vi har høydedata fra et tilfeldig utvalg på n = 5 kvinner; X i N(µ K, σk 2 ), i = 1, 2,..., n. Som estimator for β velges ˆβ = Er ˆβ forventningsrett? n i=1 X i nµ M

TMA4245 Statistikk Side 2 av 4 Utled et uttrykk for et 95% konfidensintervall for β, og finn tallsvar når vi fra data får x = n i=1 x i/n = 167.5 og s 2 = 1 n i=1 n 1 (x i x) 2 = 5.1 2. Oppgave 2 En næringsmiddelbedrift har et laboratorium for testing av kvaliteten av bedriftens produkter. For testing av mengde pr. volumenhet av et bestemt sporstoff i et av produktene, bruker bedriften to måleapparater, som vi kan kalle A og B. A er det mest nøyaktige av de to, og det er også det raskeste. Ulempen med A er at det er dyrt i bruk. Bedriften har derfor etablert en testprosedyre som går ut på å ta ut to tilfeldige utvalg fra en gitt produksjonsserie, hvor vi kan anta at mengde pr. volumenhet, betegnet med µ, er konstant. Det ene utvalget, som er av størrelse n, testes i A. Etter denne testingen i A har en da et tilfeldig utvalg x 1,..., x n med måleresultater. Det andre utvalget, som er av størrelse 2n, testes i B. Det resulterer i et uavhengig tilfeldig utvalg y 1,..., y 2n av størrelse 2n med måleresultater etter testing i B. Det tilfeldige utvalget x 1,..., x n kan betraktes som et utfall av n stokastiske variabler X 1,..., X n, som er uavhengige og normalfordelte med forventningsverdi µ og varians σ 2, der σ 2 reflekterer A s nøyaktighet. Tilsvarende, y 1,..., y 2n kan betraktes som utfall av 2n stokastiske variabler Y 1,..., Y 2n, som er uavhengige og normalfordelte med forventningsverdi µ og varians 4σ 2, og de er uavhengige av X i, i = 1,..., n. a) Mengde pr. volumenhet µ skal estimeres pågrunnlag av de tilsammen 3n målingene som er gjort, og en mulig estimator er ˆM = 1 2 ( X + Y ) ( X = 1 n n i=1 X i, Y = 1 2n Hva er forventningsverdi og varians til denne estimatoren? b) Vis at sannsynlighetsmaksimerings-estimatoren (SME) for µ er gitt som M = 1 3 og beregn dens forventningsverdi og varians. ( 2X + Y ), Hvilken av de to estimatorene ˆM og M ville du anbefale? Begrunn svaret. c) Anta i dette punktet at σ 2 er kjent, og lik 1.0. En skal nå teste hypotesen H 0 : µ = µ 0 = 100, 2n j=1 Y j )

TMA4245 Statistikk Side 3 av 4 mot H 1 : µ < µ 0. på signifikansnivå α = 0.05. Foreslå en testobservator, og angi testens kritiske område. Hva blir konklusjonen når n = 4 og måleresultatene er: X i : 100.3, 100.8, 99.5, 98.8; som gir X = 100.4 Y j : 100.1, 98.7, 99.2, 102.3, 103.0, 97.5, 96.6, 103.1; som gir Y = 100.5 d) Anta i dette punktet at σ 2 er ukjent. Følgende to estimatorer innføres, S1 2 = 1 n ( Xi X ) 2 (E[S 21] ) = σ 2 n 1 og S 2 2 = 1 2n 1 i=1 2n j=1 ( Yj Y ) 2 Disse to kombineres i en ny stokastisk variabel, V = (n 1)S2 1 σ 2 + (2n 1)S2 2 4σ 2. (E[S 22] = 4σ 2 ) Begrunn hvorfor V blir χ 2 -fordelt. Hvor mange frihetsgrader har V? Foreslå en testobservator for µ basert på M og V og angi fordeling. Oppgave 3 I semifinalen mellom Frankrike og Tyskland i et verdensmesterskap i fotball er resultatet uavgjort etter ekstraomganger. Vi definerer en runde i straffesparkkonkuransen til å være at hvert lag skyter en straffe hver. I første del av straffesparkkonkurransen er det 5 runder, 5 straffespark fra hvert lag, og laget som skårer flest ganger vinner. Dersom lagene skårer like mange ganger i første del, går man over til andre del av straffesparkkonkurransen. Nå spilles det en og en runde: Hvert lag har en straffe hver. Dersom det ene laget skårer og det andre bommer, har vi en vinner. Ellers spilles en ny runde (hvert lag får en straffe hver) inntil vi har en vinner. Anta at de tyske spillerene har sannsynlighet p T = 0.80 for å skåre på straffe, at de franske spillerene har sannsynlighet p F = 0.70 for å skåre, og at utfallene av straffesparkene er uavhengige av hverandre.

TMA4245 Statistikk Side 4 av 4 a) Hva er sannsynligheten for at stillingen blir 5-5 etter første del? Hva er sannsynligheten for at stillingen blir 3-3 etter første del? Sett opp uttrykk for / algoritme for hvordan man kan finne sannsynligheten p D1 lik for at lagene står likt etter første del? Du trenger ikke å finne tallsvar, og kan senere i oppgaven benytte at p D1 lik = 0.27 b) Anta i dette punktet at vi er kommet til del 2 av straffesparkkonkuransen. Hva er sannsynligheten p V 1 D2 for at vi har en vinner etter første runde i del to? Gitt at vi har en vinner etter første runde i del 2, hva er sannsynligheten p T V 1,D2 for at dette er Tyskland? Hva er sannsynligheten p T D2 for at Tyskland vinner konkurransen (gitt at vi er kommet til del 2)? c) La X være antall runder i del 2 til og med runden det blir kåret en vinner i. Hvilken fordeling har X? Begrunn svaret og oppgi parameter/re. Hva er forventningsverdi og varians i antall runder (i del 2) til det blir kåret en vinner? d) Vi antar at det alltid blir spilt 5 runder i del 1. Hva er forventet totalt antall runder i straffesparkkonkurransen (del 1 og evt. del 2) til det blir kåret en vinner? Finn også variansen av det totale antall runder i straffesparkkonkurransen (del 1 og evt. del 2) inntil det blir kåret en vinner.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 Bokmål Faglig kontakt under eksamen: Ingelin Steinsland 73 55 02 39/ 92 66 30 96 Arild Næss 73 59 20 25/ 99 53 82 94 Øyvind Salvesen 73 59 70 53/ 99 53 83 50 EKSAMEN I EMNE TMA4245 STATISTIKK 20. mai 2008 Tid: 09:00 13:00 Hjelpemidler: Tabeller og formler i statistikk, Tapir Forlag K. Rottmann: Matematisk formelsamling Kalkulator HP30S Gult, stemplet A5-ark med egne håndskrevne notater. Sensuren faller: 10. juni 2008 Oppgave 1 Poteter En potetmelfabrikk kjøper poteter levert i standardsekker. Vekten av en sekk poteter varierer fra sekk til sekk. Vi antar at vekten X av en tilfeldig valgt sekk poteter kan modelleres som en normalfordelt stokastisk variabel (tilfeldig variabel) med forventningsverdi µ = 50.5 kg og standardavvik σ = 1.0 kg. Videre antar vi at vektene av forskjellige sekker kan betraktes som uavhengige. a) Hvor stor er da sannsynligheten for at en tilfeldig valgt sekk skal veie mindre enn 50.0 kg? Hvor stor er sannsynligheten for at en tilfeldig valgt sekk skal veie mindre enn 50.5 kg når vi vet at den er tyngre enn 50.0 kg?

TMA4245 Statistikk 20. mai 2008 Side 2 av 3 b) Hvor stor er sannsynligheten for at totalvekten av 25 tilfeldig valgte sekker skal overstige 1250.0 kg? Hvor stor er sannsynligheten for at minst en av tre tilfeldig valgte sekker skal veie mindre enn 50.0 kg? Ved fabrikken mener de at det er en lineær sammenheng mellom poteters vekt og andelen stivelse. For å undersøke dette nærmere velges det ut 7 poteter. Vekta til hver av disse blir målt, og betegnes med u 1,..., u 7. Stivelsesinnholdet (i %) i poteta med vekt u j, modelleres som en stokastisk variabel Y j, j = 1,..., 7. Y 1,..., Y 7 antas uavhengige og normalfordelte med samme standardavvik τ = 0.7 %. Ut fra det en vet, er det naturlig å bruke følgende modell: Y j = α + β ( u j u ) + ɛ j, j = 1,..., 7, der α og β er ukjente konstanter, u = 1 7 7 j=1 u j, og ɛ j er normalfordelt med forventning 0 og varians τ 2 = 0.7 2. c) Vis at minste kvadratsums-estimatorene for henholdsvis α og β blir. Hint: 7 j=1 (u j ū) = 0. A = Y = 1 7 7 Y j og B = j=1 7 j=1 (u j u)y j 7 j=1 (u j u) 2 d) Vis at A og B begge er forventningsrette, og finn variansene deres. e) Våre observasjoner er: j 1 2 3 4 5 6 7 u j 1.07 1.08 1.09 1.10 1.11 1.12 1.13 y j 12.3 13.3 15.8 18.7 19.6 23.1 24.3 slik at ū = 1.10, ȳ = 18.16, n j=1 (u j ū)y j = 0.59 og n j=1 (u j ū) 2 = 0.0028. Vi ønsker nå å predikere stivelsesinnholdet i en ny potet med vekt u 0 = 1.115. Benytt prediktoren Ŷ0 = A + B(u 0 ū), der ū = 7 j=1 u j/7. Hva blir predikert stivelsesinnhold for en potet med u 0 = 1.115? Hvilken fordeling har feilen Ŷ0 Y 0? Begrunn svaret, og finn forventning og varians (du kan uten bevis bruke at A og B er uavhengige). Benytt dette til å sette opp et 95% prediksjonsintervall for Y 0. Finn tallsvar.

TMA4245 Statistikk 20. mai 2008 Side 3 av 3 Oppgave 2 Fire-på-rad Petter og Katrine spiller fire-på-rad. La p være sannsynligheten for at Katrine vinner et spill, og anta at spillene er uavhengige av hverandre. a) Anta bare i dette punktet at p = 0.4. Hva er sannsynligheten for at Petter vinner det første spillet og Katrine de to neste? De spiller sju spill. La X være antallet spill Katrine vinner. Hvilken fordeling har X? Begrunn svaret / diskuter antagelsene. Hva er sannsynligheten for at Katrine vinner akkurat ett av de sju spillene? b) La nå p være en ukjent parameter. Vi ønsker å estimere p ut fra resultatet av de n = 7 spillene. La resultatene være Z 1, Z 2,..., Z 7 der Z i = 0 dersom Petter vinner det i-te spillet og Z i = 1 dersom Katrine vinner. Vis at sannsynlighetsmaksimeringsestimatoren (maximum likelihood-estimatoren) for p er ˆp = n i=1 Z i/n (= X/n). Hva blir estimert p dersom resultatene er: 1, 1, 0, 0, 1, 0, 0, d.v.s. x = 3. c) Finn forventning og varians for ˆp. d) Petter påstår at han er flinkere enn Katrine i fire-på-rad. Formuler dette som en hypotesetest, og test hypotesa med signifikansnivå 0.05 når x = 3. e) Finn styrken til testen over dersom den sanne verdien for p er p 1 = 0.1. Hvor stor må n være dersom styrken for p 1 = 0.1 skal være minst 0.8.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 4 Faglig kontakt under eksamen: Henning Omre, tlf. 90937848 Øyvind Salvesen, tlf. 93648772 EKSAMEN TMA4240 STATISTIKK Tirsdag 11. desember 2007 Tid: 09:00 13:00 Sensurdato 11. januar 2008 Tillatte hjelpemidler: Gult A5-ark med egne håndskrevne notater (stemplet ved Institutt for matematiske fag) Tabeller og formler i statistikk (Tapir forlag) K. Rottmann: Matematisk formelsamling Kalkulator: HP30S BOKMÅL Oppgave 1 Valg i kommune I kommunestyrevalget i en Vestlandskommune er det kun to lister, Borgelig fellesliste KBF og Sosialistisk fellesliste KSF. Det er sannsynlighet 0.70 for at en vilkårlig velger stemmer KBF og sannsynlighet 0.30 for at han stemmer KSF. Anta at velgerne ankommer valglokalene i tilfeldig rekkefølge på valgdagen samt at antallet stemmeberettigete er stort nok til at en kan anta at de ti første som stemmer har samme stemmesannsynlighet uavhengig av hva de foran har stemt.

Side 2 av 4 a) Hva er sannsynlighetene for at: - KSF får sin første stemme av den velgeren som ankommer som nummer tre? - KSF har to av stemmene når fem velgere har stemt? - KSF er største parti når ni stemmer er avgitt? I fylkestingsvalget i det fylket kommunen tilhører er det tre lister, Borgerlig fellesliste FBF, Sentrumslista FCL og Sosialistisk fellesliste FSF. Anta at alle velgere stemmer både i kommunestyreog fylkestingsvalg. Det er kjent at en vilkårlig velger som stemmer KBF i kommunestyrevalget stemmer FBF med sannsynlighet 0.80, FCL med sannsynlighet 0.15 og FSF med sannsynlighet 0.05. Tilsvarende vil en vilkårlig KSF-velger stemme FBF med sannsynlighet 0.10, FCL med sannsynlighet 0.20 og FSF med sannsynlighet 0.70. b) Regn ut sannsynlighetene for at en vilkårlig velger stemmer på hvert av partiene FBF, FCL og FSF i fylkestingsvalget. Hva er sannsynligheten for at FBF har fem, FCL har to og FSF har tre stemmer i fylkestingsvalget når ti velgere har stemt? c) På valgdagen kommer en vilkårlig velger ut fra valglokalet og oppgir at han har stemt på FCL i fylkestingsvalget. Hva er sannsynligheten for at han har stemt på KSF i kommunestyrevalget? På valgdagen kommer en vilkårlig velger ut fra valglokalet. Dersom han har stemt på FCL med sannsynlighet 0.70 og på FBF med sannsynlighet 0.30 i fylkestingsvalget, hva er da sannsynligheten for at han har stemt på KSF i kommunestyrevalget? Oppgave 2 Bilsikringer Levetiden til en vilkårlig bilsikring, T, er en tilfeldig variabel som oppgis å tilhøre sannsynlighetsfordelingsklassen { 0 t 0 f(t; α) = 2αte αt2 t > 0 hvor α > 0 er en ukjent parameter. En bilprodusent som bruker sikringene ønsker å bestemme parameteren α for å kunne etablere et effektivt vedlikeholdsprogram for bilene sine. Produsenten utfører et kontrollert forsøk på 8 forskjellige sikringer og observerer levetidene t 1, t 2,..., t 8.