KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 16. juni 2009. KLASSE: HIS 07 10. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside) TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller. INNFØRING MED PENN, evt. trykkblyant som gir gjennomslag. Ved innlevering skilles hvit og gul besvarelse og legges i hvert sitt omslag. Oppgavetekst, kladd og blå kopi beholder kandidaten. Husk kandidatnummer på alle ark.
Eksamen i Statistikk. 16. juni 2009. 1 Hvert av de 12 bokstavpunktene teller likt ved bedømmelsen, oppgaver uten bokstavpunkter teller som et bokstavpunkt. Oppgave 1 Et saftkonsentrat har et sukkerinnhold som er omtrent 300 gram per liter med sukker, men dette varierer mye fra parti til parti på grunn av varierende sukkerinnhold i frukten. I denne oppgaven skal vi gå ut fra at sukkerprosenten er en normalfordellt variabel X med μ = 300 og σ = 20. a ) b ) Hva er sannsynligheten for at en liter inneholder mellom 280 og 320 gram sukker? Hva er sannsynligheten for at en stikkprøve på en liter fra hver av 4 slike partier i gjennomsnitt inneholder mellom 280 og 320 gram sukker per liter? Oppgave 2 Produsenten av saftkonsentratet i oppgave 1 var ikke fornøyd med den ustabile sukkermengden, og satte i gang endringer i produksjonsprosessen for åforsøkeå stabilisere denne rundt 300 gram per liter. En stikkprøve fra 10 slike partier etter denne omleggingen ga følgende målinger av sukkerinnhold: { 293, 303, 298, 298, 301, 309, 292, 294, 292, 296 } a ) Regn ut empirisk forventningsverdi x og standardavvik s for den stikkprøven. b ) Regn ut et 95% konfidensintervall for forventningsverdien μ. c ) Utfør hypotesetesten H 0 : μ = 300 mot H 1 : μ 300 med signifikansnivå 5%. d ) med dette datasettet. Gir dataene grunn til å si at sukkerinnholdet ikke er 300 gram per liter i gjennomsnitt? I tillegg til at sukkerinnholdet i gjennomsnitt bør være ca. 300 gram, bør heller ikke variasjonen fra parti til parti være for stor. For å vurdere dette vil han lage et 95% konfidensintervall for σ fra dette datasettet, og det skal du også gjøre. Du får bruk for fordelingsresultatet i formel 33) i avsnitt 2.4.4 i formelsamlinga og fraktiltabellen for χ 2 fordeling tabell 5.4). For sikkerhets skyld er dette gjengitt til slutt i oppgaveteksten. Oppgave 3 Saftprodusenten testet også ut to forskjellige metoder til å regulere sukkerinnholdet, og en stikkprøve på 10 partier produsert med hver metode ga følgende resultat: x 305 295 302 300 300 310 306 305 299 301 x = 302.3 s x =4.27 y 300 305 290 299 290 297 294 294 297 308 y = 297.4 s y =5.89
Eksamen i Statistikk. 16. juni 2009. 2 Empirisk forventningsverdi og standardavvik for de to datasettene er regnet ut for deg i kolonnene til høyre. Anta metoden betegnet med x er gir sukkerinnhold X i Nμ x,σ) og metoden betgnet med y gir sukkerinnhold Y i Nμ y,σ)i {1, 2, 3,...,10}), med samme σ og uavhengige resultater for alle enkeltprøvene. Han har en mistanke om at metoden betegnet med x gir høyere forventet sukkerinnhold enn metoden betegnet med y, så han vil utføre hypotesetesten H 0 : μ x = μ y mot H 1 : μ x >μ y med signifikansnivå α =5%. a ) Utfør denne testen som en uparet t test. Hva viser testresultatet om den praktiske situasjonen? b) Hvis vi antar σ = 5somkjent kan vi isteden lage en uparet z test. Testprosedyren behøver du ikke utlede her, den er Forkast H 0 hvis x y>3.68 Anta forskjellen i virkeligheten er μ x μ y =5.Hvaerdateststyrken, detvilsi sannsynligheten for at vi forkaster H 0 med denne testen? Oppgave 4 La X t være antall solgte TV-apparater av et visst merke i t salgsdager i en elektonikkforretning. Anta X t Po λt) medλ =1.0, som er forventet antall solgte apparater per dag. I denne oppgaven skal du altså anta Poissonfordeling, det vil si at salget er uavhengig av hvilken ukedag eller årstid det er snakk om. a ) b ) c ) d ) Hva er sannsynligheten for at forretningen selger fler enn 5 TV-apparater en salgsdag? Første kvartal i året vi snakker om består av 76 salgsdager. Hva er sannsynligheten for at forretningen selger færre enn 90 TV-apparater det kvartalet? Andre kvartal er 71 salgsdager. Hva er sannsynligheten for at det selges flere TVer andre enn første kvartal? For forskjellige typer produksjonsfeil returneres en del av TV-apparatene til service. Sannsynligheten for at et vilkårlig apparat returneres er p = 0.20. Hva er sannsynligheten for at det returneres nøyaktig 1 apparat av de som ble solgt en vilkårlig dag? Gjør den forenklingen at du neglisjerer sannsynligheten for at det i løpet av en dag selges flere enn 5 apparater og akkurat 1 av disse returneres. Formel 33) i avsnitt 2.4.4 i formelsamlinga:
Eksamen i Statistikk. 16. juni 2009. 3 Hvis X 1,...,X n er uavhengige og Nμ, σ) fordelt, og X = n i=1 X i /n, har X = n 2 Xi X χ 2 fordeling med ν = n 1 frihetsgrader i=1 σ Utasnitt av tabell 5.4 i formelsamlinga: χ 2 fordeling, fraktiltabell. Tabell over k α,gittvedpx>k α )=α der X χ 2 ν. Det vil si X er χ 2 fordelt med ν frihetsgrader. ν 0.995 0.990 0.975 0.950 0.050 0.025 0.010 0.005 1 0,000 0,000 0,001 0,004 3,84 5,02 6,63 7,88 2 0,010 0,020 0,051 0,103 5,99 7,38 9,21 10,60 3 0,072 0,115 0,216 0,352 7,82 9,35 11,34 12,84 4 0,207 0,297 0,484 0,711 9,49 11,14 13,28 14,86 5 0,412 0,554 0,831 1,15 11,07 12,83 15,09 16,75 6 0,676 0,872 1,24 1,64 12,59 14,45 16,81 18,55 7 0,99 1,24 1,69 2,17 14,07 16,01 18,48 20,28 8 1,34 1,65 2,18 2,73 15,51 17,53 20,09 21,95 9 1,74 2,09 2,70 3,33 16,92 19,02 21,67 23,59 10 2,16 2,56 3,25 3,94 18,31 20,48 23,21 25,19 11 2,60 3,05 3,82 4,58 19,68 21,92 24,72 26,76 12 3,07 3,57 4,40 5,23 21,03 23,34 26,22 28,30 13 3,57 4,11 5,01 5,89 22,36 24,74 27,69 29,82 14 4,08 4,66 5,63 6,57 23,68 26,12 29,14 31,32 α SLUTT på oppgavesettet. Lykke til!
Løsning, eksamen i Statistikk. 16. juni 2009. 1 Oppgave 1 a) 320 300 280 300 P 280 X 320) = Φ Φ =Φ1.00) Φ 1.00) 20 20 =Φ1.00) 1 Φ1.00)) = 2Φ1.00) 1 tab.5.1 = 2 0.8413 1=0.6826 b) X er også normalfordelt, med samme forventningsverdi, μ = 300, og standradavvik σ/ n =20/ 4 = 10: Oppgave 2 ) 320 300 280 300 P 280 X 320 =Φ Φ =Φ2.00) Φ 2.00) 10 10 =Φ2.00) 1 Φ2.00)) = 2Φ2.00) 1 tab.5.1 = 2 0.9772 1=0.9544 a) x = 297.6, s =5.48. b ) Kan bruke formelen for t intervall fra formelsamlinga direkte. Siden det er 10 1 = 9 frihetsgrader finner vi i tabell 5.3 t α/2 = t 0.025 =2.262. 297.6 2.262 5.48/ 10, 297.6 2.262 5.48/ 10 = 293.7, 301.5 c ) En tosidig test henger sammen med tilsvarende konfidensintervall på denmåten at om μ 0 ligger i konfidensintervallet beholdes H 0. Siden 300 er i konfidensintervallet i b oppgaven beholdes H 0, dataene gir ikke grunnlag for å hevde at gjennomsnittlig sukkerinnhold avviker fra 300. Mer formelt kan man bruke t observatoren T = X 300 S/ som har en Students t-fordeling 10 med 9 frihetsgrader om H 0 er sann. H 0 i den tosidige testen forkastes derfor om T > t 0.025 =2.262. I dett tilfellet er 297.6 300 t = 5.48/ 10 =1.38 d ) såh 0 beholdes. Hvis vi avgrenser med 0.975 og 0.025 fraktilene i χ 2 fordeling med 9 frihetsgrader blir sannsynligheten 0.025 for at utfallet ender utenfor på hver av sidene, og dermed 0.95 for at utfallet havner innenfor.
Løsning, eksamen i Statistikk. 16. juni 2009. 2 Fraktilene finnes i tabell 5.4, siden vi ikke har symmetri om y aksen trenger vi begge to: y k 1 = k 0.975 tab. 5.4 = 2.70 k 2 = k 0.975 tab. 5.4 = 19.02 0.950 0.025 0.025 0 5 10 15 20 25 x n 2 Xi X P k 1 k 2 =0.95 σ i=1 Dette omformes slik at σ 2 ender i midten. Husk at når brøkene inverteres snur ulikhetstegnene: ni=1 2 X i X ni=1 2 X i X P σ 2 =0.95 k 2 k 1 n i=1 X i X) 2 Siden S 2 = n 1 er 2 n i=1 X i X) =n 1)S 2,ogvedåtakvadrtrotenpå alle leddene og bruke n 1=9får vi 3S P σ 3S ) =0.95 k2 k1 Ved å sette inn observert standardavvik s =5.48 og tallene for k 1 og k 2 får vi konfidensintervallet: 3 5.48, 3 5.48 = 3.8, 10.0 19.02 2.70 Oppgave 3 a) Bruk T = x y s 1 med n = m = 10 som testobservator. Denne har Students t fordeling p n + 1 m med n + m 2=18frihetsgraderhvisH 0 er sann, og H 0 forkastes hvis denne observeres tab.5.3 til t>t 0.05 = 1.734. n 1)s 2 x s p = +m 1)s2 y = s n + m 2 2 x + s 2 y)/2 =5.14 og siden 1 n + 1 m = 1 10 + 1 10 =1/5 =0.2 er 302.3 297.4 t = 0.2 =2.13 5.14
Løsning, eksamen i Statistikk. 16. juni 2009. 3 Siden t>1.734 forkastes H 0, dataene viser at produksjonssmetode x gir høyere sukkerinnhold enn produksjonssmetode y. b) Vi har at X N μ x,σ/ ) 10 og Y N μ y,σ/ ) 10. Da er E X Y = μ x μ y,somvinå antar er 5. Var X Y = σ2 10 + σ2 10 =5,så standardavviket til testobservatoren er 5ogX Y N 5, ) 5. Sannsynligheten for åforkasteh 0 er da ) ) 3.68 5 P X Y>3.68 =1 P X Y<3.68 =1 Φ 5 Oppgave 4 =1 Φ 0.59) = Φ0.59) = 0.7224 a) X Po 0.5) så 1 0 PX>5) = 1 PX 5) = 1 0! + 11 1! + 12 2! + 13 3! + 14 4! + 15 e 1.0 =0.00059 5! Vi kan vel dermed i praksis se bort fra at så mange apparater selges på en dagb) Her må du nesten bruke tilnærming til normalfordeling. X Po 76) med μ =76og σ = 76 = 8.72. Med halvkorreksjon får vi da 89.5 76 PX<90) Φ = Φ1.55) = 0.9394 8.72 Glemmer du halvkorreksjonen får du nesten riktig svar, 0.9463. Kommentar: Utregnet i Maple uten tilnærmingsformel fikk jeg 0.9363, så med halvkorreksjon er tilnærmeingsfeilen ca. 0.3%, mens den er ca. 1% uten halvkorreksjon. c) La X være antall solgte apparater i første, og Y i andre kvartal. Hvis vi tilnærmer med X N 76, ) 76 og Y N 71, ) 71 og antar uavhengighet så er E X Y )=76 71 = 5 og Var X Y ) = 76 + 71 = 147. Dermed er tilnærmet) X Y N 5, ) 147. 0 5 PX<Y)=PX Y<0) = Φ =Φ 0.41) = 1 0.6591 = 0.3409 147 Med høyde for litt tilnærmingsfeil er det vel rimelig å si at sannsynligheten er ca 1/3. d ) Antall TV-er som returneres er binomisk fordelt med n som antall solgte og p =0.20. Retur av 1 er Salg av 1 og retur av 1+salg av 2 og retur av 1+ salg av 3 og retur av 1+.... Vi antar antall solgte og andel retur er auavhengig, det vil si 1 0 0! e 1 0+ 11 1 1! e 1 0.2 1 0.8 0 + 1 2 1 2! e 1 0.2 1 0.8 1 + 1 1 3! e 1 + 1 4! e 1 4 0.2 1 0.8 3 + 1 1 5! e 1 3 0.2 1 0.8 2 1 5 0.2 1 0.8 4 + = 1
Løsning, eksamen i Statistikk. 16. juni 2009. 4 0.2 0+1+ 1 2 2 0.8+1 6 3 0.82 + 1 24 4 0.83 + 1 ) 120 5 0.84 + e 1 =0.1635 Kommentar: Generelt kan argumentet i denne oppgaven, ved hjelp av rekketeori Matematikk 20), generaliseres til å vise at antall returer med denne modellen er Poissonfordelt med parameter λ p. Hadde man visst dette ble regnestykket ganske enkelt 0.21 1! e 0.2 =0.2e 0.2 =0.1637. Avviket mellom disse svarene skyldes forenklinga, at vi bare hadde tatt med leddene til og med 5 solgte. Vi ser at denne feilen er ca. 1/3 av sannsynligheten for åfå mer enn 5 solgte, noe som du sikkert er enig i ser rimelig ut.