Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Bokmål Faglig kontakt under eksamen: Bo Lindqvist, tlf. 97589418 EKSAMEN ST00 STATISTIKK FOR SAMFUNNSVITERE Torsdag 6. desember 01 Tid: 09:00 14:00 Sensurdato 6. januar 013 Tillatte hjelpemidler: Alle trykte og håndskrevne. Alle typer kalkulatorer. For de som bruker 10. utgave av læreboka, er kopi av Tabell 3 fra 11. utgave gitt til slutt i eksamenssettet. Alle deloppgaver teller likt. Oppgave 1 Finn det korrekte svaralternativet på hvert spørsmål. Utregningen skal ikke være med. a) Anta at årslønnen til en nyutdannet bachelor i samfunnsøkonomi er normalfordelt med forventning 390 000 kroner og standardavvik 30 000 kroner. Hva er sannsynligheten for at en tilfeldig valgt nyutdannet bachelor har inntekt mellom 45 000 og 450 000 kroner? A) 0.1 B) 0.10 C) 0.86 D) 0.04 E) 0.50
Side av 7 b) Betrakt tre nyutdannede bachelorer i samfunnsøkonomi. Hva er sannsynligheten for at alle de tre har en inntekt over 400 000 kroner? (Fordelingen for inntekten er som i forrige punkt). A) 0.05 B) 0.95 C) 0.37 D) 0.1 E) 0.5 c) Fossen Energi (FE) tilbyr leilighetene i et borettslag TV og internett via fiberkabel. 70% av leilighetene har valgt FE som TV-leverandør, 60 % har valgt FE som internettleverandør, og 50 % har både TV og internett fra FE. Hvor mange prosent av leilighetene har ingen tjenester fra FE? A) 0% B) 0% C) 50% D) 30% E) 10% d) I en amerikansk undersøkelse har man analysert et datasett for 531 personer som har vært utsatt for en sykkelulykke. For hver av personene er det registrert om de brukte sykkelhjelm eller ikke ved ulykken, og om de pådro seg hodeskader eller ikke. Resultatene er gitt i tabellen nedenfor. Hodeskade Ikke hodeskade Totalt Hjelm 30 83 113 Ikke hjelm 18 36 418 Totalt 1 319 531 Anta at det trekkes en person tilfeldig fra de 531, og at det viser seg at denne ikke fikk hodeskader ved ulykken. Hva er da sannsynligheten for at denne personen brukte hjelm? A) 0.73 B) 0.44 C) 0.60 D) 0.14 E) 0.6 e) Ved en kartlegging av kundemassen i Sparebanken Spar klassifiseres kundene etter to kjennetegn: Har/har ikke betalingsproblemer, og Lav/høy inntekt. Her er lav inntekt spesifisert som at inntekten er under en gitt grense, mens høy inntekt betyr at inntekten er over denne grensen. Banken finner at den har 35% kunder med lav inntekt. Blant disse har 40% betalingsproblemer, mens 10% av kundene med høy inntekt har betalingsproblemer. En kunde trekkes tilfeldig, og det viser seg at denne har betalingsproblemer. Hva er da sannsynligheten for at denne kunden har lav inntekt? A) 0.35 B) 0.14 C) 0.86 D) 0.68 E) 0.3
Side 3 av 7 f) For hvert av avisbudene til Dagsposten gjelder at antallet feilleveringer på en tilfeldig dag, x, har samme sannsynlighetsfordeling, gitt ved x 0 1 3 P (x) 0.55 0.5 0.15 0.05 Dagsposten har 100 avisbud. Hva er det forventede antall feilleveringer av Dagsposten på en tilfeldig dag? A) 70 B) 130 C) 100 D) 81 E) 55 Oppgave I et boligområde ønsker man å finne ut om radonstrålingen inne i husene er over tiltaksgrensen på 00 Becquerel pr m 3. Anta at for et hus i dette området er radonstrålingen, x (Becquerel pr. m 3 ), normalfordelt med ukjent forventning µ og ukjent standardavvik σ. Det er foretatt målinger av radonstrålingen i et tilfeldig utvalg på n = 14 hus i området. Dette ga et gjennomsnitt x = 17.8 og et utvalgsstandardavvik s = 3.1. a) Kan man på grunnlag av disse målingene konkludere med at forventet radonstråling i området er høyere enn 00 Becquerel pr m 3? Formuler denne problemstillingen som en hypotesetest og utfør testen med signifikansnivå 0.05. Gjør dette både ved klassisk metode og ved å beregne en omtrentlig p-verdi. Hva blir konklusjonen på testen? b) Finn et 99% konfidensintervall for µ basert på utvalget. Hva blir maksimal feil for estimatet, E, for dette intervallet? Ingeniøren som beregnet konfidensintervallet, gjorde dessverre en regnefeil, slik at den E han beregnet bare ble halvparten så stor som den korrekte verdien. Hva ble dermed det reelle konfidensnivået for intervallet? (Et omtrentlig anslag er tilstrekkelig).
Side 4 av 7 Oppgave 3 La situasjonen være som i forrige oppgave. Kall området som ble betraktet der, område I. La videre µ, σ, n, x, s som ble betraktet i forrige oppgave, nå hete henholdsvis µ 1, σ 1, n 1, x 1, s 1. I et annet boligområde (område II) er det på tilsvarende måte målt radonstråling for et tilfeldig utvalg på n = 10 forskjellige hus. Her fant man gjennomsnittsverdien x = 187.8 og utvalgsstandardavviket s = 35.5. Det antas også for område II at radonmålingene er normalfordelte, nå med forventning og standardavvik henholdsvis µ og σ. Utvalgene fra de to områdene regnes som uavhengige. Man ønsker å finne ut om forventet radonstråling er forskjellig i område I og område II. a) Sett opp nullhypotesen H 0 og den alternative hypotesen H a for dette problemet. Sett opp testobservatoren og gjennomfør testingen med signifikansnivå 0.05. Bruk både klassisk metode og metoden med beregning av p-verdi (et omtrentlig anslag for p-verdien er tilstrekkelig). Hva kan konkluderes om radonstrålingen i de to områdene? b) I hvilken forstand er testen som ble brukt i forrige punkt en konservativ test? Det er kjent at det finnes mindre konservative tester for situasjonen i denne oppgaven dersom det på forhånd er kjent at populasjonsstandardavvikene σ 1 og σ er like store. Det er derfor av interesse å teste hypotesene H 0 : σ1 σ = 1 mot H a : Utfør en test for dette med signifikansnivå 0.05 basert på de gitte observasjonene. Hva blir konklusjonen? c) Basert på konklusjonen i forrige punkt vil vi nå anta at σ 1 = σ og kalle den felles verdien for σ. Forklar kort hvorfor vi da kan teste hypotesene H 0 og H a fra punkt (a) ved å bruke variansanalyse (ANOVA) med c = populasjoner. Det viser seg at gjennomsnittet av alle de 4 målingene fra område I og II ( grand mean ) er x = 05.3. Sett opp formler for beregning av SS(factor) og SS(error) ut fra de opplysningene som er gitt tidligere i oppgaven. Du trenger ikke å regne ut uttrykkene, og i det følgende kan du bruke at SS(factor)=550 og SS(error)=4738. Sett opp en ANOVA-tabell og gjennomfør testingen av H 0 mot H a ved hjelp av denne. Hva blir konklusjonen når signifikansnivået settes til 0.05? Kommentér i lys av resultatet i punkt (a). σ1 σ 1
Side 5 av 7 Oppgave 4 For en type mobiltelefon har det vært reklamasjon på 10 % av de solgte telefonene. Etter at en ny og forbedret versjon har kommet på markedet, vil man undersøke om reklamasjonsprosenten har gått ned. La p være sannsynligheten for reklamasjon for en enhet av den nye versjonen av mobiltelefonen. a) Sett opp nullhypotesen H 0 og den alternative hypotese H a svarende til problemstillingen beskrevet ovenfor. Av et tilfeldig utvalg på 180 solgte mobiltelefoner av den nye versjonen ble det reklamert på 1. Bruk dette til å regne ut testobservatoren for å teste H 0 mot H a, og beregn p-verdien for testen. Hva blir konklusjonen på testen hvis signifikansnivået settes til 0.05? b) Man er også interessert i et konfidensintervall for sannsynligheten p. Finn et 95% konfidensintervall basert på de gitte dataene. Hva blir maksimal feil for estimatet, E, for dette intervallet? Hvor stort utvalg måtte man ha dersom man ønsket et kortere konfidensintervall for p, nemlig med maksimal feil E lik 0.0 i et 95% konfidensintervall? Du skal her bruke at man har forhåndsinformasjon om at reklamasjonsprosenten er rundt 10%. Oppgave 5 a) Bruk tabellen i oppgave 1(d) til å finne ut om det er noen sammenheng mellom bruk av sykkelhjelm og hodeskader ved sykkelulykker. Sett opp en passende nullhypotese og alternativ hypotese. Gjennomfør en test med signifikansnivå 0.01. Formuler konklusjonen med ord.
Side 6 av 7
Side 7 av 7