ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag

2 Tilfeldige variable (5.2) Dersom vi til hvert utfall av eksperimentet tilordner et tall, har vi laget en tilfeldig variabel. Tilfeldig variabel: En variabel som har en numerisk verdi for hvert utfall i utfallsrommet. (Dvs. vi beskriver observasjonene med tall) Eksempler: 1. Kast terning og registrer antall øyne. 2. Trekk student og registrer antall vekttall i et semester 3. Trekk en velger og registrer 1 hvis han/hun vil stemme på partiet BP og 0 hvis ikke. 4. Registrer antall epost som kommer til en epostadresse på en bestemt dag. Merk: Tilfeldige variable er knyttet til et eksperiment der vi ikke kan forutse utfallet.

Vi skiller mellom: diskrete tilfeldige variabel med tellbart antall mulige verdier f.eks.: Antall biler som passere et lyskryss i løpet av en periode Antall mål i en fotballkamp kontinuerlige tilfeldige variable med ikke-tellbart antall mulige verdier f.eks.: Høyden på en person Tiden en person er innlagt på sykehus

4 Sannsynlighetsfordelingen til en diskret tilfeldig variabel (5.3) Sannsynlighetsfordeling: De mulige verdiene den tilfeldige variabelen kan ta, sammen med de tilhørende sannsynlighetene for disse verdiene. Sannsynlighetene gis ofte ved hjelp av en Sannsynlighetsfunksjon: En regel som gir en sannsynlighet P(x) til hver mulig verdi x for den tilfeldige variablen. Eksempel: Terningkast x=antall øyne P(x)=sannsynligheten for at antall øyne er lik x (dvs. 1/6)

P(x) er altså en kort skrivemåte for sannsynligheten for den hendelsen at vi får et utfall som gir verdien x på den tilfeldige variabelen. x P(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 Alternativ skrivemåte: P(x)=1/6 for x=1,2,3,4,5,6

Eksempel: Modifisert terning med en side med 1-tall, 2 sider med 2-tall og 3 sider med 3-tall. x=antall øyne. x P(x) 1 1/6 2 2/6 3 3/6 eller P(x) = x 6 for x = 1, 2, 3 Sannsynlighetsfunksjonen P(x) tilfredstiller de vanlige kravene til sannsynligheter: 1. 0 P(x) 1 2. P(x) =1 Oppgave: Er P(x) = x 10 for x = 1, 2, 3, 4en sannsynlighetsfordeling?

Eksempel: Meningsmåling I en populasjon er det 43% EU-tilhengere og 57% EU-motstandere. Spør en tilfeldig valgt person om EU, og sett x=1 hvis personen er for og sett x=0 ellers. Da er sannsynlighetsfordelingen til x gitt ved x P(x) 0 0.57 1 0.43 Merk: En sannsynlighetsfordeling viser teoretiske sannsynligheter. Den skal representere populasjonen.

Eksempel: Ved meningsmålinger er andelen av EU-tilhengere i populasjonen ukjent, og vi setter den til p og skriver x P(x) 0 1 p 1 p Daerpen parameter siden den beskriver populasjonen. Vi ønsker nå å bruke meningsmålingen (dvs. utvalget) til å anslå verdien på p. (Vi kommer tilbake til dette i kap. 9)

9 Eksempel: Maskinutleie Maskinutleiefirma disponerer 4 mobile heisekraner Tilfeldig variabel er x = antall utleide kraner en tilfeldig dag. Sannsynlighetsfordeling: x 0 1 2 3 4 P(x) 0.10 0.20 0.4 0.25 0.05 Sannsynlighetene kan f.eks. være basert på lang erfaring.

10 Grafisk representasjon av sannsynlighetsfordeling

11 Forventning og varians til en diskret tilfeldig variabel (5.4) Forventningen til en diskret tilfelding variabel x er eller mu = sum av hver x multiplisert med sannsynligheten P(x) μ =Σ[xP(x)] Dette er parameteren (for populasjonen) som svarer til gjennomsnittet i et utvalg: x = Σx n

Eksempel: Terningkast. P(x) = 1 6 for x = 1, 2, 3, 4, 5, 6 μ = [xp(x)] = 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 = 3.5 Oppgave: Finn forventningen μ når P(x) = x 10 for x = 1, 2, 3, 4

Eksempel: Maskinutleie x 0 1 2 3 4 P(x) 0.10 0.20 0.4 0.25 0.05 Forventet antall utleide heisekraner: μ = [xp(x)] = 0 0.10+1 0.20+2 0.40+3 0.25+4 0.05 = 1.95

14 Varians til en diskret tilfeldig variabel Variansen til en diskret tilfeldig variabel er gitt ved: sigma i annen, som beregnes ved å multiplisere de kvadratiske avvikene fra gjennomsnittet, (x μ) 2, med de tilsvarende sannsynligheter P(x) og så summere dette, dvs. σ 2 = [(x μ) 2 P(x)] Formel: Husk utvalgsvarians σ 2 = [x 2 P(x)] μ 2 s 2 = (x x) 2 n 1 = x 2 ( x) 2 /n n 1

15 Standardavvik til en tilfeldig variabel Dette er definert som kvadratroten til variansen, dvs. standardavvik: σ = σ 2

Eksempel: Terningkast, μ = 21 6 [x 2 P(x)] = 1 2 1 6 + 22 1 6 + 32 1 6 +4 2 1 6 + 52 1 6 + 62 1 6 = 91 6 σ 2 = Σx 2 P(x) μ 2 = 91 ( ) 21 2 6 6 = 2.917 σ = σ 2 = 1.71

Oppgave: Gitt P(x) = x 10 for x = 1, 2, 3, 4, finn forventning og varians. μ = [xp(x)] = 3.0 σ 2 = [x 2 P(x)] μ 2 = 10.0 (3.0) 2 = 1.0

18 Den binomiske sannsynlighetsfordeling (5.5) Binomisk eksperiment: Et eksperiment som består i gjentatte forsøk med følgende egenskaper: 1. Det er n identiske uavhengige forsøk. 2. Hvert forsøk har to mulige utfall, ofte kalt suksess og fiasko. 3. P(suksess)=p, P(fiasko)=q, p+q=1 4. Den binomiske tilfeldige variabelen x er antallet suksessfulle utfall som inntreffer, og x kan anta enhver heltallsverdi fra 0 til n. Oppgave: Betrakt eksperimentet å trille en terning 12 ganger. La suksess være at terningen viser 1. Fiasko er dermed at terningen ikke viser 1. La x være antallet suksesser. Er dette et binomisk eksperiment?

19 Eksempel: Quiz En student får fire spørsmål med tre svaraltenativer for hvert spørsmål. Studenten kan ingen ting så han gjetter. Svararket ser slik ut: Sett en ring rundt det beste svaret på hvert sp rsmål. 1. a b c 2. a b c 3. a b c 4. a b c

La den tilfeldige variable x være antall korrekte svar på de fire spørsmålene. For hvert spørsmål lar vi betegne rett svar ( correct ) og W betegne galt svar ( wrong ). Vi kan sette opp følgende sannsynlighetstre for de fire spørsmålene i rekkefølge 1,2,3,4. w W W W W W W W W W W W W W W Utfall W W WW W WW WW WWW W WW WW WWW WW WWW WWW WWWW x 4 3 3 2 3 2 2 1 3 2 2 1 2 1 1 0 P (1/3) 4 (2/3) 0 (1/3) 3 (2/3) 1 (1/3) 1 (2/3) 1 (1/3) 2 (2/3) 2 (1/3) 3 (2/3) 1 (1/3) 2 (2/3) 2 (1/3) 2 (2/3) 2 (1/3) 1 (2/3) 3 (1/3) 3 (2/3) 1 (1/3) 2 (2/3) 2 (1/3) 2 (2/3) 2 (1/3) 1 (2/3) 3 (1/3) 2 (2/3) 2 (1/3) 1 (2/3) 3 (1/3) 1 (2/3) 3 (1/3) 0 (2/3) 4

For hvert spørsmål er P() =1/3, P(W )=2/3 Kolonnen til høyre angir sannsynligheten for hver gren i treet. Vi ser at sannsynlighetsfunksjonen P(x) blir: P(0) = P(0 rette) = 2 3 2 3 2 3 2 3 = ( ) 2 4 = 16 3 ( 1 P(1) = P(1 rett) =(4) 1 3 2 3 2 3 2 3 =(4) P(2) = P(2 rette) =(6) 1 3 1 3 2 3 2 3 =(6) P(3) = P(3 rette) =(4) 1 3 1 3 1 3 2 3 =(4) P(4) = P(4 rette) = 1 3 1 3 1 3 1 3 = ( 1 3 81 = 0.198 ) 1 ( ) 2 3 = 0.395 3 3 ( ) 1 2 ( ) 2 2 = 0.296 3 3 ( ) 1 3 ( ) 2 1 = 0.099 3 3 ) 4 = 1 81 = 0.012

22 Binomisk sannsynlighetsfunksjon La det være n forsøk, sannsynlighet p for suksess og sannsynlighet q for fiasko. Da er P(x) =c(p x )(q n x ) for x = 0, 1, 2,...,n der c er antallet grener med x suksesser. c kalles binomisk koeffisient og kan regnes ut ved ( ) n n! c = = x x!(n x)! der n! leses n-fakultet og er gitt ved n! =1 2 n. Tips: p 0 er alltid lik 1; også 0! =1.

Situasjonen er som i quiz-eksempelet: Oppgave: Finn P(x), x=0,1,2,3,4 fra den generelle formelen for binomisk sannsynlighetsfordeling Oppgave: Finn P(x 3)

24 Forventning og standardavvik for binomisk fordeling (5.6) Forventning for binomisk fordeling med n forsøk, suksesssannsynlighet p og fiaskosannsynlighet q: μ = np Standardavvik for binomisk fordeling: σ = npq Oppgave: Finn forventning og varians for en binomisk tilfeldig variabel med n=30 og p=0.6.

26 Eksempel 5.9: Dårlige egg Bestyreren på Steve s Food Market garanterer at alle hans kartonger med 12 egg inneholder høyst ett dårlig egg. Hvis en kartong inneholder mer enn ett dårlig egg, vil han erstatte hele dusinet og la kunden beholde de gode eggene! Hvis sannsynligheten for et dårlig egg er 0.05, hva er sannsynligheten for at bestyreren må erstatte en gitt kartong?

27 Løsning på dårlige egg La x være antall dårlige egg i en tilfeldig eske. Hvilke forutsetninger må vi gjøre for at vi skal kunne anta at x har en binomisk fordeling med n = 12 forsøk og sannsynlighet for suksess lik 0.05? Sannsynligheten for at en kartong inneholder x dårlige egg er da ( ) 12 P(x) = (0.05) x (0.95) 12 x for x = 0, 1, 2,...,12 x

Bestyreren vil erstatte en eske hvis x er enten 2,3,4,5,6,7,8,9,10,11,12. For å finne sannsynligheten for dette er det lettere å først finne sannsynligheten for å ikke erstatter kartongen, dvs. for at x = 0 eller 1. Dette har sannsynlighet P(0)+P(1) = ( ) 12 (0.05) 0 (0.95) 12 + 0 ( ) 12 (0.05) 1 (0.95) 11 1 = (0.95) 12 + 12 (0.05) 1 (0.95) 11 = 0.540 + 0.341 = 0.881 Sannsynligheten for å erstatte en kartong er da 1 0.881 = 0.119.