ST0202 Statistikk for samfunnsvitere

Like dokumenter
Tilfeldige variable (5.2)

ST0202 Statistikk for samfunnsvitere

Binomisk sannsynlighetsfunksjon

ST0202 Statistikk for samfunnsvitere

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

ST0202 Statistikk for samfunnsvitere

Fra første forelesning:

ST0202 Statistikk for samfunnsvitere

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Kapittel 4.4: Forventning og varians til stokastiske variable

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Forelening 1, kapittel 4 Stokastiske variable

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Foreleses onsdag 8. september 2010

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ECON240 Vår 2018 Oppgaveseminar 1 (uke 6)

Bernoulli forsøksrekke og binomisk fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Statistikk 1 kapittel 5

TMA4245 Statistikk Eksamen august 2014

ST0103 Brukerkurs i statistikk Høst 2014

Kapittel 4.3: Tilfeldige/stokastiske variable

Statistikk 1 kapittel 5

TMA4240 Statistikk Høst 2008

Statistikk 1 kapittel 5

ECON240 Høst 2017 Oppgaveseminar 1 (uke 35)

ST0202 Statistikk for samfunnsvitere

µ = E(X) = Ʃ P(X = x) x

UNIVERSITETET I OSLO

Sannsynligheten for en hendelse (4.2) Empirisk sannsynlighet. ST0202 Statistikk for samfunnsvitere

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Regneregler for forventning og varians

Kapittel 5: Tilfeldige variable, forventning og varians.

Test, 3 Sannsynlighet og statistikk

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Statistikk 1 kapittel 5

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Oppfriskning av blokk 1 i TMA4240

Betinget sannsynlighet

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

TMA4240 Statistikk H2015

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO Matematisk Institutt

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Eksamen desember 2016

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

ST0202 Statistikk for samfunnsvitere

Testobservator for kjikvadrattester

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Utvalgsfordelinger (Kapittel 5)

Fasit for tilleggsoppgaver

Eksamensoppgave i TMA4245 Statistikk

Sannsynlighet og statistikk

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Medisinsk statistikk Del I høsten 2009:

statistikk, våren 2011

Denne uken: Kapittel 4.3 og 4.4

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i ST0103 Brukerkurs i statistikk

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

STK Oppsummering

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252

Testobservator for kjikvadrattester

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Utvalgsfordelinger (Kapittel 5)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Transkript:

ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag

2 Tilfeldige variable (5.2) Dersom vi til hvert utfall av eksperimentet tilordner et tall, har vi laget en tilfeldig variabel. Tilfeldig variabel: En variabel som har en numerisk verdi for hvert utfall i utfallsrommet. (Dvs. vi beskriver observasjonene med tall) Eksempler: 1. Kast terning og registrer antall øyne. 2. Trekk student og registrer antall vekttall i et semester 3. Trekk en velger og registrer 1 hvis han/hun vil stemme på partiet BP og 0 hvis ikke. 4. Registrer antall epost som kommer til en epostadresse på en bestemt dag. Merk: Tilfeldige variable er knyttet til et eksperiment der vi ikke kan forutse utfallet.

Vi skiller mellom: diskrete tilfeldige variabel med tellbart antall mulige verdier f.eks.: Antall biler som passere et lyskryss i løpet av en periode Antall mål i en fotballkamp kontinuerlige tilfeldige variable med ikke-tellbart antall mulige verdier f.eks.: Høyden på en person Tiden en person er innlagt på sykehus

4 Sannsynlighetsfordelingen til en diskret tilfeldig variabel (5.3) Sannsynlighetsfordeling: De mulige verdiene den tilfeldige variabelen kan ta, sammen med de tilhørende sannsynlighetene for disse verdiene. Sannsynlighetene gis ofte ved hjelp av en Sannsynlighetsfunksjon: En regel som gir en sannsynlighet P(x) til hver mulig verdi x for den tilfeldige variablen. Eksempel: Terningkast x=antall øyne P(x)=sannsynligheten for at antall øyne er lik x (dvs. 1/6)

P(x) er altså en kort skrivemåte for sannsynligheten for den hendelsen at vi får et utfall som gir verdien x på den tilfeldige variabelen. x P(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 Alternativ skrivemåte: P(x)=1/6 for x=1,2,3,4,5,6

Eksempel: Modifisert terning med en side med 1-tall, 2 sider med 2-tall og 3 sider med 3-tall. x=antall øyne. x P(x) 1 1/6 2 2/6 3 3/6 eller P(x) = x 6 for x = 1, 2, 3 Sannsynlighetsfunksjonen P(x) tilfredstiller de vanlige kravene til sannsynligheter: 1. 0 P(x) 1 2. P(x) =1 Oppgave: Er P(x) = x 10 for x = 1, 2, 3, 4en sannsynlighetsfordeling?

Eksempel: Meningsmåling I en populasjon er det 43% EU-tilhengere og 57% EU-motstandere. Spør en tilfeldig valgt person om EU, og sett x=1 hvis personen er for og sett x=0 ellers. Da er sannsynlighetsfordelingen til x gitt ved x P(x) 0 0.57 1 0.43 Merk: En sannsynlighetsfordeling viser teoretiske sannsynligheter. Den skal representere populasjonen.

Eksempel: Ved meningsmålinger er andelen av EU-tilhengere i populasjonen ukjent, og vi setter den til p og skriver x P(x) 0 1 p 1 p Daerpen parameter siden den beskriver populasjonen. Vi ønsker nå å bruke meningsmålingen (dvs. utvalget) til å anslå verdien på p. (Vi kommer tilbake til dette i kap. 9)

9 Eksempel: Maskinutleie Maskinutleiefirma disponerer 4 mobile heisekraner Tilfeldig variabel er x = antall utleide kraner en tilfeldig dag. Sannsynlighetsfordeling: x 0 1 2 3 4 P(x) 0.10 0.20 0.4 0.25 0.05 Sannsynlighetene kan f.eks. være basert på lang erfaring.

10 Grafisk representasjon av sannsynlighetsfordeling

11 Forventning og varians til en diskret tilfeldig variabel (5.4) Forventningen til en diskret tilfelding variabel x er eller mu = sum av hver x multiplisert med sannsynligheten P(x) μ =Σ[xP(x)] Dette er parameteren (for populasjonen) som svarer til gjennomsnittet i et utvalg: x = Σx n

Eksempel: Terningkast. P(x) = 1 6 for x = 1, 2, 3, 4, 5, 6 μ = [xp(x)] = 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 = 3.5 Oppgave: Finn forventningen μ når P(x) = x 10 for x = 1, 2, 3, 4

Eksempel: Maskinutleie x 0 1 2 3 4 P(x) 0.10 0.20 0.4 0.25 0.05 Forventet antall utleide heisekraner: μ = [xp(x)] = 0 0.10+1 0.20+2 0.40+3 0.25+4 0.05 = 1.95

14 Varians til en diskret tilfeldig variabel Variansen til en diskret tilfeldig variabel er gitt ved: sigma i annen, som beregnes ved å multiplisere de kvadratiske avvikene fra gjennomsnittet, (x μ) 2, med de tilsvarende sannsynligheter P(x) og så summere dette, dvs. σ 2 = [(x μ) 2 P(x)] Formel: Husk utvalgsvarians σ 2 = [x 2 P(x)] μ 2 s 2 = (x x) 2 n 1 = x 2 ( x) 2 /n n 1

15 Standardavvik til en tilfeldig variabel Dette er definert som kvadratroten til variansen, dvs. standardavvik: σ = σ 2

Eksempel: Terningkast, μ = 21 6 [x 2 P(x)] = 1 2 1 6 + 22 1 6 + 32 1 6 +4 2 1 6 + 52 1 6 + 62 1 6 = 91 6 σ 2 = Σx 2 P(x) μ 2 = 91 ( ) 21 2 6 6 = 2.917 σ = σ 2 = 1.71

Oppgave: Gitt P(x) = x 10 for x = 1, 2, 3, 4, finn forventning og varians. μ = [xp(x)] = 3.0 σ 2 = [x 2 P(x)] μ 2 = 10.0 (3.0) 2 = 1.0

18 Den binomiske sannsynlighetsfordeling (5.5) Binomisk eksperiment: Et eksperiment som består i gjentatte forsøk med følgende egenskaper: 1. Det er n identiske uavhengige forsøk. 2. Hvert forsøk har to mulige utfall, ofte kalt suksess og fiasko. 3. P(suksess)=p, P(fiasko)=q, p+q=1 4. Den binomiske tilfeldige variabelen x er antallet suksessfulle utfall som inntreffer, og x kan anta enhver heltallsverdi fra 0 til n. Oppgave: Betrakt eksperimentet å trille en terning 12 ganger. La suksess være at terningen viser 1. Fiasko er dermed at terningen ikke viser 1. La x være antallet suksesser. Er dette et binomisk eksperiment?

19 Eksempel: Quiz En student får fire spørsmål med tre svaraltenativer for hvert spørsmål. Studenten kan ingen ting så han gjetter. Svararket ser slik ut: Sett en ring rundt det beste svaret på hvert sp rsmål. 1. a b c 2. a b c 3. a b c 4. a b c

La den tilfeldige variable x være antall korrekte svar på de fire spørsmålene. For hvert spørsmål lar vi betegne rett svar ( correct ) og W betegne galt svar ( wrong ). Vi kan sette opp følgende sannsynlighetstre for de fire spørsmålene i rekkefølge 1,2,3,4. w W W W W W W W W W W W W W W Utfall W W WW W WW WW WWW W WW WW WWW WW WWW WWW WWWW x 4 3 3 2 3 2 2 1 3 2 2 1 2 1 1 0 P (1/3) 4 (2/3) 0 (1/3) 3 (2/3) 1 (1/3) 1 (2/3) 1 (1/3) 2 (2/3) 2 (1/3) 3 (2/3) 1 (1/3) 2 (2/3) 2 (1/3) 2 (2/3) 2 (1/3) 1 (2/3) 3 (1/3) 3 (2/3) 1 (1/3) 2 (2/3) 2 (1/3) 2 (2/3) 2 (1/3) 1 (2/3) 3 (1/3) 2 (2/3) 2 (1/3) 1 (2/3) 3 (1/3) 1 (2/3) 3 (1/3) 0 (2/3) 4

For hvert spørsmål er P() =1/3, P(W )=2/3 Kolonnen til høyre angir sannsynligheten for hver gren i treet. Vi ser at sannsynlighetsfunksjonen P(x) blir: P(0) = P(0 rette) = 2 3 2 3 2 3 2 3 = ( ) 2 4 = 16 3 ( 1 P(1) = P(1 rett) =(4) 1 3 2 3 2 3 2 3 =(4) P(2) = P(2 rette) =(6) 1 3 1 3 2 3 2 3 =(6) P(3) = P(3 rette) =(4) 1 3 1 3 1 3 2 3 =(4) P(4) = P(4 rette) = 1 3 1 3 1 3 1 3 = ( 1 3 81 = 0.198 ) 1 ( ) 2 3 = 0.395 3 3 ( ) 1 2 ( ) 2 2 = 0.296 3 3 ( ) 1 3 ( ) 2 1 = 0.099 3 3 ) 4 = 1 81 = 0.012

22 Binomisk sannsynlighetsfunksjon La det være n forsøk, sannsynlighet p for suksess og sannsynlighet q for fiasko. Da er P(x) =c(p x )(q n x ) for x = 0, 1, 2,...,n der c er antallet grener med x suksesser. c kalles binomisk koeffisient og kan regnes ut ved ( ) n n! c = = x x!(n x)! der n! leses n-fakultet og er gitt ved n! =1 2 n. Tips: p 0 er alltid lik 1; også 0! =1.

Situasjonen er som i quiz-eksempelet: Oppgave: Finn P(x), x=0,1,2,3,4 fra den generelle formelen for binomisk sannsynlighetsfordeling Oppgave: Finn P(x 3)

24 Forventning og standardavvik for binomisk fordeling (5.6) Forventning for binomisk fordeling med n forsøk, suksesssannsynlighet p og fiaskosannsynlighet q: μ = np Standardavvik for binomisk fordeling: σ = npq Oppgave: Finn forventning og varians for en binomisk tilfeldig variabel med n=30 og p=0.6.

26 Eksempel 5.9: Dårlige egg Bestyreren på Steve s Food Market garanterer at alle hans kartonger med 12 egg inneholder høyst ett dårlig egg. Hvis en kartong inneholder mer enn ett dårlig egg, vil han erstatte hele dusinet og la kunden beholde de gode eggene! Hvis sannsynligheten for et dårlig egg er 0.05, hva er sannsynligheten for at bestyreren må erstatte en gitt kartong?

27 Løsning på dårlige egg La x være antall dårlige egg i en tilfeldig eske. Hvilke forutsetninger må vi gjøre for at vi skal kunne anta at x har en binomisk fordeling med n = 12 forsøk og sannsynlighet for suksess lik 0.05? Sannsynligheten for at en kartong inneholder x dårlige egg er da ( ) 12 P(x) = (0.05) x (0.95) 12 x for x = 0, 1, 2,...,12 x

Bestyreren vil erstatte en eske hvis x er enten 2,3,4,5,6,7,8,9,10,11,12. For å finne sannsynligheten for dette er det lettere å først finne sannsynligheten for å ikke erstatter kartongen, dvs. for at x = 0 eller 1. Dette har sannsynlighet P(0)+P(1) = ( ) 12 (0.05) 0 (0.95) 12 + 0 ( ) 12 (0.05) 1 (0.95) 11 1 = (0.95) 12 + 12 (0.05) 1 (0.95) 11 = 0.540 + 0.341 = 0.881 Sannsynligheten for å erstatte en kartong er da 1 0.881 = 0.119.