Test, 3 Sannsynlighet og statistikk Innhold 3. Stokastiske variabler og sannsynlighetsfordelinger... 3. Forventningsverdi, varians og standardavvik... 5 3.3 Normalfordelingen... 4 3.4 Sentralgrensesetningen... 3 3.5 Hypotesetesting... Oppgaver Grete Larsen/NDLA 3. Stokastiske variabler og sannsynlighetsfordelinger ) En hendelse er stokastisk hvis vi kjenner sannsynligheten for at hendelsen skal inntreffe, uten at vi kan si sikkert når den inntreffer. ) Når vi kaster mynt og kron, er utfallsrommet U, 3) Dersom vi gjentar et forsøk mange nok ganger, vil den relative frekvensen for et utfall nærme seg en bestemt verdi. Denne verdien kaller vi sannsynligheten for utfallet.
4) Dersom du kaster to tikroner gjentatte ganger og undersøker hvilke myntsider som vises, vil du komme fram til denne sannsynlighetsmodellen: x 0 P X x 0,5 0,50 0,5 Her står X for antall kron. Dette er en stokastisk sannsynlighetsmodell 5) Sannsynlighetsfordelingen til en stokastisk variabel X er en liste med alle verdiene X kan ha og sannsynlighetene for hver av disse verdiene. Summen av sannsynlighetene kan variere. ) Vi kaster en terning 00 ganger. Når vi skal uttrykke den kumulative sannsynligheten for 5 øyne på terningen, kan vi skrive P X 4 P X 5 P X 5 7) Vi kaster en terning 00 ganger. Når vi skal uttrykke sannsynligheten for å få mer enn 4 øyne på terningen, kan vi skrive P X 4 P X 5 P X 5 8) Vi kaster en terning 00 ganger. Den kumulative sannsynligheten for 5 øyne på terningen er P X 5 3 5 P X 5 P X
9) Sannsynlighetsfordelingen til en stokastisk variabel X er gitt ved Tallet som skal stå i stedet for A er 0,05 0,95 x 3 4 P X x 0,35 0,30 A 0,30 3
0) Sannsynlighetsfordelingen til en stokastisk variabel X er gitt ved Hva er P X? 0,30 0,35 0,5 x 3 4 P X x 0,35 0,30 A 0,30 ) Geografilæreren til lille Marius har laget en prøve hvor han har brukt flervalgsoppgaver. Prøven består av 0 oppgaver og for hver oppgave er det 4 svaralternativer. Lille Marius er ikke forberedt og alle svaralternativene virker like sannsynlige. Hva er sannsynligheten for at lille Marius svarer riktig på første spørsmål? 4 0 4 0 ) Geografilæreren til lille Marius har laget en prøve hvor han har brukt flervalgsoppgaver. Prøven består av 0 oppgaver og for hver oppgave er det 4 svaralternativer. Lille Marius er ikke forberedt og alle svaralternativene virker like sannsynlige. Hva er sannsynligheten for at lille Marius svarer riktig på alle spørsmålene? P X 0 P X 0 P X 0 4 0 4 0 3 4 0 0 4
3) Geografilæreren til lille Marius har laget en prøve hvor han har brukt flervalgsoppgaver. Prøven består av 0 oppgaver og for hver oppgave er det 4 svaralternativer. Lille Marius er ikke forberedt og alle svaralternativene virker like sannsynlige. Hva er sannsynligheten for at lille Marius ikke svarer rett på noen spørsmål? P X P X P X 0 0 0 4 0 4 0 3 4 0 0 4) Geografilæreren til lille Marius har laget en prøve hvor han har brukt flervalgsoppgaver. Prøven består av 0 oppgaver og for hver oppgave er det 4 svaralternativer. Lille Marius er ikke forberedt og alle svaralternativene virker like sannsynlige. Hva er sannsynligheten for at lille Marius svarer rett på akkurat halvparten av spørsmålene? P X P X P X 5 5 5 5 5 3 4 4 5 5 3 4 4 5 5 3 0 4 4 5 5) En bedrift produserer elektriske komponenter. Sannsynligheten for at en komponent som blir produsert er defekt er 5 %. Vi tester 00 komponenter. Sannsynligheten for at ingen av komponentene er defekte er 00 0,05 00 5 00 0,95 3. Forventningsverdi, varians og standardavvik ) Hvis vi multipliserer hvert utfall med sannsynligheten for å få akkurat dette utfallet og til slutt summerer de svarene vi får, finner vi forventningsverdien, til forsøket. 5
) Sannsynlighetsfordelingen til en stokastisk variabel X er gitt ved Forventningsverdien er,5,5 x 3 4 P X x 0,5 0,50 0 0,5 3) Sannsynlighetsfordelingen til en stokastisk variabel X er gitt ved Her blir variansen, Var X til X 0, 0 x 3 4 5 P X x 0,0 0,0 0,0 0,0 0,0 4) Sannsynlighetsfordelingen til en stokastisk variabel X er gitt ved Her blir standardavviket, til X 0, 0 x 3 4 5 P X x 0,0 0,0 0,0 0,0 0,0 5) Kvadratroten av variansen til en stokastisk variabel kaller vi standardavvik. ) Standardavviket, til en stokastisk variabel X er alltid positivt, men variansen, Var X kan være negativ
7) x 3 4 5 Sum P X x,0 x P X x 3 4 5 3,5 P Y y 0 0 4 0 Sum y y P Y y,0 Per har laget et pengespill med følgende regler: Hver spiller satser fem kroner. Spillerne kaster én terning. Hvis terningen viser et oddetall, er det ingen gevinst. Hvis terningen viser et partall, er gevinsten én krone per øye. En toer gir altså en gevinst på to kroner, en firer en gevinst på fire kroner og en sekser en gevinst på seks kroner. Se tabellen. Hva blir forventningsverdien, for gevinsten? To kroner Fem kroner Seks kroner 7
8) P X x 3 4 5 Sum x x P X x 3 4 5,0 3,5 y 4 8 0 Sum P Y y,0 Per har laget et pengespill med følgende regler: Hver spiller satser ti kroner. Spillerne kaster én terning. Gevinsten er to kroner per øye. En ener gir altså en gevinst på to kroner og så videre. Se tabellen. Hva blir forventningsverdien, for gevinsten? Fem kroner Sju kroner Ti kroner 8
9) P X x 3 4 5 Sum x x P X x 3 4 5,0 3,5 x P X x,04 0,375 0,04 0,04 0,375,04 Var X,98 y 4 8 0 Sum P Y y,0 Per har laget et pengespill med følgende regler: Hver spiller satser ti kroner. Spillerne kaster én terning. Gevinsten er to kroner per øye. En ener gir altså en gevinst på to kroner og så videre. Se tabellen. Hva blir variansen,,98 5,83,7 Var Y for gevinsten? 9
0) P X x 3 4 5 Sum SD X x x P X x 3 4 5,0 3,5 x P X x,04 0,375 0,04 0,04 0,375,04 P Y Var X,98,708 y 4 8 0 Sum SD X y Per har laget et pengespill med følgende regler: Hver spiller satser ti kroner. Spillerne kaster én terning. Gevinsten er to kroner per øye. En ener gir altså en gevinst på to kroner og så videre. Se tabellen. Hva blir standardavviket, for gevinsten?,708 3,4,833,0 0
) x 3 4 5 Sum P X x,0 x P X x 3 4 5 3,5 y 4 9 5 3 Sum P Y y,0 Per har laget et pengespill med følgende regler: Hver spiller satser tjue kroner. Spillerne kaster én terning. Gevinsten er kvadratet av antall øyne. En toer gir altså en gevinst på fire kroner og så videre. Se tabellen. Hva blir forventningsverdien, for gevinsten? 3,5 9 9
) x 3 4 5 Sum P X x,0 x P X x 3 4 5 3,5 y 4 8 0 Sum P Y y,0 z 3 4 5 7 8 Sum P Z z,0 Per har laget et pengespill med følgende regler: Hver spiller satser ti kroner. Spillerne kaster én terning to ganger. På første kast er gevinsten to kroner per øye. En ener gir altså en gevinst på to kroner og så videre. På andre kast er gevinsten antall øyne pluss to kroner. En ener gir da en gevinst på tre kroner og så videre Se tabellen. Hva blir forventningsverdien, for gevinsten? 9 kroner,5 kroner,50 kroner
3) P X x 3 4 5 Sum x x P X x 3 4 5,0 3,5 x P X x,04 0,375 0,04 0,04 0,375,04 P Y P Z Var X,98 y 4 8 0 Sum y z 3 4 5 7 8 Sum z Per har laget et pengespill med følgende regler: Hver spiller satser ti kroner. Spillerne kaster én terning to ganger. På første kast er gevinsten to kroner per øye. En ener gir altså en gevinst på to kroner og så videre. På andre kast er gevinsten antall øyne pluss to kroner. En ener gir da en gevinst på tre kroner og så videre Se tabellen. Hva blir variansen, Var X for gevinsten?,98,98,98,0,0 4) Du skal fylle ut en tippekupong med fotballkamper. For hver kamp har du tre alternativ: hjemme, uavgjort og borte. Du kjenner ingen av lagene som spiller. Vi kan derfor anta at sannsynligheten for å tippe riktig er i hver kamp. (Ser bort fra at H strengt tatt har litt større 3 sannsynlighet). Hva er forventningsverdien for antall riktige? 4 8 3
5) Du skal fylle ut en tippekupong med fotballkamper. For hver kamp har du tre alternativ: hjemme, uavgjort og borte. Du kjenner ingen av lagene som spiller. Vi kan derfor anta at sannsynligheten for å tippe riktig er i hver kamp. (Ser bort fra at H strengt tatt har litt større 3 sannsynlighet). Hva er variansen for antall riktige? 4 3 8 3 4 3.3 Normalfordelingen ) Tabellen er et utdrag fra en tabell som viser ulike sannsynligheter, PZ z normalfordeling Tabellen viser at P Z0,45 0,734 i en standardisert 4
) Tabellen er et utdrag fra en tabell som viser ulike sannsynligheter, PZ z normalfordeling Tabellen viser at P Z0,45 0,70540 i en standardisert 3) Tabellen er et utdrag fra en tabell som viser ulike sannsynligheter PZ z normalfordeling P Z 0,45 0,734 Ut fra tabellen kan vi vise at i en standardisert 5
4) Tabellen er et utdrag fra en tabell som viser ulike sannsynligheter PZ z normalfordeling Ut fra tabellen kan vi vise at P Z 0,45 0,33 i en standardisert 5) Tabellen er et utdrag fra en tabell som viser ulike sannsynligheter PZ z normalfordeling Tabellen viser at P Z 0 0,45 0,734 i en standardisert
) Tabellen er et utdrag fra en tabell som viser ulike sannsynligheter PZ z normalfordeling Ut fra tabellen kan vi vise at P Z0,45 0,734 i en standardisert 7) I en standardisert normalfordeling er forventningsverdien lik og standardavviket lik 8) I en normalfordeling er P X 0,5 9) I en standardisert normalfordeling er P X 0 0,5 0) I en normalfordeling er P X 0,954 7
) Hvis vi regner med en gjennomsnittshøyde for kvinner på 70 cm og bruker samme standardavvik som for menn,,8, får vi en normalfordeling som vist i figuren. Hvor stor del av kvinnene er over 80 cm? 0,993 % 7,07 % 9,93 % 8
) Hvis vi regner med en gjennomsnittshøyde for kvinner på 70 cm og bruker samme standardavvik som for menn,,8, får vi en normalfordeling som vist i figuren. Hvor stor del av kvinnene er under 70 cm? 0,50 % 0 % 50 % 9
3) Hvis vi regner med en gjennomsnittshøyde for kvinner på 70 cm og bruker samme standardavvik som for menn,,8, får vi en normalfordeling som vist i figuren. Hvor stor del av kvinnene er under 75 cm? 3, % 73, % 7,89 % 0
4) Hvis vi regner med en gjennomsnittshøyde for kvinner på 70 cm og bruker samme standardavvik som for menn,,8, får vi en normalfordeling som vist i figuren. Hvor stor del av kvinnene er over 75 cm? 3, % 73, % 7,89 %
5) Figuren viser grafen til den standardiserte normalfordelingen for høyden til kvinner med gjennomsnittshøyde på 70 cm og med standardavvik,8, Hvor stor del av kvinnene er over 83, cm?,8 % 97,7 % Det kan vi ikke si noe om ut fra opplysningene
3.4 Sentralgrensesetningen ) Du skal fylle ut en tippekupong med fotballkamper. For hver kamp har du tre alternativ: hjemme, uavgjort og borte. Du kjenner ingen av lagene som spiller. Vi kan derfor anta at sannsynligheten for å tippe riktig er i hver kamp. (Ser bort fra at H strengt tatt har litt større 3 sannsynlighet). Vi lar den stokastiske variabelen X være antall riktige du får. Vi kan regne med at sannsynlighetsfordelingen for å tippe riktig er normalfordelt ) Du skal kaste en terning n ganger. Vi lar den stokastiske variabelen X være antall seksere du får. Hvor mange ganger må du kaste for at vi skal kunne regne med at forsøket er normalfordelt? Mer enn 0. Mer enn 0. Mer enn 30. 3) Du skal kaste en terning 5ganger. Vi lar den stokastiske variabelen X være antall seksere du får. I dette forsøket er standardavviket 5 5 5 3 4) Du skal kaste en terning n ganger. Vi lar den stokastiske variabelen X være antall partall du får. Hvor mange ganger må du kaste for at vi skal kunne regne med at forsøket er normalfordelt? Mer enn 0. Mer enn 0. Mer enn 30. 3
5) Du skal kaste en terning 00 ganger. Vi lar den stokastiske variabelen X være antall partall du får. I dette forsøket er forventningsverdien 50 500 5 ) Du skal kaste en terning 00 ganger. Vi lar den stokastiske variabelen X være antall partall du får. I dette forsøket er standardavviket 4 5 7) Du skal kaste en terning n ganger. Vi lar den stokastiske variabelen X være antall kast som gir antall øyne mindre eller lik 5. Hvor mange ganger må du kaste for at vi skal kunne regne med at forsøket er normalfordelt? Mer enn Mer enn 0 Mer enn 30 8) Du skal kaste en terning n ganger. Vi lar den stokastiske variabelen X være antall kast som gir antall øyne større enn eller lik 5. Hvor mange ganger må du kaste for at vi skal kunne regne med at forsøket er normalfordelt? Mer enn 5 Mer enn 0 Mer enn 30 9) Du skal kaste en terning 00 ganger. Vi lar den stokastiske variabelen X være antall partall du får. Så gjentar du dette forsøket 5 ganger. La X være gjennomsnittet av 5 uavhengige forsøk der hvert forsøk består av 00 kast. Da er forventningsverdien til X 50 500 5 4
0) Du skal kaste en terning 00 ganger. Vi lar den stokastiske variabelen X være antall partall du får. Så gjentar du dette forsøket 5 ganger. La X være gjennomsnittet av 5 uavhengige forsøk der hvert forsøk består av 00 kast. Da er standardavviket til X 0,5 5 ) I denne oppgaven skal du regne med en gjennomsnittshøyde for kvinner er 70 cm med standardavvik,,8. Ved ulike skoler ble høyden til 5 russejenter målt. La X være gjennomsnittet av resultatet på de ulike skolene. Standardavviket til X er.,3,8,8 0 ) I denne oppgaven skal du regne med en gjennomsnittshøyde for kvinner er 70 cm med standardavvik,,8. Ved ulike skoler ble høyden til 5 russejenter målt. La X være gjennomsnittet av resultatet på de ulike skolene. Forventningsverdien til X er. 34 70 70 0 3) I denne oppgaven skal du regne med at gjennomsnittsvekten for nyfødte gutter er 300 gram med standardavvik, 00 gram. På et stort sykehus blir det med jevne mellomrom tatt en stikkprøve på 5 nyfødte gutter. La X være gjennomsnittsvekta til de 5 guttene. Forventningsverdien til X er. 70 gram 300 gram 4000 gram 5
4) I denne oppgaven skal du regne med at gjennomsnittsvekten for nyfødte gutter er 300 gram med standardavvik, 00 gram. På et stort sykehus blir det med jevne mellomrom tatt en stikkprøve på 5 nyfødte gutter. La X være gjennomsnittsvekta til de 5 guttene. Standardavviket, til X er. 0 gram 0 gram 00 gram 5) I denne oppgaven skal du regne med at gjennomsnittsvekten for nyfødte gutter er 300 gram med standardavvik, 00 gram. På et stort sykehus blir det med jevne mellomrom tatt en stikkprøve på 9 nyfødte gutter. La X være gjennomsnittsvekta til de 9 guttene. Standardavviket, til X er. 0 gram 0 gram 00 gram 3.5 Hypotesetesting ) En nullhypotese, H 0. sier at situasjonen er uendret. ) Effekten av en ny medisin for influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Dette er en høyresidig test Dette er en venstresidig test Dette er en dobbelsidig test
3) Effekten av en ny medisin mot influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Vi setter signifikansnivået til 5 % og tester 0 pasienter med influensa med den nye medisinen. Det viser seg at 8 av pasientene var friske etter 4 dager Bruk utdraget fra tabell for kumulativ sannsynlighet for binomisk fordeling med n0 og p 0,7 og bestem P - verdien til testen. P - verdien er 0,8 % 3, % 99, % 4) Effekten av alternativ behandling av influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den alternative behandlingen er like god. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den alternative behandlingen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den alternative behandlingen er dårligere enn den gamle, p 0,7 Dette er en høyresidig test Dette er en venstresidig test Dette er en dobbelsidig test 5) Berit er 70 cm høy og påstår at det er gjennomsnittshøyden for norske kvinner på 8 år. Kari mener at det er feil. Klassen til Berit og Kari vil bruke hypotesetesting for å undersøke om Berit eller Kari har rett. De bestemmer seg for å velge ut 00 jenter på 8 år tilfeldig og så finne gjennomsnittshøyden til jentene i denne stikkprøven. De velger som nullhypotese at Berits påstand er korrekt H : 70 0 Som alternativhypotese sier de at Karis påstand er korrekt H : 70 Dette er en høyresidig test Dette er en venstresidig test Dette er en dobbelsidig test 7
) Effekten av en alternativ behandling av influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den alternative behandlingen er like god. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den alternative behandlingen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den alternative behandlingen er dårligere enn den gamle, p 0,7 Vi setter signifikansnivået til 5 % og tester 0 pasienter med influensa med den nye medisinen. Det viser seg at av pasientene var friske etter 4 dager Bruk utdraget fra tabell for kumulativ sannsynlighet for binomisk fordeling med n0 og p 0,7 og bestem P - verdien til testen. P -verdien er 4,8 %,3 % 88,7 % 7) Jo høyere signifikansnivå man velger ved hypotesetesting, jo større grad av sikkerhet forlanger man før man forlater nullhypotesen. 8) Dersom hypotesetesting brukes som bevis i straffesaker, bruker man et høyt signifikansnivå. 9) Effekten av en ny medisin mot influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Vi ønsker å teste 0 pasienter med influensa med den nye medisinen. Da kan vi bruke normaltilnærmet binomisk fordeling. 8
0) Effekten av en ny medisin mot influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Hva er det minste antall pasienter vi må teste for at vi skal kunne bruke normaltilnærmet binomisk fordeling? 8 7 ) Effekten av en ny medisin mot influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Vi ønsker å teste 0 pasienter med influensa med den nye medisinen. Vi vil bruke normaltilnærmet binomisk fordeling i testen. Hva blir forventningsverdien,? 4 5 ) Effekten av en ny medisin mot influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Vi ønsker å teste pasienter med influensa med den nye medisinen. Vi vil bruke normaltilnærmet binomisk fordeling i testen. Hva blir standardavviket,? 0,5,, 9
3) Effekten av en ny medisin mot influensa skal undersøkes. Vi har en tradisjonell behandling der 70 % av pasientene ble friske etter 4 dager, og vi ønsker å finne ut om den nye medisinen er bedre. Vi lar p være andelen som blir friske etter 4 dager og setter opp en nullhypotese, H 0 : Den nye medisinen er like god som den gamle, p 0,7 og en alternativ hypotese H : Den nye medisinen er bedre enn den gamle, p 0,7 Vi setter signifikansnivået til 5 % og tester pasienter med influensa med den nye medisinen. Det viser seg at 7 av pasientene var friske etter 4 dager Vi bruker normaltilnærmet binomisk fordeling. Resultatet tilsier at vi kan forlate nullhypotesen 30
4) Berit er 70 cm høy og påstår at det er gjennomsnittshøyden for norske kvinner på 8 år. Kari mener at gjennomsnittshøyden er større. Klassen til Berit og Kari vil bruke hypotesetesting for å undersøke om Berit eller Kari har rett. De bestemmer seg for å velge ut 00 jenter på 8 år tilfeldig og så finne gjennomsnittshøyden til jentene i denne stikkprøven. De velger som nullhypotese at Berits påstand er korrekt H : 70 0 Som alternativhypotese sier de at Karis påstand er korrekt H : 70 Dette er en høyresidig test 5) Berit er 70 cm høy og påstår at det er gjennomsnittshøyden for norske kvinner på 8 år. Kari mener at gjennomsnittshøyden er større. Klassen til Berit og Kari vil bruke hypotesetesting for å undersøke om Berit eller Kari har rett. De bestemmer seg for å velge ut 00 jenter på 8 år tilfeldig og så finne gjennomsnittshøyden til jentene i denne stikkprøven. De velger som nullhypotese at Berits påstand er korrekt H : 70 0 Som alternativhypotese sier de at Karis påstand er korrekt H : 70 Klassen regner med at standardavviket for høyden på norske jenter på 8 år er,8. Hva blir standardavviket for gjennomsnittet av stikkprøven 0,8,8,8 00 3