Sannsynligheten for det usannsynlige kan vi bestemme sannsynligheten for usannsynlige hendelser?

Like dokumenter
Matematikk S2 kapittel 5 Sannsynlighet Utvalgte løsninger oppgavesamlingen

STK1100 våren Betinget sannsynlighet og uavhengighet. Vi trenger en definisjon av betinget sannsynlighet! Eksempel 1

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Mer om hypotesetesting

Plan. MAT1030 Diskret matematikk. Eksamen 12/6-06 Oppgave 2. Noen tips til eksamen

Oppgave 1. Oppgave 2. 3MX eksamen Privatister Løsningsskisse Ikke kontrollert og dobbeltsjekket! Kan være feil her...

Normalfordeling. Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 7

3 Sannsynlighet, Quiz

Åpenhet, lojalitet og karrieremuligheter

Test, 3 Sannsynlighet

Kapittel 9 og 10: Hypotesetesting

Obligatorisk oppgave 4 i INF4400 for Jan Erik Ramstad

Kapittel 4: Betinget sannsynlighet

Hypotesetesting. mot. mot. mot. ˆ x

b) Hva er sannsynligheten for at re tilfeldig utvalgte bilmotorer alle har en levetid på minst 17 år?

Rekursjon og induksjon. MAT1030 Diskret matematikk. Induksjonsbevis. Induksjonsbevis. Eksempel (Fortsatt) Eksempel

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Forelesning 20. Kombinatorikk. Roger Antonsen - 7. april 2008

STK1100 våren 2017 Kombinatorikk

Hypotesetesting av λ og p. p verdi.

Oppgaver i kapittel 1 - Løsningsskisser og kommentarer Lærebok:

STK1100 våren Kombinatorikk = = Uniform sannsynlighetsmodell. Et stokastisk forsøk har N utfall. Det er de mulige utfallene for forsøket.

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kapittel 9 og 10: Hypotesetesting

Test, 3 Sannsynlighet og statistikk

d) Poenget er å regne ut terskeltrykket til kappebergarten og omgjøre dette til en tilsvarende høyde av en oljekolonne i vann.

MAT1030 Forelesning 21

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

UNIVERSITETET I OSLO

Fire kort. Mål. Gjennomføring. Film. Problemløsing Fire kort

Fire kort. Mål. Gjennomføring. Film. Problemløsing Fire kort

STK1100 våren 2015 P A B P B A. Betinget sannsynlighet. Vi trenger en definisjon av betinget sannsynlighet! Eksemplet motiverer definisjonen:

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Forkunnskaper i matematikk for fysikkstudenter. Integrasjon.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Cct LLV STYR ESAK # 16/13 PROFESSOR I KUNST MED HOVEDFOKUS Å GRAFIKK: BETENKNING STYREMØTET DEN Ved rørende: Forslag til vedtak: Vedlegg:

MAT1030 Forelesning 16

STK1100 våren 2019 Mere om konfidensintevaller

Førsteordens lineære differensiallikninger

REKT Random Events Knowledge Test

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamen S2 høsten 2010 Løsning

Kapittel 9: Mer kombinatorikk

Eksempel på symmetrisk feil: trefase kortslutning på kraftlinje.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Fire kort. Mål. Gjennomføring. Film. Problemløsing Fire kort Planleggingsdokument

Lottotrekningen i Excel

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kapittel 4.5

MAT1030 Forelesning 21

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Geogebra hjelp - S2. Funksjonsanalyse. Innhold. Kommando. Funksjonsanalyse 1. Undersøke om dataene er normalfordelt 1.

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010 (20)

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Innledning. Grafisk fremstilling

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

Innledning. Grafisk fremstilling

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Sensorveiledning eksamen ECON 3610/4610 Høst 2004

2 Om å lære matematikk og litt om vurdering av måloppnåelse/kompetanse

Eksamen S2, Høsten 2013

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Betingede sannsynligheter Fra spøkefull Monty Hall til alvorsfull kreftdiagnostikk

Kapittel 10: Hypotesetesting

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Oppgave 13.1 (13.4:1)

Kapittel Praktiske eksempler på førsteordens differensialligninger

Ulike typer utvalg. MAT0100V Sannsynlighetsregning og kombinatorikk. Ordnet utvalg uten tilbakelegging 29 (29 1) (29 2) (29 3) =

MA1301/MA6301 Tallteori Høst 2016

Arbeidsplan 8. klasse BLÅ

Kan vi stole på resultater fra «liten N»?

ikke Stikka Tema: PÅRØRENDE NR

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

HØGSKOLEN I STAVANGER

FY1006/TFY Øving 4 1 ØVING 4

Modell for befolkningsprojeksjoner for norske regioner. av Eivind Giij e x )

TMA4240 Statistikk Høst 2015

8 + AVSLUTTE SPILLET Handelsenheten forteller deg når spillet er over, etter 1 time. BATTERY INFORMATION

Analyse med uavhengige variabler på nominal- /ordinalnivå

Kapittel 9: Mer kombinatorikk

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

TMA4245 Statistikk Eksamen desember 2016

Kapittel 3: Kombinatorikk

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kap. 4.5 STK1000 H11

Øving 9. Oppgave 1. E t0 = 2. Her er

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Kapittel Praktiske eksempler på førsteordens differensialligninger

Diskrete sannsynlighetsfordelinger.

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

Total sannsynlighet. MAT0100V Sannsynlighetsregning og kombinatorikk = Vi kan skrive en hendelse B som en disjunkt

Transkript:

Sannsynligheten for det usannsynlige an vi bestemme sannsynligheten for usannsynlige hendelser? Ørnulf Borgan Landsurs i matemati Gardermoen 6. mars 2017 H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1

Disposisjon: Lotto Sannsynligheten for å vinne Antall vinnere og Poissonfordelingen Myten om Værdal En ommentar om hypotesetesting Opphopning av refttilfeller Sømnasaen Sannynligheter i rettssalen Lucia de Ber Landåssaen Avsluttende ommentarer 2

Vinnersjansen i Lotto Sannsynligheten for å vinne førstepremie på én lottoree: 1 34 7 0,00000019 Denne sannsynligheten er så liten at det er vanselig å forestille seg et så lite tall. 3

Jernbanestreningen fra Stavanger til Bodø er omtrent 1900 m. Ten deg at det et sted på streningen er plassert en baseturv (diameter 45 cm). Du reiser Stavanger Bodø og slipper på et tilfeldig valgt sted en lineule ut av vinduet. Sannsynligheten for at du treffer urven er 0,45 1900 1000 0,00000023 Det er omtrent det samme som sannsynligheten for å vinne førstepremie i Lotto. 4

Antall vinnere i Lotto Selv om sannsynligheten for å vinne førstepremie i Lotto er uhyre liten, er det noen som vinner (nesten) hver ue. Fordelingen av antall vinnere i siden mars 2015: Andel uer 0 0.05 0.10 0.15 0.20 0.25 0 1 2 3 4 5 6 7 8 Antall spillere med førstepremie (Uer med omsetning over 85 millioner ronerer ie tatt med) 5

Siden mars 2015 har det blitt tippet omtrent 15 15 millioner lottoreer hver ue. Hvis reene hadde vunnet uavhengig av hverandre, ville antall reer som vinner en gitt ue ha vært binomis fordelt med n = 15 000 000 og p = 0,00000019. 15000000 P ( vinnere) 0,00000019 0,99999981 15000000 For så stor verdi av n og liten verdi av p som vi har her er det pratis å regne med Poisson fordelingen i stedet for den binomise. 6

Poissonfordelingen Hvis vi i den binomise fordelingen lar n og på en sli måte at np får vi at ( = 0, 1, 2,.) p 0 n p (1 p ) n n! 1!( n )! n n n n ( n 1) ( n 2)... n 1 1! n n n e! Dette resultatet ble først vist i 1838 av den franse matematien Siméon Denis Poisson. 7 7

Sett l = np. Når n er stor og p er liten har vi at: Illustrasjon: (1 ) n p p n e! ( Binomis Poisson ) Poisson Binomis Binomis Binomis n = 500 n = 50 n = 5 l = 0.50 p = 0.001 p = 0.01 p = 0.10 0 0,6065 0,6064 0,6050 0,5905 1 0,3033 0,3035 0,3056 0,3280 2 0,0758 0,0758 0,0756 0,0729 3 0,0126 0,0126 0,0122 0,0081 8

Antall vinnere i Lotto (forts) Hvis Lotto reene hadde vunnet uavhengig av hverandre, ville vi hatt at: Siden n = 15 000 000 er veldig stor og p = 0.00000019 er veldig liten, an vi regne med Poisson fordelingen med i stedet for binomis fordeling: np 2,79 15000000 P ( vinnere) 0,00000019 0,99999981 2,79 P e! 2,79 ( vinnere) ( 0,1,2,3,...) 15000000 Selv om reene i vireligheten ie vinner uavhengig av hverandre, gir Poisson fordelingen lievel en god besrivelse av antall lottovinnere en gitt ue. 9

Fordeling av antall vinnere siden mars 2015 Poisson fordelingen med 2,79 (røde stjerner) Andel uer 0 0.05 0.10 0.15 0.20 0.25 0 1 2 3 4 5 6 7 8 Antall spillere med førstepremie 10

Hva er det med Verdal? (Dagbladets nettutgave 5. otober 2003) 11

Er det merelig at en ommune Verdal fi 11 lottovinnere i perioden 1986 til 2003? Fra Lotto startet i april 1986 og til utgangen av 2003 var det 920 lottotreninger. Anta (som et regneesempel) at det blir spilt 10 millioner reer hver ue i 920 uer og at 3 promille av reene blir spillt i en bestemt ommune (av størrelse som Verdal). Hva er sannsynligheten for at ommunen får minst 11 lottovinnere? 12

Antall førstepremier i ommunen vil være (tilnærmet) Poisson fordelt med 920 30000 0,00000019 5,13 Det gir: P(minst 11 vinnere) 11 5,13! e 5,13 0,016 Det er usannsynlig at en ommune av Verdals størrelse sal få minst 11 førstepremievinnere. Dette er bagrunnen for «myten om Verdal». http://www.youtube.com/watch?v=zgrt9ipvryo 13

«Myten om Verdal» oppstod fordi det var mange førstepremier i ommunen. Hvis det hadde vært en annen ommune som hadde fått så mange førstepremier (i forhold til foletallet), hadde det oppstått en myte om den ommunen i stedet. La oss som et esempel se på 50 ommuner av størrelse med Verdal. Hva er sannsynligheten for at det i minst én av de 50 ommunene blir vunnet førstepremie 11 eller flere ganger i løpet av 920 uer? P(minst én ommune får minst 11 vinnere) 50 1 (1 0,016) 0,554 Det er sannsynlig at en eller annen ommune av Verdals størrelse får minst 11 førstepremievinnere. 14

Hva har sjedd i Verdal siden 2004? Kilde: storvinnerdata.no 15

Siden 2004 har det vært sju lottovinnere fra Verdal. Berefter det «myten om Verdal»? Siden 2004 har det vært 686 lottotreninger. Anta (som et regneesempel) at det blir spilt 15 millioner reer hver ue i 686 uer og at 3 promille av reene blir spillt i en bestemt ommune (av størrelse som Verdal). Hva er sannsynligheten for at ommunen får minst 7 førstepremier? 16

Antall førstepremier i ommunen vil være (tilnærmet) Poisson fordelt med forventningsverdi Det gir: 686 45000 0,00000019 5,74 P(minst 7 vinnere) 7 5,74! e 5,74 0.35 Det er ie merelig at vi siden 2004 har fått sju lottovinnere i Verdal. 17

En ommentar om hypotesetesting Lottotallene trees ut tilfeldig, så vi vet at sannsynligheten for å vinnne på en lottoupong fra Verdal er den samme som for andre lottouponger. Vi an lievel brue esemplet til å få fram et vitig poeng om hypotesetesting. For hypotesetesting har vi en nullhypotese (H 0 ) og en alternativ hypotese (H A ). For å teste nullhypotesen observerer vi resultatet av et tilfeldig forsø, og på grunnlag av det avgjør vi om H 0 sal forastes eller ie. (Hvis vi foraster H 0, an vi være rimelig sire på at H A er sann.) Mer at vi må bestemme H 0 og H A før vi gjør forsøet. 18

For esemplet er H 0 at vinnersjansen i Verdal er den samme som for andre steder, mens H A er at den er større. I utgangspuntet var den ingen som hadde noen hypotese om at sannsynligheten for å vinne på en lottoupong fra Verdal var større enn for andre lottouponger. Vi an derfor ie brue hypotesetesting for antall lottovinnere fra Verdal i perioden 1986-2003. Men det store antallet vinnere fra Verdal genererte en hypotese om at vinnersjansen der var større enn andre steder. Så for perioden 2004-2017 an vi brue hypotesetesting (og da ble ie H 0 forastet, rimelig no). 19

Opphopning av refttilfeller: Sømnasaen (Dagbladet 10. januar 1993) (Dagbladet 11. januar 1993) 20

Det ble observert tre tilfeller av hjernesvulst i Sømna ommune i 1992. Det var uvanlig mange i en så liten ommune. Sømna Saen vate stor oppsit i media og blant politiere. Ble sett i sammenheng med Tsjernobyl ulyen 26. april 1986. 21

Etter Kreftregisterets statisti vil det for en ommune av Sømnas størrelse og befolningssammensetning i gjennomsnitt være ett tilfelle av hjernesvulst hvert sjette år hvis reftrisioen er som i resten av landet. Mer presist: Hvis reftrisioen i Sømna var som ellers i landet, vil antall tilfeller av hjernesvulst i løpet av ett år være Poisson fordelt med 0.16. Det gir: P(minst 3 tillfeller av hjernesvulst) 3 0,16! e 0,16 0,0006 Det som sjedde i Sømna var svært usannsynlig hvis ommunen hadde samme reftriso som landet forøvrig.

(Aftenposten 20. otober 1993) 23

Hvordan an vi forlare at refttilfellene i Sømna syldes en ren tilfeldighet? Må da være oppmersom på hvorfor refttilfellene i Sømna vate oppsit. Det sjedde nettopp fordi det ble registrert uvanlig mange refttilfeller i denne ene ommunen i dette ene året. Alle de ommunene og alle de årene der det ie sjer noe oppsitsveende, er det ingen som bryr seg om. Vi må derfor spørre: Hva er sannsynligheten for at vi en gang i blant i en eller annen ommune vil observere noe så påfallende som det en gjorde i Sømna i 1992 ved en ren tilfeldighet. 24

Regneesempel: Vi tener oss at vi har 100 ommuner med samme størrelse og befolningsstrutur som Sømna, og at vi observerer antall refttilfeller i disse ommunene i en tiårs periode. Sannsynligheten for at vi i minst én av ommunene vil oppleve minst tre tilfeller av hjernesvulst i løpet av ett år ved en ren tilfeldighet er: 1000 1 (1 0,0006) 0,45 Det er sannsynlig at noe så usannsynlig som det som hendte i Sømna vil sje en gang i blant ved en ren tilfeldighet. 25

www.reftregisteret.no/generelt/fata-om-reft /Tema/Clusterreftopphopning/ 26

De Ber ble dømt til fengsel på livstid for sju mord og tre mordforsø. 28

Saen vate stor oppsit og flere ledende statistiere ritiserte Elffers sannsynlighetsberegninger. Etter flere anesaer og sju år i fengsel ble Lucia de Ber frifunnet i april 2010.

http://www.bbc.com/news/magazine-10729380 30

Landåssaen Ved Landås Menighets Eldresenter i Bergen ble det i 1993-94 observert uvanlig mange dødsfall på vatene til en av hjelpepleierne. På denne bagrunn ble hjelpepleieren sitet for drap på 10 pasienter og varetesfengslet for tolv uer med brev- og besøsforbud. (VG 29. april 1995) 31

Saen vate enorm oppmersomhet. (VG 30. april 1995) (VG 2. mai 1995)

(VG 3. mai 1995) (VG 4. mai 1995)

Professor Odd Aalen ved Det Medisinse faultet ved Universitetet i Oslo ble oppnevnt som sayndig. Etter å ha satt seg nøye inn i saen onluderte han med at opphopningen av dødsfall på hjelpepleierens vater unne syldes tilfeldig variasjon. (3. august 1995) 34

Hvordan an dødsfallene på hjelpepleierne vater syldes tilfeldigheter? Argumentet er tilsvarende som for Verdal og Sømna: Det er mange syehjem i Norge, og de drives år etter år. Derfor er det ie så usannsynlig at noe så uvanlig som det en observerte på Landås an inntreffe en sjelden gang ved ren tilfeldighet. Sitede ble løslatt 26. august 1995. Saen ble henlagt av Risadvoaten 20. november 1995 «etter bevisets stilling» i det han tilføyde at «hun er med dette å anse som frifunnet». 35

Avsluttende ommentarer Det er sannsynlig at en «usannsynlige hendelse» inntreffer «en gang i blant» ved en ren tilfeldighet. Noen ganger an vi være sire på at den «usannsynlige hendelsen» syldes en ren tilfeldighet (Verdal). Ofte an vi ie være sire på om en «usannsynlig hendelse» syldes en ren tilfeldighet eller en om den har en virelig årsa (Sømna, de Ber, Landås). Da må en undersøe saen nøye for å finne mulige årsaer. Men samtidig må en være lar over at den «usannsynlige hendelsen» an syldes en ren tilfeldighet. Hvis det er mulig å gjøre flere observasjoner, an en i ettertid få avgjort om den «usannsynlige hendelsen» syldes en ren tilfeldighet eller ie. (I Sømna har det ie vært unormalt mange tilfeller av hjernesvulst i årene etter 1992.)