Pilkast og kjikvadrat fordelingen Halvor Aarnes, IBV, 014 Innhold Pilkast... 1 Simulering av pilkast... Kjikvadratfordelingen og gammafordelingen... 3 Rayleigh-fordelingen... 5 Pilkast brukt til å estimere pi (π)... 7 Eksperiment pilkast... 7 Pilkast Vi skal bruke pilkast og se at treffpunktene følger χ -fordelingen, og at vi kan lage et estimat av π. 1
Figur 1. Blink hvor treffpunktene er angitt med xy-koordinatene målt fra sentrum i blinken, radius er lik r og vinkelen er theta (θ). Blinken er delt inn i kvadrat 1-4. Simulering av pilkast Vi simulerer kast av dartpiler mot en blink hvor treffpunktene er angitt med koordinatene (x, y), hvor x og y er uavhengige av hverandre og standard normalfordelte med lik varianse. Vi regner deretter om til standard normalfordeling med standardavvik=1, og gjennomsnitt lik 0. Kvadratet av avstanden fra blinken følger Pythagoras setning og vil kan regne ut lengden av radien (r):
Figur. Simulering av standard normalfordeling av treffpunktene for 0000 pilkast. Sirklene angir henholdsvis 1, 1.96 og.58 standardavvik, tilsvarende 68.3%, 95% og 99% av arealet under normalfordelingskurven. Kjikvadratfordelingen og gammafordelingen Kvadratsummer følger kjikvadratfordelingen (χ ) hvor antall frihetsgrader (df) er lik antall uavhengige standard normalfordelte variable, i dette tilfelle blir df=. Vi lager et histogram for r og plotter kjikvadratfordelingen med df=. Kjikvadratfordelingen er et spesialtilfelle av gammafordelingen, og med df= følger den også eksponentialfordelingen. ~ 1, 1 3
Figur 3. Histogram for r, samt prikket rød linje som viser kjikvadratfordelingen (χ ) for to frihetsgrader (df=). 4
Figur 4. Histogram for r, samt prikket rød linje som viser eksponentialfordelingen med rateparamter, og gammafordelingen med formparameter 1 (shape=1) og rateparameter 1/ (rate=1/). Vi ser at redultatet blir det samme som for kjikvadratfordelingen. Rayleigh-fordelingen Rayleighfordelingen er kontinuerlig og beskriver fordelingen av en retningsavhengig vektor med to uavhengige koordinater. Den vil også beskrive absoluttverdien til komplekse tall. Sannsynlighetstettfordelingen f(x) av Rayleighfordelingen er: Forventning (E(X)), varianse (Var(X)) og medianen til Rayleighfordelingen er gitt ved. 4 4 5
3 4 Den kumulative sannsynlighetsfordelingen F(x) er for Rayleighfordelingen: 1 Fordelingen av radius til treffpunktet, og denne kan beskrives av en Rayleigh-fordeling. i vårt eksempel er σ=1 Figur 5. Histogram for radius til treffpunktene for 0000 treffpunkter (x,y) fra standard normalfordeling. Heltrukken linje vier Rayleigh-fordelingen. 6
Pilkast brukt til å estimere pi (π) Gjennomsnittet av lengden er radius for de 0000 simulerte treffpunktene blir lik 1.5607. Det er den samme verdien som man får fra Rayleigh-fordelingen. 1.53314 Variansen for de 0000 simulerte treffpunktene hvor x- og y- koordinatene kommer fra standard normalfordeling blir 0.4308194. Tilsvarende for Rayleigh-fordelingen: 4 0.49037 Estimat av π ved simulering av 0000 treffpunkter hvor x- og y- koordinatene følger standard normalfordeling: 1.5607 3.155434 Eksperiment pilkast Hvert lag kaster 10 piler, og bestem x, y-koordinatene (cm) for treffpunktene med en tommestokk. Origo i sentrum av blinken. xykoordinatene får fortegn avhneig av i hvilken kvadrant treffpunktet befinner seg i. Kastavstand fra blinken: meter. Følg sikkerhetsregler slik at ingen personer blir truffet av pilene. Pilkast x-koordinat (cm) y-koordinat (cm) 1 3 4 5 6 7 8 9 10 Datasett pilkast.txt som inneholder resultatene fra kurset BIO150 Biostatistikk og studiedesign, UiO, høsten 014 og 015. 7
Figur 6. Treffpunktene fra to eksperimenter med pilkast hvor x- og y- koordinatene er målt i cm (datasett pilkast.txt) Figur 7. Histogram av kvadratet av treffpunktenes avstand fra origo (sentrum av blinken) i et eksperiment. Heltrukken rød llinje viser kjikvadratfordelingen (df=). Datasett:pilkast.txt 8
Figur 8. Histogram for radius til treffpunktene fra et eksperiment med pilkast. Treffpunkt omregnet til fra standard normalfordeling. Heltrukken linje vier Rayleigh-fordelingen. Datasett: pilkast.txt. Gjennomsnitt kvadrat av radius fra eksperiment: 1.4, varianse: 0.45. Estimert verdi av pi for eksperimentet: 3.08. Litteratur Wikipedia R Development Core Team (011). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.r-project.org/ (PS. På min gamle hjemme-pc har jeg ikke fått somlet meg til en oppdatering). 9