Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Størrelse: px
Begynne med side:

Download "Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde"

Transkript

1 1 E DAG PÅ HELSESTASJOE Lises klassevenninnner Lise er veldig liten Hva gjør at du sier at hun er liten? Du har en hypotese om vanlig høyde Du har en hypotese om vanlig høyde Du sammenligner Lises høyde med din hypotese Du anslår om Lise er mer uvanlig enn vanlig uvanlig Lises høyde Du anslår om Lise er mer uvanlig enn vanlig uvanlig Dette er den viktige øyemålstesten Page 1

2 Lises høyde Din hypotese (Vanlig høyde) Lises høyde - Din hypotese (Vanlig høyde) Piker med Turners syndrom Lises høyde - Din hypotese (Vanlig høyde) Sannsynligheten for at Lise har en vanlig høyde er veldig liten Hun må trolig tilhøre en gruppe med lav høyde pga. en sykdom Du tror ikke Lise er vanlig, men hun er vanlig hvis man sammenligner med andre piker med Turners syndrom Lises høyde - Din hypotese (Vanlig høyde) for piker med Turners syndrom for piker med Turners syndrom Viktig!!! Forstår du dette, har du skjønt statistisk testing HUSK, dere gjør dette hver dag bare på øyemål Lises høyde - Din hypotese (Vanlig høyde) Denne er uproblematisk å måle Page

3 3 135 cm - Din hypotese (Vanlig høyde) 135 cm - Din hypotese (Vanlig høyde) Hva er vanlig høyde? Typetallet? Medianen? Gjennomsnittet? Summarisk sentermål: Typetall Den vanligste verdi Median Den midterste verdi når alle er ordnet i stigende rekkefølge Gjennomsnitt Summen av alle verdier delt på antall verdier ΣX/n = µ (hvis populasjon) Σx/n = x (hvis utvalg) 135 cm cm Formelen : 135 cm cm Hva er den vanlige uvanlighet? Gjennomsnittsavstand fra gjennomsnittet? Standardavvik? Spredningsmål: Forskjell mellom største og minste verdi: 16 cm cm = 15 cm Dette kalles VARIASJOSBREDDE Bruker kun en liten del av tilgjengelig informasjon Page 3

4 4 Formelen : Spredningsmål : Gjennomsnittelig avstand fra gjennomsnittet: Σ( x µ ) Hva er resultatet av denne formelen? Spredningsmål : Gjennomsnittelig avstand fra gjennomsnittet: Σ( x µ ) = 0 10 = 0 x x-µ Σ 0 Spredningsmål : Gjennomsnittelig avstand fra gjennomsnittet: Kan vi ignorere tegnet? Spredningsmål : Absolutt gjennomsnittelig avstand fra gjennomsnittet: Σ ( x µ ) 3 = = 3, 10 x x-µ Σ 3 Spredningsmål: Gjennomsnittelig avstand fra gjennomsnittet : Kan vi bli kvitt tegnene på en annen måte? Gjennomsnittsmål: Gjennomsnittelig kvadrert avstand fra gjennomsnittet: Σ( x µ ) Dette kalles: VARIAS 166 = = x (x-µ) (x-µ) Σ Page 4

5 5 Gjennomsnittsmål : Varians uttrykkes her i cm Dette er ikke praktisk når gjennomsnittshøyde uttrykkes i cm Spredningsmål: Kvadratroten av den gjennomsnittelige kvadrerte avstand fra gjennomsnittet: Σ( x µ ) Σ( x µ ) = 16.6 = 4.1 Dette kalles: STADARDAVVIK x (x-µ) (x-µ) Σ Spredningsmål: Σ( x µ ) STADARDAVVIK 135 cm cm Hva 4.1 cm så?? Er gitt symbolet σ. Dette er spredningsmålet i en populasjon Lises høyde er fire og en halv gang lenger fra din hypotese enn et standardavvik (tilfeldig variasjon) ormalfordelingen: ormalfordelingen : Histogram av høyden til Lises jevnaldrende 4 Histogram av høyden til Lises jevnaldrende µ - σ + σ De fleste jenter finnes i midten, noen få lenger ut på sidene. De fleste jenter finnes i midten, noen få lenger ut på sidene. Page 5

6 6 ormalfordelingen (z-fordelingen) : ormalfordelingen : 68.3% 68.3% Den nøyaktige sannsynlighet for et gitt antall standardavvik fra gjennomsnittet kan beregnes, og ligger inne i PCens program. 95.4% 99.7% -3 σ µ +3 σ 95.4% 99.7% -3 σ µ +3 σ ormalfordelingen : Hva betyr p-verdien Histogram av høyden til Lises jevnaldrende og Lise µ - σ + σ p<0, De fleste jenter finnes i midten, noen få lenger ut på sidene. Lise er langt utenfor (4,63 standardavvik): Statistikken er enig med vårt tidligere øyemål p står for probability p is the probability of getting the data observed or more extreme data if the hypothesis is true Estimering Estimering Å kunne si noe om en storgruppe ut fra et individ Vi vet: Lise er 135 cm høy Standardavviket for jenters høyde i den alder er 4,1 cm. Hva er gjennomsnittshøyden for jenter i den alderen? 4,1 cm Lise 1 Lise kan være inntil 8, cm. kortere enn gjennomsnittet Page 6

7 7 Estimering Estimering 95% konfidensintervall er 16,8 143, cm 4,1 cm Lise Lise kan være inntil 8, cm. lengre enn gjennomsnittet 4,1 cm 16,8 cm 143, cm Lise Gjennomsnittet må være et sted mellom 16,8 og 143, cm Estimering Å kunne si noe om en storgruppe ut fra et utvalg Vi vet: Jentene i en klasse har gjennomsnittshøyde 150 Standardavviket for jenters høyde i den alder er 3 cm. Hva er gjennomsnittshøyden for jenter i den alderen? Men, vi må vite hva som er vanlig uvanlighet for gruppegjennomsnitt Vanlig uvanlighet for gruppegjennomsnitt Den må øke når standardavvik for enkeltverdier øker Den må øke når antall individer i gruppen synker Den har verdien: s/ n Denne størrelsen har fått egennavnet gjennomsnittets standardfeil Estimering med gruppestørrelse på 9 1 cm Gruppe 1 Gruppen kan være inntil cm. kortere enn gjennomsnittet Page 7

8 8 Estimering med gruppestørrelse på 9 Estimering med gruppestørrelse på 9 1 cm Gruppe Gruppen kan være inntil cm. lengre enn gjennomsnittet 1 cm Gruppe Gjennomsnittet for alle jenter må ligge mellom 15 cm og 156 cm Dere kan nå: Beregne gjennomsnitt Beregne standardavvik Estimere gjennomsnitt fra enkeltverdier og gruppegjennomsnitt Vi er ikke lenger interessert i hvor populasjonsgjennomsnittet kan ligge, men... Er vår enkeltverdi eller gruppegjennomsnitt forenlig med at populasjonsgjennomsnittet er en bestemt verdi som vi velger?? 135 cm cm 4,1 cm -4,63 Lise er nesten 5 ganger så langt fra gjennomsnittet som det vanlige Sannsynligheten for å finne en vanlig jente med høyde 135 cm er mindre enn 0,00001 Lise 3 cm 154 cm Page 8

9 9 Testformelen: Målt verdi - Hypoteseverdi Standardavvik Formelen gir en t-verdi, og testen kalles derfor t-test Lise 3 cm 154 cm Er dataene normalfordelt, kan det angis en sannsynlighet for å se en slik t-verdi Denne sannsynlighet oppgis som en p- verdi (probability) I Lises tilfelle er denne p-verdien mye mindre enn dvs. i færre enn et av tilfelle vil en slik høyde eller mer ekstrem kunne oppstå ved en tilfeldighet Målt verdi To grupper skal sammenlignes med hverandre s f (1/n 1 + 1/n ) Målt verdi To grupper skal sammenlignes med hverandre s f (1/n 1 + 1/n ) Hypoteseverdi Målt verdi To grupper skal sammenlignes med hverandre s f (1/n 1 + 1/n ) Hypoteseverdi Hva er s f???? s f er et vektet gjennomsnitt av s 1 og s De skal jo begge gi et best mulig bilde av σ Standardavvik Page 9

10 10 Utregning av s f s f = (s 1 *(n 1-1)+s *(n -1))/(n 1 +n -) TESTLURERI I s f (1/n 1 + 1/n ) Man gjør n-ene store En liten differanse kan gi høy t-verdi En høy t-verdi gir lav p-verdi Man konkluderer med signifikant forskjell TESTLURERI I s f (1/n 1 + 1/n ) TESTLURERI II s f (1/n 1 + 1/n ) Man gjør n-ene store SE PÅ ABSOLUTT DIFFERASE OG KOFIDESITERVALL Man gjør n-ene små En stor differanse kan gi lav t-verdi En lav t-verdi gir høy p-verdi Man konkluderer med ikke-signifikant forskjell TESTLURERI II s f (1/n 1 + 1/n ) Statistikk kan være tørr og kjedelig, men... Man gjør n-ene små SE PÅ ABSOLUTT DIFFERASE OG KOFIDESITERVALL Page 10

11 11 Statistikk kan være tørr og kjedelig, men... oen ganger kan den lede deg inn i en spennende verden av mysterier som skal løses og gåter som skal knekkes Page 11