Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/



Like dokumenter
Verdens statistikk-dag.

6.2 Signifikanstester

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Introduksjon til inferens

Kapittel 3: Studieopplegg

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Hypotesetesting. mot. mot. mot. ˆ x

ST0202 Statistikk for samfunnsvitere

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Kapittel 7: Inferens for forventningerukjent standardavvik

Inferens i fordelinger

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

i x i

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Høst 2016

Fasit for tilleggsoppgaver

Kapittel 9 og 10: Hypotesetesting

Kapittel 10: Hypotesetesting

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Statistikk og dataanalyse

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

TMA4240 Statistikk H2010 (19)

Hypotesetesting av λ og p. p verdi.

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Kan vi stole på resultater fra «liten N»?

Kapittel 7: Inferens for forventningerukjent standardavvik

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

TMA4240 Statistikk Høst 2007

Hypotesetest: generell fremgangsmåte

7.2 Sammenligning av to forventinger

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Kapittel 9 og 10: Hypotesetesting

Econ 2130 uke 16 (HG)

ST0202 Statistikk for samfunnsvitere

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

HØGSKOLEN I STAVANGER

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

ST0202 Statistikk for samfunnsvitere

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

1 10-2: Korrelasjon : Regresjon

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

UNIVERSITETET I OSLO

Oppgaver til Studentveiledning I MET 3431 Statistikk

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Løsningsforslag Til Statlab 5

EKSAMENSOPPGAVER STAT100 Vår 2011

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Forskningsmetoder i menneske-maskin interaksjon

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ECON240 VÅR / 2016 BOKMÅL

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4240 Statistikk Høst 2015

Estimering og hypotesetesting

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

TMA4240 Statistikk 2014

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Estimering og hypotesetesting

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

10.1 Enkel lineær regresjon Multippel regresjon

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Definisjoner av begreper Eks.: interesse for politikk

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Transkript:

Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator under antatt hypotese Hvis sannsynlighet liten, forkast hypotese Eksempel studentlån Gjennomsnittelig lån studenter : x 1=$21200 ved private skoler x 2=$17100 ved offentlige skoler Forskjell $4100, reell eller tilfeldig? P( x 1-x 2 4100 Lik)=0.17 Ikke så overraskende resultat, data gir ikke grunnlag for å si at det er forskjeller i lånenivå 1

Studentlån Gjennomsnittelig lån i 1997 er x 1=$11400 i 2002 er x 2=$18900 Forskjell $7500 P( x 1-x 2 7500 Lik)=0.00004 Data gir grunnlag for å forkaste hypotese om at det er forskjeller i lånenivå 2

Hovedtrinn Spørsmål: Forskjell mellom nivåer (forventninger) Ser om data er kompatibel med ingen forskjell Hvis overraskende stor forskjell Forkast antagelse om ingen forskjell Hvis ikke overraskende forskjell Ikke grunnlag i data for å si det er forskjell Hypoteser Null-hypotese H 0 Påstand som ønskes testes Typisk: Ingen effekt/forskjell H 0 : μ=0 eventuelt μ 1 =μ 2 Signifikanstest Designet for å angi bevisstyrke mot H 0 Alternativ hypotese H a Det er en effekt/forskjell H a : μ 0 eventuelt μ 1 μ 2 Test observator Baserer test på en observator som estimerer parameteren vi er interessert i x 1 -x 2 estimerer μ 1 -μ 2 Verdier langt fra parameterverdi under H 0 gir bevis mot H 0 H a angir hvilken retning som teller: H a > μ 2 angir at vi må ha stor x 1 -x 2 H a < μ 2 angir at vi må ha liten x 1 -x 2 H a μ 2 angir at vi må ha stor x 1 -x 2 3

Standardisert test-observator Starter med estimat parameterverdi under H 0 Følsom for skala, bedre med z = estimat parameterverdiunderh 0 standardavvikforestimat Eksempel studielån H 0 = μ 2 mot H a :μ 1 μ 2 H 0 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1 -x 2 (= 4100) Eksempel: σ x 1-x 2 =3000 z=(4000-0)/3000 = 1.37 z tilnærmet N(0,1): P( z >1.37)=P(z<-1.37)+P(z>1.37)=0.0853+0.0853=0.1706 4

P-verdi Signifikanstest Sannsynlighet for utfall like ekstremt eller mer ekstremt enn faktisk utfall Kalles P-verdi Ekstremt: I forhold til H 0 Liten P-verdi: Sterk bevis mot H 0 Statistisk signifikans Hvordan konkludere? Forkaster H 0 når P-verdi er liten nok Signifikansnivå α: Grenseverdi for når vi forkaster Forkaster når P-verdi α Resultatene er signifikante (P<0.01) Ikke grunnlag for å forkaste når P-verdi>α Typisk: α=0.05 (0.01) Signifikanstest Formuler H 0 og H a Beregn test-observator Finn P-verdi Formuler en konklusjon 5

Tester på populasjonsforventning H 0 :μ=μ 0 Data: x 1,...,x n Estimator for μ: x Testobservator: z=(x - μ 0 )/σ x =(x - μ 0 )/(σ n) Eksempel: Blodtrykk National Center for Health Statistics Menn (35-44): μ=128, σ=15 72 målinger fra en bedrift x =126.07 H 0 :μ=128, H a :μ 128 z=(126.07-128)/(15/ 72)=-1.09 P = 2P(Z -1.09 )=2(1-0.8621)=0.2758 Ingen grunn til å forkaste H 0 6

To-sidige tester og konfidensintervall Konfidensintervall med konfidens C: [x -z*σ/ n, x +z*σ/ n] Verdier av μ utenfor intervall ikke kompatibel med data Mulig test-prosedyre: Forkaste H 0 hvis μ 0 ikke i konfidensintervall Kan vises: Ekvivalent med signifikanstest En tosidig signifikanstest med nivå α for H 0 :μ=μ 0 er ekvivalent med at μ 0 faller utenfor konfidensintervallet for μ med nivå C=1-α Noen ganger enklere å konstruere konfidensintervaller Konfidensintervall: [x -z*σ/ n, x +z*σ/ n] Verdier av 7

P-verdier mot fast nivå α To mulige måter å rapportere: Hvis P-verdi < α, H 0 er forkastet på nivå α Angi P-verdi direkte Testing farmasøytisk produkt Konsentrasjon N(μ,σ=0.0068) H 0 :μ=0.86 H a : μ 0.86 Observasjoner 0.8403, 0.8363, 0.8447 x =0.8404 z=(0.8404-0.86)/(0.0068/ 3)=-4.99 P=2P(Z> -4.99 )=0.0004 Signifikant på 0.05 nivå, 0.01 nivå, 0.001 nivå P-verdi: Laveste signifikantnivå som gir forkastning. Bruk og misbruk av tester Utføre test enkelt (software) Bruke test vanskeligere Kun gyldig under visse forutsetninger Konfidensnivå: Ingen klar grense, vanlig å rapportere P-verdi Forkastning H 0 : Forskjell statistisk signifikant Forskjell kan være liten (hvis n stor) Ingen forkastning behøver ikke bety H 0 er sann Ofte mulig å gjøre mange mulige tester P-verdi relatert til å gjøre en test Hvis mange tester må justeringer gjøres 8

Testing av korrelasjon To variable, H 0 : Ingen korrelasjon 400 observasjoner, r=0.1 Statistisk signifikant med α=0.05 Variasjon forklart av annen variabel: r 2 =0.01 Hiv-behandling Behandlingsgruppe og kontrollgruppe Insidensrateforhold I: Forhold mellom rate i behandlingsgruppe i forhold til kontrollgruppe H 0 : I=1 95% konfidensintervall [0.63,1.58] Ikke nok data til å konkludere Kan både gi forbedringer og forverre! Genomiske eksperimenter Ønsker å finne gen som forklarer sykdom Mange ti-tusner av mulige gen Kan utføre test på hvert gen 10 000 tester, α=0.01 Forventer 100 tester vil være signifikante! Forskning: Hvordan behandle mange tester simultant 9