Verdens statistikk-dag.

Like dokumenter
Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

6.2 Signifikanstester

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Introduksjon til inferens

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Kapittel 3: Studieopplegg

Kapittel 7: Inferens for forventningerukjent standardavvik

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk H2010 (22)

Inferens i fordelinger

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010 (19)

Hypotesetesting. mot. mot. mot. ˆ x

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Fasit for tilleggsoppgaver

i x i

TMA4240 Statistikk Høst 2007

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2016

Econ 2130 uke 16 (HG)

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Hypotesetesting av λ og p. p verdi.

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Kapittel 10: Hypotesetesting

ST0202 Statistikk for samfunnsvitere

Hypotesetest: generell fremgangsmåte

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Kapittel 9 og 10: Hypotesetesting

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner

ST0202 Statistikk for samfunnsvitere

Kapittel 7: Inferens for forventningerukjent standardavvik

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

UNIVERSITETET I OSLO

TMA4240 Statistikk 2014

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen desember 2016

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

ÅMA110 Sannsynlighetsregning med statistikk, våren

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Statistikk og dataanalyse

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4240 Statistikk

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Løsningsforslag statistikkeksamen desember 2014

Kan vi stole på resultater fra «liten N»?

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Notat 3 - ST februar 2005

ECON240 VÅR / 2016 BOKMÅL

Estimering og hypotesetesting

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

Estimering og hypotesetesting

HØGSKOLEN I STAVANGER

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Forskningsmetoder i menneske-maskin interaksjon

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

TMA4240 Statistikk Høst 2015

Utvalgsfordelinger (Kapittel 5)

ST0202 Statistikk for samfunnsvitere

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

ST0202 Statistikk for samfunnsvitere

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Eksamensoppgåve i TMA4240 Statistikk

UNIVERSITETET I OSLO

Fra første forelesning:

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Transkript:

Verdens statistikk-dag http://unstats.un.org/unsd/wsd/

Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator under antatt hypotese Hvis sannsynlighet liten, forkast hypotese

Eksempel studentlån Gjennomsnittelig lån studenter : x 1=$21200 ved private skoler x 2=$17100 ved offentlige skoler Forskjell $4100, reell eller tilfeldig? P( x 1-x 2 4100 Lik)=0.17 Ikke så overraskende resultat, data gir ikke grunnlag for å si at det er forskjeller i lånenivå

Studentlån Gjennomsnittelig lån i 1997 er x 1=$11400 i 2002 er x 2=$18900 Forskjell $7500 P( x 1-x 2 7500 Lik)=0.00004 Data gir grunnlag for å forkaste hypotese om at det er forskjeller i lånenivå

Hovedtrinn Spørsmål: Forskjell mellom nivåer (forventninger) Ser om data er kompatibel med ingen forskjell Hvis overraskende stor forskjell Forkast antagelse om ingen forskjell Hvis ikke overraskende forskjell Ikke grunnlag i data for å si det er forskjell

Hypoteser Null-hypotese H 0 Påstand som ønskes testes Typisk: Ingen effekt/forskjell H 0 : μ=0 eventuelt μ 1 =μ 2 Signifikanstest Designet for å angi bevisstyrke mot H 0 Alternativ hypotese H a Det er en effekt/forskjell H a : μ 0 eventuelt μ 1 μ 2

Test observator Baserer test på en observator som estimerer parameteren vi er interessert i x 1 -x 2 estimerer μ 1 -μ 2 Verdier langt fra parameterverdi under H 0 gir bevis mot H 0 H a angir hvilken retning som teller: H a : μ 1 > μ 2 angir at vi må ha stor x 1 -x 2 H a : μ 1 < μ 2 angir at vi må ha liten x 1 -x 2 H a : μ 1 μ 2 angir at vi må ha stor x 1 -x 2

Standardisert test-observator Starter med estimat parameterverdi under H 0 Følsom for skala, bedre med z = estimat parameterverdiunderh 0 standardavvikforestimat

Eksempel studielån H 0 : μ 1 = μ 2 mot H a :μ 1 μ 2 H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1 -x 2 Eksempel: σ x 1-x 2 =3000 z=(4000-0)/3000 = 1.37 z tilnærmet N(0,1): (= 4100) P( z >1.37)=P(z<-1.37)+P(z>1.37)=0.0853+0.0853=0.1706

P-verdi Signifikanstest Sannsynlighet for utfall like ekstremt eller mer ekstremt enn faktisk utfall Kalles P-verdi Ekstremt: I forhold til H 0 Liten P-verdi: Sterk bevis mot H 0

Statistisk signifikans Hvordan konkludere? Forkaster H 0 når P-verdi er liten nok Signifikansnivå α: Grenseverdi for når vi forkaster Forkaster når P-verdi α Resultatene er signifikante (P<0.01) Ikke grunnlag for å forkaste når P-verdi>α Typisk: α=0.05 (0.01)

Signifikanstest Formuler H 0 og H a Beregn test-observator Finn P-verdi Formuler en konklusjon

Tester på populasjonsforventning H 0 :μ=μ 0 Data: x 1,...,x n Estimator for μ: x Testobservator: z=(x - μ 0 )/σ x =(x - μ 0 )/(σ n)

Eksempel: Blodtrykk National Center for Health Statistics Menn (35-44): μ=128, σ=15 72 målinger fra en bedrift x =126.07 H 0 :μ=128, H a :μ 128 z=(126.07-128)/(15/ 72)=-1.09 P = 2P(Z -1.09 )=2(1-0.8621)=0.2758 Ingen grunn til å forkaste H 0

To-sidige tester og konfidensintervall Konfidensintervall med konfidens C: [x -z*σ/ n, x +z*σ/ n] Verdier av μ utenfor intervall ikke kompatibel med data Mulig test-prosedyre: Forkaste H 0 hvis μ 0 ikke i konfidensintervall Kan vises: Ekvivalent med signifikanstest En tosidig signifikanstest med nivå α for H 0 :μ=μ 0 er ekvivalent med at μ 0 faller utenfor konfidensintervallet for μ med nivå C=1-α Noen ganger enklere å konstruere konfidensintervaller

P-verdier mot fast nivå α To mulige måter å rapportere: Hvis P-verdi < α, H 0 er forkastet på nivå α Angi P-verdi direkte Testing farmasøytisk produkt Konsentrasjon N(μ,σ=0.0068) H 0 :μ=0.86 H a : μ 0.86 Observasjoner 0.8403, 0.8363, 0.8447 x =0.8404 z=(0.8404-0.86)/(0.0068/ 3)=-4.99 P=2P(Z> -4.99 )=0.0004 Signifikant på 0.05 nivå, 0.01 nivå, 0.001 nivå P-verdi: Laveste signifikantnivå som gir forkastning.

Bruk og misbruk av tester Utføre test enkelt (software) Bruke test vanskeligere Kun gyldig under visse forutsetninger Konfidensnivå: Ingen klar grense, vanlig å rapportere P-verdi Forkastning H 0 : Forskjell statistisk signifikant Forskjell kan være liten (hvis n stor) Ingen forkastning behøver ikke bety H 0 er sann Ofte mulig å gjøre mange mulige tester P-verdi relatert til å gjøre en test Hvis mange tester må justeringer gjøres

Testing av korrelasjon To variable, H 0 : Ingen korrelasjon 400 observasjoner, r=0.1 Statistisk signifikant med α=0.05 Variasjon forklart av annen variabel: r 2 =0.01

Hiv-behandling Behandlingsgruppe og kontrollgruppe Insidensrateforhold I: Forhold mellom rate i behandlingsgruppe i forhold til kontrollgruppe H 0 : I=1 95% konfidensintervall [0.63,1.58] Ikke nok data til å konkludere Kan både gi forbedringer og forverre!

Genomiske eksperimenter Ønsker å finne gen som forklarer sykdom Mange ti-tusner av mulige gen Kan utføre test på hvert gen 10 000 tester, α=0.01 Forventer 100 tester vil være signifikante! Forskning: Hvordan behandle mange tester simultant