Kapittel 7: Inferens for forventningerukjent standardavvik

Like dokumenter
Kapittel 7: Inferens for forventningerukjent standardavvik

Inference for Distributions

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

7.2 Sammenligning av to forventinger

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

6.2 Signifikanstester

Verdens statistikk-dag.

Inferens i fordelinger

ST0202 Statistikk for samfunnsvitere

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

ST0202 Statistikk for samfunnsvitere

Fra første forelesning:

ST0202 Statistikk for samfunnsvitere

Introduksjon til inferens

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Utvalgsfordelinger (Kapittel 5)

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Inferens i regresjon

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Kapittel 3: Studieopplegg

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

TMA4240 Statistikk H2010 (20)

ST0202 Statistikk for samfunnsvitere

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Utvalgsfordelinger (Kapittel 5)

Løsningsforslag Til Statlab 5

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Fasit for tilleggsoppgaver

Seksjon 1.3 Tetthetskurver og normalfordelingen

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Skoleeksamen i SOS Kvantitativ metode

Kapittel 9 og 10: Hypotesetesting

Econ 2130 uke 16 (HG)

Hypotesetest: generell fremgangsmåte

Kapittel 9 og 10: Hypotesetesting

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Kap. 8: Utvalsfordelingar og databeskrivelse

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

TMA4240 Statistikk H2010 (22)

Hypotesetesting. mot. mot. mot. ˆ x

ECON240 VÅR / 2016 BOKMÅL

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

EKSAMENSOPPGAVER STAT100 Vår 2011

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Statistikk og dataanalyse

10.1 Enkel lineær regresjon Multippel regresjon

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Kort overblikk over kurset sålangt

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

HØGSKOLEN I STAVANGER

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk H2010

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Forslag til endringar

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2007

Eksamensoppgave i ST3001

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

LØSNINGSFORSLAG ) = Dvs

Eksamensoppgave i TMA4255 Anvendt statistikk

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

TMA4240 Statistikk H2010

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

Medisinsk statistikk Del I høsten 2009:

Seksjon 1.3 Tetthetskurver og normalfordelingen

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Kapittel 10: Hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010 (19)

Transkript:

Kapittel 7: Inferens for forventningerukjent standardavvik 7.1: Inferens for forventningen i en populasjon 7.2: Inferens for å sammenligne to forventninger

7.1 Inferens for forventningen i en populasjon t-fordelingen Ett-utvalgs t-konfidensintervall Ett-utvalgs t-test Matchede par t-prosedyrer Robusthet

Sweetening colas En cola-produsent ønsker å teste hvor mye søtheten til en ny cola-drikk påvirkes av lagring. Søthets-tapet som følge av lagring ble bedømt av 10 profesjonelle smakstestere (ved å sammenligne søtheten før og etter lagring): Smakstester Søthets-tap 1 2.0 2 0.4 3 0.7 4 2.0 5 0.4 6 2.2 7 1.3 8 1.2 9 1.1 10 2.3 Vi ønsker altså å teste om lagring medfører tap i søthet, altså: H 0 : µ = 0 versus H a : µ > 0 der µ er forventet tap av søthet Dette ser kjent ut. Men siden dette er en ny cola-oppskrift har vi ikke noe populasjonsdata fra tidligere, og vi kjenner ikke populasjonsparameteren σ. Dette er en veldig vanlig situasjon for relle data.

Når σ er ukjent Empirisk standardavvik s gir oss et estimat for populasjonens standardavvik σ. Når utvalgsstørrelsen er stor, er det sannsynlig at utvalget representerer populasjonen godt. Da er s et godt estimat for σ. Men hvis utvalgsstørrelsen er liten, er s et dårlig estimat for σ. Populasjonsfordeling Stort utvalg Lite utvalg

Husk empirisk standardavvik s = 1 n 1 ( x i x) 2 der n-1 kaltes antall frihetsgrader (degrees of freedom, df)

En populasjon Anta x 1,...,x n uavhengige fra N(μ,σ) Observator: x σ kjent: z=(x -μ)/(σ/ n) σ/ n: standardavvik for observator x s/ n: estimert standardavvik for observator x Kalles standardfeil Standard Error, SE = s/ n

t-fordeling z=(x -μ)/(σ/ n) er N(0,1) t=(x -μ)/(s/ n) er t-fordelt med n-1 frihetsgrader t = x µ s n Form som normalfordeling Kalles ett-utvalgs t- observator Ekstra spredning/usikkerhet pga. ukjent σ Nærmer seg N(0,1) når n vokser

Ett-utvalgs t-konfidensintervall σ kjent: [x -z*σ/ n,x +z*σ/ n] z* er verdien slik at arealet mellom -z* og z* i N(0,1) fordelingen er C σ ukjent: [x -t*s/ n,x +t*s/ n] t* er verdien slik at arealet mellom -t* og t* i t(n-1) fordelingen er C

C m m t* t* Feilmarginen er m = t*s/ n Eksakt hvis normalfordelte data Tilnærmet riktig ellers

Tabell D Når σ er ukjent, bruker vi t-fordeling med n 1 frihetsgrader (degrees of freedom df). Tabell D viser z-verdier og t-verdier knyttet til typiske P- verdier/ konfidensnivåer t = x µ s n Når σ er kjent, bruker vi normalfordeling og den standardiserte z-verdien.

Moderate mengder rødvin Å drikke rødvin i moderate mengder kan beskytte mot hjerteinfarkt. Polyphenolene i rødvinen virker på kolesterolet, noe som kanskje kan motvirke hjerteinfarkt. For å undersøke om moderat inntak av rødvin øker forventet nivå av polyphenoler i blodet skulle en gruppe på 9 tilfeldig valgte friske menn drikke en moderat mengde rødvin hver dag i 2 uker. Nivået av polyphenoler i blodet ble målt både før og etter disse 2 ukene, og den prosentvise endringen var som følger: 0.7 3.5 4 4.9 5.5 7 7.4 8.1 8.4 Først: Er dataene tilnærmet normalfordelte? Frequency 4 3 2 1 0 Histogram 2.5 5 7.5 9 More Percentage change in polyphenol blood levels Percent change 9 8 7 6 5 4 3 2 1 0-2 -1 0 1 2 Normal quantiles Det er en lav verdi, men generelt ser det ut til at man kan anta at dataene kan antas å være tilnærmet normalfordelte.

Hva er 95% konfidensintervallet for forventet prosentvis økning av nivå av polyphenoler i blodet? Utvalgs-gjennomsnitt = 5.5; s = 2.517; df = n 1 = 8 Utvalgsfordelingen er en t-fordeling med n 1 frihetsgrader. For df = 8 og C = 95%: t* = 2.306. Feilmarginen m er: m = t*s/ n = 2.306*2.517/ 9 1.93. Med 95% sikkerhet kan vi si at forventet prosentvis økning av nivå av polyphenoler i blodet for friske menn som drikker en moderat mengde rødvin hver dag er mellom 3.6% og 7.4%. Viktig: Konfidensintervallet viser hvor stor endringen er, men ikke om det har en innvirkning på menns helse!

Ett-utvalgs t-test Fremgangsmåten for å teste en hypotese er som tidligere: 1. Formuler null- og alternativ-hypoteser (H 0 versus H a ) 2. Velg signifikansnivå α 3. Beregn t-observator og antall frihetsgrader (beregnet ved å anta at parameterverdien gitt av H 0 er sann) 4. Finn ønsket sannsynlighet fra Tabell D (sannsynligheten for at et utfall er like ekstremt eller mer ekstremt enn faktisk utfall) 5. Oppgi P-verdi og formuler en konklusjon

Søthet av cola (fortsettelse) Er det bevis for at lagring medfører søthets-tap for den nye cola-oppskriften på et 0.05 signifikansnivå (α = 5%)? H 0 : µ = 0 versus H a : µ > 0 (ensidig test) x µ 0 1.02 0 t = = = 2.70 s n 1.196 10 Antall frihetsgrader: df=10-1=9 Taster Sweetness loss 1 2.0 2 0.4 3 0.7 4 2.0 5-0.4 6 2.2 7-1.3 8 1.2 9 1.1 10 2.3 Average 1.02 Standard deviation 1.196 Degrees of freedom n 1 = 9

Tabell D For df = 9 ser vi bare på denne linjen i tabellen Den beregnede verdi av t er 2.7. Vi finner de to nærmeste t-verdiene: 2.398 < t = 2.7 < 2.821 så 0.02 > øvre hale p > 0.01 For en en-sidig H a, er dette P-verdien (mellom 0.01 og 0.02); for en to-sidig H a, hadde P-verdien vært det dobbelte (mellom 0.02 og 0.04).

Søthet av cola (fortsettelse) Er det bevis for at lagring medfører søthets-tap for den nye cola-oppskriften på et 0.05 signifikansnivå (α = 5%)? H 0 : µ = 0 versus H a : µ > 0 (ensidig test) x µ 0 1.02 0 t = = = 2.70 s n 1.196 10 2.398 < t = 2.70 < 2.821 altså 0.02 > p > 0.01. p < α altså er resultatet signifikant. Taster Sweetness loss 1 2.0 2 0.4 3 0.7 4 2.0 5-0.4 6 2.2 7-1.3 8 1.2 9 1.1 10 2.3 Average 1.02 Standard deviation 1.196 Degrees of freedom n 1 = 9 t-testen har en signifikant p-verdi. Vi forkaster H 0. Det er et signifikant forventet tap av søthet som følge av lagring.

Søthet av cola (fortsettelse) Minitab x µ 1.02 0 t = = = s n 1.196 10 df = n 1= 9 2.70

Parrede (matchede) t-prosedyrer Noen ganger vil vi sammenligne behandlinger på de samme individene. Dette gir oss observasjoner som ikke er uavhengige de er parret eller matchede to og to: Eks. Før og etter behandling (blodtrykk før og etter behandling med betablokker, søtsmak før og etter lagring) Eks. Tvillingstudier, begrenser effekten av genetiske forskjeller ved å se på en variabel i sett av tvillinger Eks. Ved å bruke folk som matcher hverandre i alder, kjønn, utdanning i sosiale studier, kan man kansellere ut effekten av slike underliggende lurevariable

I slike situasjoner kan vi bruke par-data til å teste forskjell i forventning mellom de to fordelingene. Vi studerer variabelen X diff = (X 1 X 2 ), og tester H 0 : µ diff = 0 ; H a : µ diff > 0 (eller <0, eller 0) Dette er det samme som å teste i en ett-utvalgssituasjon. Data for individ nr i er da x diff = x 1i - x 2i

Søthet av cola (om igjen) Søthets-tapet pga lagring ble bedømt av 10 profesjonelle smakstestere (som sammenlignet søtheten før og etter): Smakstester Søthets-tap 1 2.0 2 0.4 3 0.7 4 2.0 5 0.4 6 2.2 7 1.3 8 1.2 9 1.1 10 2.3 Vi ønsker å teste om lagring medfører tap I søthet, atltså: H 0 : µ = 0 versus H a : µ > 0 Selv om teksten ikke sa det eksplisitt, er dette et pre-/post-test design og variabelen er differamsem i søthet av cola før (X 1 ) minus etter lagring (X 2 ). En parret signifikanstest er altså akkurat det samme som en ett-utvalgs signifikanstest.

Gir koffeinmangel økt depresjon? 11 individer som er diagnostisert som koffeinavhengige Blir forhindret fra å innta koffein-holdige mat og drikker og får i stedet daglige piller. Noen ganger inneholder disse pillene koffein og noen ganger inneholder de en placebo. Depresjonsnivået ble evaluert. Subject Depression with Caffeine Depression with Placebo Placebo - Cafeine 1 5 16 11 2 5 23 18 3 4 5 1 4 3 7 4 5 8 14 6 6 5 24 19 7 0 6 6 8 0 3 3 9 2 15 13 10 11 12 1 11 1 0-1 Det er 2 datapunkter for hvert individ, men vi ser bare på differansen (x 1i - x 2i ) Utvalgsfordelingen ser ut til å være passende for en t-test. 11 difference data points. DIFFERENCE 20 15 10 5 0-5 -2-1 0 1 2 Normal quantiles

Gir koffeinmangel økt depresjon? For hvert individ i utvalget har vi beregnet foreskjellen i depresjons-nivået (placebo minus koffein). Det var 11 differanse -verdier, altså er df = n 1 = 10. Vi beregner at x = 7.36; s = 6.92 H 0 : µ diff = 0 ; H 0 : µ diff > 0 t = x 0 s n 7.36 = = 3.53 6.92 / 11 Depression with Caffeine Depression with Placebo 1 5 16 11 2 5 23 18 3 4 5 1 4 3 7 4 5 8 14 6 6 5 24 19 7 0 6 6 8 0 3 3 9 2 15 13 10 11 12 1 11 1 0-1 Subject Placebo - Cafeine For df = 10: 3.169 < t = 3.53 < 3.581 0.005 > p > 0.0025 Koffeinmangel gir en signifikant økning av depresjon.

Robusthet t-prosedyrene er eksakt riktige når populasjonen er eksakt normalfordelt. I praksis vil vi ikke alltid ha eksakt normalfordeling, men t-prosedyrene er robuste i forhold til mindre avvik fra normalitet resultatene blir ikke så gale selv om normalitetsantakelsen ikke holder. Viktige faktorer er: Tilfeldig utvalg. Utvalget må være et SRS fra populasjonen. Uteliggere og skjevhet. Påvirker gjennomsnittet og derfor også t-prosedyrene. MEN, betydningen av dette avtar med økende antall observasjoner på grunn av sentralgrenseteoremet (CLT).

Spesielt: Når n < 15, må data være tilnærmet normalfordelte og uten uteliggere Når 15 > n > 40, er det ok med noe skjevhet, men ikke uteliggere Når n > 40, er t-observatoren ok selv med sterk skjevhet i underliggende fordeling