Inference for Distributions

Like dokumenter
Kapittel 7: Inferens for forventningerukjent standardavvik

Kapittel 7: Inferens for forventningerukjent standardavvik

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Inferens i fordelinger

TMA4240 Statistikk H2015

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fra første forelesning:

Verdens statistikk-dag.

TMA4240 Statistikk H2010

Kapittel 3: Studieopplegg

Foreleses onsdag 13.oktober, 2010

Utvalgsfordelinger (Kapittel 5)

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

ST0202 Statistikk for samfunnsvitere

6.2 Signifikanstester

ST0202 Statistikk for samfunnsvitere

7.2 Sammenligning av to forventinger

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Databases 1. Extended Relational Algebra

Introduksjon til inferens

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Passasjerer med psykiske lidelser Hvem kan fly? Grunnprinsipper ved behandling av flyfobi

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Fasit for tilleggsoppgaver

UNIVERSITETET I OSLO

Slope-Intercept Formula

Skoleeksamen i SOS Kvantitativ metode

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

ST0202 Statistikk for samfunnsvitere

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Dagens tema: Eksempel Klisjéer (mønstre) Tommelfingerregler

6.1 Kontinuerlig uniform fordeling

Exercise 1: Phase Splitter DC Operation

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

UNIVERSITETET I OSLO

Eksamen PSY1010 / PSY1010P / PSYC1100 Forskningsmetode I

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Seksjon 1.3 Tetthetskurver og normalfordelingen

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

ST0202 Statistikk for samfunnsvitere Kapittel 11: Anvendelser av kjikvadratfordelingen Kapittel 12: Variansanalyse (ANOVA)

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Lydia Rice, Doctoral Student University of Arkansas Advisor: Jean-François Meullenet

UNIVERSITETET I OSLO

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Emneevaluering GEOV272 V17

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

10.1 Enkel lineær regresjon Multippel regresjon

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Speed Racer Theme. Theme Music: Cartoon: Charles Schultz / Jef Mallett Peanuts / Frazz. September 9, 2011 Physics 131 Prof. E. F.

UNIVERSITETET I OSLO

Statistisk analyse av data fra planlagte forsøk

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Minimumskrav bør være å etablere at samtykke ikke bare må være gitt frivillig, men også informert.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Generelle lineære modeller i praksis

Eksamen PSY1010 / PSYC1100 Forskningsmetode I

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2014

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Utvalgsfordelinger (Kapittel 5)

Accuracy of Alternative Baseline Methods

Medisinsk statistikk Del I høsten 2009:

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001)

Eksamensoppgave i ST3001

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Emnedesign for læring: Et systemperspektiv

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Løsningsforslag øving 9, ST1301

Hypotesetest: generell fremgangsmåte

Transkript:

Inference for Distributions IPS Chapter 7 7.1: Inference for the Mean of a Population 7.2: Comparing Two Means 7.3: Optional Topics in Comparing Distributions 2012 W.H. Freeman and Company

7.1 Inferens for forventningen i en fordeling t-fordelingen Ett-utvalgs t-konfidensintervall Ett-utvalgs t-test Matchede par t-prosedyrer Robusthet

Sweetening colas Cola manufacturers want to test how much the sweetness of a new cola drink is affected by storage. The sweetness loss due to storage was evaluated by 10 professional tasters (by comparing the sweetness before and after storage): Taster Sweetness loss 1 2.0 2 0.4 3 0.7 4 2.0 5 0.4 6 2.2 7 1.3 8 1.2 9 1.1 10 2.3 Obviously, we want to test if storage results in a loss of sweetness, thus: H 0 : µ = 0 versus H a : µ > 0 This looks familiar. However, here we do not know the population parameter σ. The population of all cola drinkers is too large. Since this is a new cola recipe, we have no population data. This situation is very common with real data.

Når σ er ukjent Empirisk standardavvik s gir oss et estimat for populasjonens standardavvik σ. Når utvalgsstørrelsen er stor, er det sannsynlig at utvalget representerer populasjonen godt. Da er s et godt estimat for σ. Men hvis utvalgsstørrelsen er liten, er s et dårlig estimat for σ. Population distribution Large sample Small sample

Husk empirisk standardavvik s = 1 n 1 ( x i x) 2 der n-1 kaltes antall frihetsgrader (degrees of freedom, df)

En populasjon Anta x 1,...,x n uavhengige fra N(μ,σ) Observator: x σ kjent: z=(x -μ)/(σ/ n) σ/ n standardavvik for observator x s/ n estimert standardavvik for observator x Kalles standard feil Standard Error, SE = s/ n

t-fordeling z=(x -μ)/(σ/ n) er N(0,1) t=(x -μ)/(s/ n) er t-fordelt med n-1 frihetsgrader t = x µ s n Form som normalfordeling Kalles ett-utvalgs t- observator Ekstra spredning/usikkerhet pga. ukjent σ Nærmer seg N(0,1) når n vokser

Ett-utvalgs t-konfidensintervall σ kjent: [x -z*σ/ n,x +z*σ/ n] z* er verdien slik at arealet mellom -z* og z* i N(0,1) fordelingen er C σ ukjent: [x -t*s/ n,x +t*s/ n] t* er verdien slik at arealet mellom -t* og t* i t(n-1) fordelingen er C

C m m t* t* t*s/ n er feilmarginen m Eksakt hvis normalfordelte data Tilnærmet riktig ellers

Tabell D Når σ er ukjent, bruker vi t-fordeling med n 1 frihetsgrader (degrees of freedom df). Tabell D viser z-verdier og t-verdier knyttet til typiske P- verdier/ konfidensnivåer t = x µ s n Når σ er kjent, bruker vi normalfordeling og den standardiserte z-verdien.

Red wine, in moderation Drinking red wine in moderation may protect against heart attacks. The polyphenols it contains act on blood cholesterol, likely helping to prevent heart attacks. To see if moderate red wine consumption increases the average blood level of polyphenols, a group of nine randomly selected healthy men were assigned to drink half a bottle of red wine daily for two weeks. Their blood polyphenol levels were assessed before and after the study, and the percent change is presented here: Firstly: Are the data approximately normal? 0.7 3.5 4 4.9 5.5 7 7.4 8.1 8.4 Frequency 4 3 2 1 0 Histogram 2.5 5 7.5 9 More Percentage change in polyphenol blood levels Percent change 9 8 7 6 5 4 3 2 1 0-2 -1 0 1 2 Normal quantiles There is a low value, but overall the data can be considered reasonably normal.

What is the 95% confidence interval for the average percent change? Sample average = 5.5; s = 2.517; df = n 1 = 8 ( ) The sampling distribution is a t distribution with n 1 degrees of freedom. For df = 8 and C = 95%, t* = 2.306. The margin of error m is: m = t*s/ n = 2.306*2.517/ 9 1.93. With 95% confidence, the population average percent increase in polyphenol blood levels of healthy men drinking half a bottle of red wine daily is between 3.6% and 7.4%. Important: The confidence interval shows how large the increase is, but not if it can have an impact on men s health.

Ett-utvalgs t-test Fremgangsmåten for å teste en hypotese er som tidligere: 1. Formuler null- og alternativ-hypoteser (H 0 versus H a ) 2. Velg signifikansnivå α 3. Beregn t-observator og antall frihetsgrader 4. Finn ønsket sannsynlighet fra Tabell D 5. Oppgi P-verdi og formuler en konklusjon

Tabell D For df = 9 ser vi bare på denne linjen i tabellen For en en-sidig H a, er dette P-verdien (mellom 0.01 og 0.02); for en to-sidig H a, er P-verdien det dobbelte (mellom 0.02 og 0.04). Den beregnede verdi av t er 2.7. Vi finner de to nærmeste t-verdiene: 2.398 < t = 2.7 < 2.821 så 0.02 > upper tail p > 0.01

Sweetening colas (continued) Is there evidence that storage results in sweetness loss for the new cola recipe at the 0.05 level of significance (α = 5%)? H 0 : µ = 0 versus H a : µ > 0 (one-sided test) x µ 0 1.02 0 t = = = 2.70 s n 1.196 10 2.398 < t = 2.70 < 2.821 thus 0.02 > p > 0.01. p < α thus the result is significant. Taster Sweetness loss 1 2.0 2 0.4 3 0.7 4 2.0 5-0.4 6 2.2 7-1.3 8 1.2 9 1.1 10 2.3 Average 1.02 Standard deviation 1.196 Degrees of freedom n 1 = 9 The t-test has a significant p-value. We reject H 0. There is a significant loss of sweetness, on average, following storage.

Sweetening colas (continued) Minitab x µ 1.02 0 t = = = s n 1.196 10 df = n 1= 9 2.70

Parrede (matchede) t-prosedyrer Noen ganger vil vi sammenligne behandlinger på de samme individene. Dette gir oss observasjoner som ikke er uavhengige de er parret eller matchede to og to: Eks. Før og etter behandling (blodtrykk før og etter behandling med betablokker, søtsmak før og etter lagring) Eks. Tvillingstudier, begrenser effekten av genetiske forskjeller ved å se på en variabel i sett av tvillinger Eks. Ved å bruke folk som matcher hverandre i alder, kjønn, utdanning i sosiale studier, kan man kansellere ut effekten av slike underliggende lurevariable

I slike situasjoner kan vi bruke par-data til å teste forskjell i forventning mellom de to fordelingene. Vi studerer variabelen X diff = (X 1 X 2 ), og tester H 0 : µ diff = 0 ; H a : µ diff > 0 (eller <0, eller 0) Dette er det samme som å teste i en ett-utvalgssituasjon.

Sweetening colas (revisited) The sweetness loss due to storage was evaluated by 10 professional tasters (comparing the sweetness before and after storage): Taster Sweetness loss 1 2.0 2 0.4 3 0.7 4 2.0 5 0.4 6 2.2 7 1.3 8 1.2 9 1.1 10 2.3 We want to test if storage results in a loss of sweetness, thus: H 0 : µ = 0 versus H a : µ > 0 Although the text didn t mention it explicitly, this is a pre-/post-test design and the variable is the difference in cola sweetness before minus after storage. A matched pairs test of significance is indeed just like a one-sample test.

Does lack of caffeine increase depression? Individuals diagnosed as caffeine-dependent are deprived of caffeine-rich foods and assigned to receive daily pills. Sometimes, the pills contain caffeine and other times they contain a placebo. Depression was assessed. Subject Depression with Caffeine Depression with Placebo Placebo - Cafeine 1 5 16 11 2 5 23 18 3 4 5 1 4 3 7 4 5 8 14 6 6 5 24 19 7 0 6 6 8 0 3 3 9 2 15 13 10 11 12 1 11 1 0-1 There are 2 data points for each subject, but we only look at the difference. The sample distribution appears appropriate for a t-test. 11 difference data points. DIFFERENCE 20 15 10 5 0-5 -2-1 0 1 2 Normal quantiles

Does lack of caffeine increase depression? For each individual in the sample, we have calculated a difference in depression score (placebo minus caffeine). There were 11 difference points, thus df = n 1 = 10. We calculate that x = 7.36; s = 6.92 H 0 : µ diff = 0 ; H 0 : µ diff > 0 x 0 t = s n 7.36 = = 3.53 6.92 / 11 Depression with Caffeine Depression with Placebo 1 5 16 11 2 5 23 18 3 4 5 1 4 3 7 4 5 8 14 6 6 5 24 19 7 0 6 6 8 0 3 3 9 2 15 13 10 11 12 1 11 1 0-1 Subject Placebo - Cafeine For df = 10, 3.169 < t = 3.53 < 3.581 0.005 > p > 0.0025 Caffeine deprivation causes a significant increase in depression.

Robusthet t-prosedyrene er eksakt riktige når populasjonen er eksakt normalfordelt. I praksis vil vi ikke alltid ha eksakt normalfordeling, men t-prosedyrene er robuste i forhold til mindre avvik fra normalitet resultatene blir ikke så gale selv om normalitetsantakelsen ikke holder. Viktige faktorer er: Tilfeldig utvalg. Utvalget må være et SRS fra populasjonen. Uteliggere og skjevhet. Påvirker gjennomsnittet og derfor også t-prosedyrene. MEN, betydningen av dette avtar med økende antall observasjoner på grunn av sentralgrenseteoremet (CLT).

Spesielt: Når n < 15, må data være tilnærmet normalfordelte og uten uteliggere Når 15 > n > 40, er det ok med noe skjevhet, men ikke uteliggere Når n > 40, er t-observatoren ok selv med sterk skjevhet i underliggende fordeling