I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Like dokumenter
Kapittel 7: Inferens for forventningerukjent standardavvik

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kapittel 7: Inferens for forventningerukjent standardavvik

Inference for Distributions

Inferens i fordelinger

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0202 Statistikk for samfunnsvitere

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Seksjon 1.3 Tetthetskurver og normalfordelingen

Introduksjon til inferens

ST0202 Statistikk for samfunnsvitere

Verdens statistikk-dag.

6.2 Signifikanstester

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Fra første forelesning:

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Seksjon 1.3 Tetthetskurver og normalfordelingen

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (20)

10.1 Enkel lineær regresjon Multippel regresjon

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

7.2 Sammenligning av to forventinger

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Utvalgsfordelinger (Kapittel 5)

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

UNIVERSITETET I OSLO

Fasit for tilleggsoppgaver

EKSAMENSOPPGAVER STAT100 Vår 2011

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Kapittel 3: Studieopplegg

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

TMA4240 Statistikk H2010

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Løsningsforslag Til Statlab 5

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Statistikk og dataanalyse

Inferens i regresjon

LØSNINGSFORSLAG ) = Dvs

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4240 Statistikk H2010 (22)

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

UNIVERSITETET I OSLO

TMA4240 Statistikk H2015

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

i x i

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Utvalgsfordelinger (Kapittel 5)

Kap. 12: Variansanalyse

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4255 Anvendt statistikk

TMA4240 Statistikk Høst 2016

Kapittel 9 og 10: Hypotesetesting

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

Testobservator for kjikvadrattester

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

TMA4240 Statistikk H2010

Norske hoppdommere og Janne Ahonen

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kapittel 10: Hypotesetesting

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

TMA4240 Statistikk 2014

Hypotesetesting. mot. mot. mot. ˆ x

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Econ 2130 uke 16 (HG)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Skoleeksamen i SOS Kvantitativ metode

Kort overblikk over kurset sålangt

Transkript:

I dag Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Inferens for forventningen 4l en populasjon (7.1) Kapi@el 6: En antagelse om kjent standardavvik s i populasjonen Nå: Mer realis4sk: Ukjent standardavvik s i populasjonen START KAPITTEL 7

Inferens om forventinger En/to populasjoner Ukjent standardavvik t-fordeling Konfidensintervall Signifikanstester

En populasjon Anta x 1,...,x n uavhengige fra N(μ,σ) Es4mator for μ: x σ kjent: Testobservator z=(x -μ)/(σ/ n) σ ukjent: Testobservator t=(x -μ)/(s/ n) σ/ n standardavvik for es4mator x s/ n es4mert standardavvik for es4mator x SE = s/ n kalles standardfeil (standard error) for x

t-fordeling z=(x -μ)/(σ/ n) er N(0,1)-fordelt t=(x -μ)/(s/ n) er t-fordelt med n-1 frihetsgrader Form som normalfordeling (symmetrisk om 0) Større spredning/usikkerhet pga ukjent σ Nærmer seg N(0,1) når n vokser

1 flervalgsspørsmål

E@-utvalgs konfidensintervall σ kjent: [x -z*σ/ n, x +z*σ/ n] z* er verdien slik at arealet mellom -z* og z* i N(0,1) fordelingen er lik C σ ukjent: [x -t*s/ n, x +t*s/ n] t* er verdien slik at arealet mellom -t* og t* i t(n-1) fordelingen er lik C t*s/ n er feilmarginen Eksakt hvis normalfordelte data Tilnærmet rik4g for stor n ellers

Eksempel C-vitaminer i mais Mengde C-vitaminer i mais (mg/100g) målt som 26 31 23 22 11 22 14 31 95% konfidensintervall for μ x = 22.50, s = 7.19, n = 8 SE x = s/ n = 7.19/ 8 = 2.54 Med n = 8 og n-1 = 7 frihetsgrader blir t* = 2.365 og intervallet [x - t*s/ n, x + t*s/ n] = [22.50-2.365 2.54, 22.50+2.365 2.54] = [16.5, 28.5] Hvis vi ignorerte usikkerheten i s og brukte z* = 1.96 fås intervallet [x -z*σ/ n, x +z*σ/ n] = [17.5, 27.5], som er betraktelig og urealis4sk kortere

2 flervalgsspørsmål

E@-utvalgs t-test σ kjent: Hypotesetester for μ basert på testobservator z = (x -μ 0 )/(σ/ n) σ ukjent: Hypotesetester for μ basert på testobservator t = (x -μ 0 )/(s/ n)

Eksempel C-vitaminer i mais Ønsker å teste H 0 : μ = μ 0 = 30 mot H a : μ = μ 0 30 x = 22.50, n = 8, s = 7.19, SE x = s/ n = 7.19/ 8 = 2.54 Testobservator t = (x -μ 0 )/(s/ n) = (22.5-30)/2.54 = -2.95 P-verdi (tosidig) = 0.021 (fra R, 0.020<P-verdi<0.040 fra Tabell D) Hvis vi ignorerer usikkerheten i s og beregner p-verdien basert på normalfordelingen ville vi få@ p-verdi = 0.003, altså alt for lavt!

Ensidig eller tosidig test Må bestemmes ut fra problems4lling Feil å først se på data, så bestemme seg for ensidig test Hvis i tvil, bruk tosidig

t-test i R Ny@ eksempel fra ulvene: Tungt jaktet ulv, får de økt kor4sol-nivå i forhold 4l normal verdi 16.0 pg/mg? Tester H 0 : μ = 16 mot H a : μ > 16 basert på data fra 103 4lfeldig valgte tungt jaktede ulver > t.test(wolf.tungt$cpmg, mu=16, alterna4ve="greater ) One Sample t-test data: wolf.tungt$cpmg t = 1.968, df = 102, p-value = 0.02589 alterna4ve hypothesis: true mean is greater than 16 95 percent confidence interval: 16.16829 Inf sample es4mates: mean of x 17.07495

Matchede par Sammenlignende eksperimenter oye å foretrekke fremfor e@-utvalgs studier Besky@ende mot sammenblandede variable f.eks sammenligne ny medisin med placebo Matchede par studier Individer matchet i par Ønsker par som er mest mulig like To målinger fra samme individ Tvillinger Venstre og høyre fot

Sammenligning av to målemetoder m. MeasureMind 3D Mul4sensor MM3DM er en programvare for måling av kompliserte maskindeler. En bruker av systemet oppdager at ved å slå av en opsjon i prosedyren, reduseres måle4den med 10%. Spørsmålet er om endringen påvirker måle-resultatene. Velger 51 ulike maskindeler. Måler dem med og uten opsjonen. Kaster mynt om hvilken metode som brukes først. Ser på differenser mellom målingene for hver del Differansene er e@ enkelt utvalg Kan bruke metoder for e@-utvalgs data

Målinger for de 20 første maskindelene. Målingene er i micrometer TABLE 7.2 Parts Measurements Using Optical Software Part OptionOn OptionOff Diff Part OptionOn OptionOff Diff 1 118.63 119.01 0.38 11 119.03 118.66 0.37 2 117.34 118.51 1.17 12 118.74 118.88 0.14 3 119.30 119.50 0.20 13 117.96 118.23 0.27 4 119.46 118.65 0.81 14 118.40 118.96 0.56 5 118.12 118.06 0.06 15 118.06 118.28 0.22 6 117.78 118.04 0.26 16 118.69 117.46 1.23 7 119.29 119.25 0.04 17 118.20 118.25 0.05 8 120.26 118.84 1.42 18 119.54 120.26 0.72 9 118.42 117.78 0.64 19 118.28 120.26 1.98 10 119.49 119.66 0.17 20 119.13 119.15 0.02

Histogram for differansen i 51 matchede par

Sammenligning av målinger forts. X i = differansen for maskindel nr. i, antar at X i er N(µ,s) og uavhengige H 0 : μ = 0 mot H a : μ 0 (merk: μ = 0 betyr ingen forskjell) x = 0.0504, s = 0.6943, n = 51 Testobs. t = x / (s/ n) = (0.0504-0)/(0.6943/ 51) = 0.52 P-verdi (tosidig, df=50) = 0.6054 fra R, Tabell D: >0.25 Forskjellen i målinger var ikke sta4s4sk signifikant! OK å slå av opsjonen!

Robusthet av t-test Robust: Insensi4v 4l avvik fra antagelser t-test: Basert på antagelse om normalfordelt populasjon Ikke robust mot uteliggere Robust mot ikke for store avvik fra normalfordeling Mer robust jo større n n < 15: Kun hvis data er nær normale n 15: Kan brukes hvis ingen uteliggere eller sterk skjevhet n 40: Kan brukes selv med sterk skjevhet

1 flervalgsspørsmål