I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

I dag Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Inferens for forventningen 4l en populasjon (7.1) Kapi@el 6: En antagelse om kjent standardavvik s i populasjonen Nå: Mer realis4sk: Ukjent standardavvik s i populasjonen START KAPITTEL 7

Inferens om forventinger En/to populasjoner Ukjent standardavvik t-fordeling Konfidensintervall Signifikanstester

En populasjon Anta x 1,...,x n uavhengige fra N(μ,σ) Es4mator for μ: x σ kjent: Testobservator z=(x -μ)/(σ/ n) σ ukjent: Testobservator t=(x -μ)/(s/ n) σ/ n standardavvik for es4mator x s/ n es4mert standardavvik for es4mator x SE = s/ n kalles standardfeil (standard error) for x

t-fordeling z=(x -μ)/(σ/ n) er N(0,1)-fordelt t=(x -μ)/(s/ n) er t-fordelt med n-1 frihetsgrader Form som normalfordeling (symmetrisk om 0) Større spredning/usikkerhet pga ukjent σ Nærmer seg N(0,1) når n vokser

1 flervalgsspørsmål

E@-utvalgs konfidensintervall σ kjent: [x -z*σ/ n, x +z*σ/ n] z* er verdien slik at arealet mellom -z* og z* i N(0,1) fordelingen er lik C σ ukjent: [x -t*s/ n, x +t*s/ n] t* er verdien slik at arealet mellom -t* og t* i t(n-1) fordelingen er lik C t*s/ n er feilmarginen Eksakt hvis normalfordelte data Tilnærmet rik4g for stor n ellers

Eksempel C-vitaminer i mais Mengde C-vitaminer i mais (mg/100g) målt som 26 31 23 22 11 22 14 31 95% konfidensintervall for μ x = 22.50, s = 7.19, n = 8 SE x = s/ n = 7.19/ 8 = 2.54 Med n = 8 og n-1 = 7 frihetsgrader blir t* = 2.365 og intervallet [x - t*s/ n, x + t*s/ n] = [22.50-2.365 2.54, 22.50+2.365 2.54] = [16.5, 28.5] Hvis vi ignorerte usikkerheten i s og brukte z* = 1.96 fås intervallet [x -z*σ/ n, x +z*σ/ n] = [17.5, 27.5], som er betraktelig og urealis4sk kortere

E@-utvalgs t-test σ kjent: Hypotesetester for μ basert på testobservator z = (x -μ 0 )/(σ/ n) σ ukjent: Hypotesetester for μ basert på testobservator t = (x -μ 0 )/(s/ n)

Eksempel C-vitaminer i mais Ønsker å teste H 0 : μ = μ 0 = 30 mot H a : μ = μ 0 30 x = 22.50, n = 8, s = 7.19, SE x = s/ n = 7.19/ 8 = 2.54 Testobservator t = (x -μ 0 )/(s/ n) = (22.5-30)/2.54 = -2.95 P-verdi (tosidig) = 0.021 (fra R, 0.020<P-verdi<0.040 fra Tabell D) Hvis vi ignorerer usikkerheten i s og beregner p-verdien basert på normalfordelingen ville vi få@ p-verdi = 0.003, altså alt for lavt!

Ensidig eller tosidig test Må bestemmes ut fra problems4lling Feil å først se på data, så bestemme seg for ensidig test Hvis i tvil, bruk tosidig

t-test i R Ny@ eksempel fra ulvene: Tungt jaktet ulv, får de økt kor4sol-nivå i forhold 4l normal verdi 16.0 pg/mg? Tester H 0 : μ = 16 mot H a : μ > 16 basert på data fra 103 4lfeldig valgte tungt jaktede ulver > t.test(wolf.tungt$cpmg, mu=16, alterna4ve="greater ) One Sample t-test data: wolf.tungt$cpmg t = 1.968, df = 102, p-value = 0.02589 alterna4ve hypothesis: true mean is greater than 16 95 percent confidence interval: 16.16829 Inf sample es4mates: mean of x 17.07495

Matchede par Sammenlignende eksperimenter oye å foretrekke fremfor e@-utvalgs studier Besky@ende mot sammenblandede variable f.eks sammenligne ny medisin med placebo Matchede par studier Individer matchet i par Ønsker par som er mest mulig like To målinger fra samme individ Tvillinger Venstre og høyre fot

Sammenligning av to målemetoder m. MeasureMind 3D Mul4sensor MM3DM er en programvare for måling av kompliserte maskindeler. En bruker av systemet oppdager at ved å slå av en opsjon i prosedyren, reduseres måle4den med 10%. Spørsmålet er om endringen påvirker måle-resultatene. Velger 51 ulike maskindeler. Måler dem med og uten opsjonen. Kaster mynt om hvilken metode som brukes først. Ser på differenser mellom målingene for hver del Differansene er e@ enkelt utvalg Kan bruke metoder for e@-utvalgs data

Målinger for de 20 første maskindelene. Målingene er i micrometer TABLE 7.2 Parts Measurements Using Optical Software Part OptionOn OptionOff Diff Part OptionOn OptionOff Diff 1 118.63 119.01 0.38 11 119.03 118.66 0.37 2 117.34 118.51 1.17 12 118.74 118.88 0.14 3 119.30 119.50 0.20 13 117.96 118.23 0.27 4 119.46 118.65 0.81 14 118.40 118.96 0.56 5 118.12 118.06 0.06 15 118.06 118.28 0.22 6 117.78 118.04 0.26 16 118.69 117.46 1.23 7 119.29 119.25 0.04 17 118.20 118.25 0.05 8 120.26 118.84 1.42 18 119.54 120.26 0.72 9 118.42 117.78 0.64 19 118.28 120.26 1.98 10 119.49 119.66 0.17 20 119.13 119.15 0.02

Histogram for differansen i 51 matchede par

Sammenligning av målinger forts. X i = differansen for maskindel nr. i, antar at X i er N(µ,s) og uavhengige H 0 : μ = 0 mot H a : μ 0 (merk: μ = 0 betyr ingen forskjell) x = 0.0504, s = 0.6943, n = 51 Testobs. t = x / (s/ n) = (0.0504-0)/(0.6943/ 51) = 0.52 P-verdi (tosidig, df=50) = 0.6054 fra R, Tabell D: >0.25 Forskjellen i målinger var ikke sta4s4sk signifikant! OK å slå av opsjonen!

Robusthet av t-test Robust: Insensi4v 4l avvik fra antagelser t-test: Basert på antagelse om normalfordelt populasjon Ikke robust mot uteliggere Robust mot ikke for store avvik fra normalfordeling Mer robust jo større n n < 15: Kun hvis data er nær normale n 15: Kan brukes hvis ingen uteliggere eller sterk skjevhet n 40: Kan brukes selv med sterk skjevhet