To-utvalgstest (def 8.1) vs ettutvalgstest: Hypotesetesting, to utvalg (Kapitel 8) Longitudinell studie (oppfølgingsstudie) - eqn 8.1. Eksempel 8.



Like dokumenter
Deskriptiv statistikk for sentrum og spredning i fordelingen. Gjennomsnitt og standardavvik. eller

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

TMA4245 Statistikk. Øving nummer 12, blokk II Løsningsskisse. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

TMA4240 Statistikk Høst 2015

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Innhold. Eksempel: Fig. 5.16a. Kovarians. Medisinsk statistikk Del II Forelesning 25 februar 2009 Korrelasjon. Korrelasjon

Hypotesetesting, del 4

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

TMA4240 Statistikk Høst 2016

Løsningsforslag Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

MOT310 Statistiske metoder 1, høsten 2012

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

TMA4240 Statistikk Høst 2015

MOT310 Statistiske metoder 1, høsten 2011

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Løsningsforslag andre obligatoriske oppgave i STK 1110 høsten 2014

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ECON240 Statistikk og økonometri

TMA4240 Statistikk H2010

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Gir vi de resterende 2 oppgavene til én prosess vil alle sitte å vente på de to potensielt tidskrevende prosessene.

Kapittel 8: Estimering

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

TMA4240 Statistikk Eksamen desember 2015

Eksempler fra slutten av forrige uke. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

TMA4245 Statistikk Eksamen mai 2017

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Statistikk og økonomi, våren 2017

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

TMA4240 Statistikk Høst 2009

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Innhold: 4.1 Sannsynlighetsfordeling (for tellevariabler) Læringsmål statistikk (3 og 7 januar 2013) Eksempel - postoperativ kvalme

TMA4240 Statistikk Høst 2016

Kap. 9: Inferens om én populasjon

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Oppgaver fra boka: X 2 X n 1

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Løsningsforslag ST2301 øving 3

Kap. 9: Inferens om én populasjon

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

TMA4245 Statistikk Eksamen 20. desember 2012

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Hypotesetesting, del 5

Løsningsforslag til eksamen i STK desember 2010

TMA4245 Statistikk Eksamen august 2015

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

3MX 2007/8 - Kapittel 5: 8. januar 5. februar 2008

Econ 2130 Forelesning uke 11 (HG)

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Estimering 2. -Konfidensintervall

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

ST1201 Statistiske metoder

Estimering 1 -Punktestimering

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

TMA4245 Statistikk Vår 2015

Mer om utvalgsundersøkelser

TMA4240 Statistikk Høst 2015

n 2 +1) hvis n er et partall.

TMA4240 Statistikk 2014

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

TMA4240/4245 Statistikk 11. august 2012

Estimering 1 -Punktestimering

Populasjon, utvalg og estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Transkript:

Hypotesetestig, to utvalg (Kapitel 8) Medisisk statistikk 009 http://folk.tu.o/slyderse/medstat/medstati_h09.html To-utvalgstest (def 8.) vs ettutvalgstest: To-utvalgstest: Sammelike de uderliggede parameter for to forskjellige grupper, hvor verdiee i begge gruppee er ukjet. Ett-utvalgstest: Sammelike de uderliggede parameter i e gruppe med e kjet verdi (f.eks 0 eller et kjet befolkigsgjeomsitt) Eksempel 8. Er det e sammeheg mellom bruk av p- pille og blodtrykk? Flere studiedesig er mulige 3 Logitudiell studie (oppfølgigsstudie) - eq 8. Idetifiser e gruppe ikke-gravide kvier i fruktbar alder, som ikke bruker p-pille. Mål blodtrykk (baselie) Etter år: Idetifiser e studiegruppe som ikke har vært gravide i periode, og som å bruker p-pille. Mål blodtrykk i studiegruppe. Sammelike verdiee ved år og baselie 4 Tverrsittsstudie (cross-sectioal study) - eq 8. Idetifiser e gruppe som bruker, og e gruppe som ikke bruker, p-pille blat ikkegravide kvier i fruktbar alder Sammelike blodtrykk mellom de to gruppee Matchede par (Eks 8.6) Er det forskjellig fertilitet for p-pille brukere og pessar-brukere? Gruppe består av 0 p-pille brukere. For hver kvie i gruppe idetifiseres e pessar-bruker med samme alder (ie 5 år), rase, paritet, sosio-økoomisk status. Registrere tid til graviditet. 5 6

Parede versus uavhegige utvalg - forskjellig metode To utvalg er paret hvis hver observasjo i første utvalg er relatert til e bestemt observasjo i adre utvalg (f.eks logitudiell studie eller matchede par) To utvalg er uavhegige hvis observasjoee i første utvalg ikke er relatert til observasjoee i adre utvalg (f.eks tverrsittsstudie) Matchede par. Eksempel fra Box, Huter & Huter: Statistics for Experimeters d ed. (005) 7 8 Paret t-test eller kofidesitervall: For hvert par av observasjoer, reg ut differase d = x -x Forvetet differase er Δ =E(D) H 0 : Δ =0 mot H : Δ 0 (evt >0 eller <0) Gjeomfør e ett-utvalgs t-test eller bereg kofidesitervall for Δ basert på differasee d, d,, d Repetisjo: Hvis X, X,..., X er uavhegige N( μσ, ): X μ Da er Z = ~ N(0,). σ / Hvis σ er ukjet brukes S = ( Xi X) = Xi X i= i= X μ Da er T = ~ t S/ Z eller T brukes til å sette opp e hypotesetest eller kofidesitervall for μ. Hvis er stor så er T tilærmet N( μσ, ) 9 0 Eksempel 8.5 (Tabell 8.) =0, d = 4.80, s =0.85=4.566 Tosidig test, t=3.3 Fier 0.00 < p < 0.0 vha Tabell 5 i Appedix EXCEL: =TDIST(3,3;9;) gir verdie p=0.00894

95% kofidesitervall for Δ: d t s, α / / 9 0.975 4.8.6 4.566 / 0 = 4.80 3.7 t-test og kofidesitervall for to uavhegige utvalg observasjoer, atas uavh. N(μ, σ ) observasjoer, atas uavh. N(μ, σ ) H 0 : μ = μ mot H : μ μ Ekvivalet: H 0 : μ -μ =0 mot H : μ - μ 0 Atar foreløpig lik varias, σ = σ = σ dvs.53 til 8.07 (mmhg) 3 4 Estimator for μ μ: X X ( μ μ ) ~ 0, σ σ Altså: N ( ) Hvis σ σ σ σ σ X X ~ N μ μ, X X ( μ μ ) ~ 0, σ = = så er N ( ) Me σ er ukjet og estimeres ved pooled estimate of the variace : S = ( Xi X) ( Xi X ) i= i= = S S Vi bruker at X X ( μ μ) ~ t S 5 6 Eks 8.9 Cardiovascular Disease, Hypertesio Suppose a sample of eight 35- to 39-year-old opregat, premeopausal OC users who work i a compay are idetified who have mea systolic blood pressure of 3.86 mm Hg ad sample stadard deviatio of 5.34 mm Hg. A sample of twety-oe 35- to 39 year-old opregat, premeopausal o-oc users are similarly idetified who have mea systolic blood pressure of 7.44 mm Hg ad sample stadard deviatio of 8.3 mm Hg. What ca be said about the uderlyig mea differece i blood pressure betwee the two groups? Eks 8.0 lik varias =8, x =3.86, s =5.34 =, x =7.44, s =8.3 H 0: μ -μ =0 7 0 x x = 5.4, s = 5.34 8.3 = 307.8 = 7.53 7 7 5.4( 0) t = = 0.74 7.53 8 Frihetsgrader: 8-=7, forhast H 0 på 5% ivå hvis 0.74 >.05 P-verdi f.eks EXCEL TFORDELING(0,74;7;)=0.47 7 8 3

Eks 8. Lik varias 95% kofidesitervall Pr( t T t) = α, hvor t = t =.05 X X ( μ μ) t t S, α / 7 0.975 to uavhegige utvalg, ulik varias observasjoer, atas uavh. N(μ, σ ) observasjoer, atas uavh. N(μ, σ ) H 0 : μ = μ mot H : μ μ Ulik varias, σ σ løser mhp μ μ : 9.5 μ μ 0.36 9 0 To utvalg, σ σ : Vi bruker Satterthwaite s metode : Eks 8. (utvidet) Ulik varias X X ( μ μ) ~ t d ' S S tilærmet, t = x x = 0.8 s s hvor atall frihetsgrader d bereges ut fra,s,,s. ( S / S / ) d ' = ( S / ) /( ) ( S / ) /( ) d' = 5.04 ( d'' = 5) p verdi = 0.43 to uavhegige utvalg, test for ulik varias observasjoer, atas uavh. N(μ, σ ) observasjoer, atas uavh. N(μ, σ ) H 0 : σ = σ mot H : σ σ Ekvivalet: H 0 : σ /σ = mot H : σ /σ Forkast H 0 hvis S /S avviker mye fra Uder H 0 : S /S F -, - (Fisherfordelt med - og - frihetsgrader) SPSS bruker Levee s test i stede for Fisher s test 3 Eksempel 8.6 F = S /S = 8.3 /5.34 =.4 Forkast H 0 : σ /σ = på ivå α=0.05 hvis F > F 0,7,0.975 = 4.47 (FINV(0,05;0;7) i EXCEL) eller F< F 0,7,0.0.05 = 0.33 (FINV(0,975;0;7) i EXCEL) Alterativt: p-verdi = * 0.335 = 0.67 (FDIST(,4;0;7)) Koklusjo: Vi forkaster ikke H 0 4 4

Equatio 8.4 Nedre p-persetil i e F-fordelig med d og d frihetsgrader er de iverse av de øvre p-persetile i e F-fordelig med d og d frihetsgrader: F = / F d, d, p d, d, p Roser, Figure 8.0 Strategy for testig the equality of meas i two idepedet, ormally distributed samples Sigificat Perform F test for the equality of two variaces i Equatio 8.5 Not sigificat (Nyttig hvis tabelle bare iholder øvre persetiler) Perform t test assumig uequal variaces i Equatio 8. Perform t test assumig equal variaces i Equatio 8. 5 6 MEN: Navidi: Statistics for Egieers ad Scietists, 006, page 343-344: Do t Assume the Populatio Variaces are Equal Just Because the Sample Variaces are Close 7 the expressio assumig equal variaces requires that the populatio variaces be equal, or early so. I situatios where the sample variaces are early equal, it is temptig to assume that the populatio variaces are early equal as well. However, whe the sample sizes are small, the sample variaces are ot ecessarily good approximatios to the populatio variaces. Thus it is possible that the sample variaces be close eve whe the populatio variaces are fairly far apart. I geeral, populatio variaces should be assumed equal oly whe there is kowledge about the processes that produced the data that justifies this assumptio. 8 the expressio ot assumig equal variaces produces good results i almost all cases, whether the populatio variaces are equal or ot. (Exceptios ca occur whe the sample sizes are very differet.) Therefore, whe i doubt, use the expressio ot assumig equal variaces. Altså: t-test eller kofidesitervall for differase mellom forvetigsverdee i to uavhegige, ormalfordelte utvalg Du atar lik varias (eq 8.) ulik varias (eq 8.) Virkelig lik varias ulik varias korrekt gir feil svar tilærmet samme svar som ovefor korrekt 9 Altså: Velg t-test for ulik varias, eller e ikke-parametrisk metode, hvis du er i tvil! 30 5

Percet Percet Hvis data ikke er ormalfordelt: 30% Ma Kvie t-tester fugerer brukbart ved begreset variasjo i data t-tester er ubrukelige hvis mage sterkt avvikede verdier ( outliers ). Ikke-parametriske metoder er brukbare uasett. F-teste for sammelikig av varias er lite robust mot avvik fra ormalfordelige. 0% 0% 0% 5,00 0,00 5,00 30,00 35,00 5,00 0,00 5,00 30,00 35,00 bmi bmi Nær ormalfordelig - t-test er bra 3 3 50 Kvier 0-5 år Kvier 40-45 år 5% 40 0% 30 5% 0 0% 0 geder 5% Percet 0 - ot at all - a little 3 - partly 4 - very much female male -0,00-5,00 0,00 5,00 gsfer -0,00-5,00 0,00 5,00 gsfer do you feel depressed? Begreset variasjo i data. T-test er brukbar - eller bruk ikke-parametriske metoder 33 T-test er ubrukelig - beytt ikke-parametriske metoder 34 35 36 6

Kosetrasjo av serum IgM (g/l) hos 98 friske bar, 6 md - 6 år gamle (Altma, 99) 37 38 39 7