Multisample Inference del 2 (Rosner )



Like dokumenter
Multisample Inference del 2 (Rosner ) Øyvind Salvesen

Innhold. Multisample inference - del 2 (Rosner, ) Data Effect of Lead Exposure (Eks. i Rosner Kap mm)

Generelle lineære modeller i praksis

Lineære modeller i praksis

Referanser: Tegntesten (The sign test) Ikke-parametriske metoder. Ikke-parametriske metoder. Parametriske vs ikke-parametriske metoder

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Variansanalyse. Uke Variansanalyse. ANOVA=ANalysis Of Variance

Klassisk ANOVA/ lineær modell

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

Eksamensoppgave i ST3001

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

EXAMINATION PAPER. Exam in: STA-3300 Applied statistics 2 Date: Wednesday, November 25th 2015 Time: Kl 09:00 13:00 Place: Teorifagb.

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

UNIVERSITETET I OSLO

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Multippel lineær regresjon

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

UNIVERSITETET I OSLO

Statistisk analyse av data fra planlagte forsøk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Fra krysstabell til regresjon

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Forelesning 7 STK3100

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

FINAL EXAM. Exam in: STA-3300 Applied Statistics 2 Date: Wednesday 28. November Time: 09:00 13:00 Place: Åsgårdvegen 9. All printed and written

UNIVERSITETET I OSLO

SOS3003 Eksamensoppgåver

Forelesning 8 STK3100/4100

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

EKSAMENSOPPGAVER STAT100 Vår 2011

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Forskningsprosjektet. Repeterte målinger på én time. Eksempel 1. Eksempel 2. Eksempel

Eksamensoppgave i TMA4255 Anvendt statistikk

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

- All printed and written. The exam contains 16 pages included this cover page

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Frequencies. Frequencies

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Variansanalyse og lineær regresjon notat til STK2120

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Frequencies. Frequencies

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

Eksamensoppgåve i TMA4255 Anvendt statistikk

Analyse med uavhengige variabler på nominal- /ordinalnivå

Eksamensoppgåve i TMA4255 Anvendt statistikk

Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

EXAMINATION PAPER. Exam in: STA-3300 Date: Wednesday 27. November 2013 Time: Kl 09:00 13:00 Place: Åsgårdsv All printed and written

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgave i TMA4255 Anvendt statistikk

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

UNIVERSITETET I OSLO

Forelesning 3 STK3100

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Forelesning 13 Regresjonsanalyse

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Checking Assumptions

Kp. 12 Multippel regresjon

Eksamensoppgave i TMA4255 Anvendt statistikk

Kapittel 3: Studieopplegg

EXAMINATION PAPER. Exam in: STA-3300 Date: Time: Kl 09:00 13:00 Place: B154, Administrasjonsbygget.

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

MOT310 Statistiske metoder 1, høsten 2011

Oppgave N(0, 1) under H 0. S t n 3

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

Transkript:

Multisample Inference del (Rosner.5.7) Inger Johanne Baen Enhet for anvendt linis forsning, NTNU og Avdeling for forebyggende helsearbeid, SINTEF Inference oversettes med Sluttsats inference n. a. The act or process of deriving logical conclusions from premises nown or assumed to be true. b. The act of reasoning from factual nowledge or evidence. Innhold.-.4: One-Way Analysis of Variance (ANOVA) ********.5 Case study, effect of lead exposure Sammenheng ANOVA og lineær regresjon ANCOVA (Én ategorivariabel + ovariater).6 Two-Way Analysis of Variance (To ategorivariable).7 The Krusall-Wallis Test (Ie-parametris versjon av one-way ANOVA) ANOVA Modell: y ij = μ i + e ij = μ + α i + e ij y ij : j-te observasjon i utvalg fra gruppe i μ i : forventningsverdien i gruppe i μ : forventningsverdien for alle observasjonene grand mean α i : avviet i gruppe i fra grand mean Altman Friedmans test (Ie-parametris versjon av two-way ANOVA) 4 Between SS = n i j= ANOVA ( y y) i ANOVA (tabell) Kilde SS df MS F Within SS = ni ( yij yi j= ) Between A - A/(-) MS between /MS within Within B n- B/(n-) SS = n i j= ( y y) ij A+B n- 5 6

Esempel: Lead exposure Sammenheng ANOVA og lineær regresjon Data ligger på fagets hjemmeside: lead without outliers.sav Hentet fra Rosner CD Beregnet MAXFWT Fjernet outliers (!) Group angir ontroll () tidligere esponert () esponert nå () http://fol.ntnu.no/slyderse/medstat/klmed8005/ 7 8 Box plot MAXFWT ANOVA (Group) Report maxfwt Lead_type Control Currently exposed Previously exposed Mean N Std. Deviation 55,0 6 0,95 47,59 7 7,080 49,40 5 0,97 5,85 95 0,68 maxfwt Between Groups Within Groups ANOVA Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 967,46 9 05, 067,97 94 9 0 Multippel lineær regresjon vs ANOVA Koding av indiatorvariable En ategoris variabel C med nivåer an representeres med - dummy variable x = hvis C=, ellers 0 x = hvis C=, ellers 0 x = hvis C=, ellers 0 Referansegruppen er gitt når alle x er = 0

Her har vi: Lineær regresjon C Grp 0 0 Grp 0 0 Modell: y = α 0 + β * grp + β * grp + e Model Model Regression Residual (Constant) grp grp ANOVA b Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 a 967,46 9 05, 067,97 94 a. Predictors: (Constant), grp, grp Coefficients a b. Dependent Variable: maxfwt Unstandardized Standardized Coefficients Coefficients B Std. Error Beta t Sig. 55,095,9 4,65,000-7,507,80 -,7 -,679,009-5,695,946 -,96 -,9,056 a. Dependent Variable: maxfwt 4 ANOVA vs Lineær regresjon ANOVA maxfwt Between Groups Within Groups Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 967,46 9 05, 067,97 94 ANCOVA Model Regression Residual a. Predictors: (Constant), grp, grp b. Dependent Variable: maxfwt ANOVA b (fra lineær regresjon) Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 a 967,46 9 05, 067,97 94 5 6 ANCOVA ANOVA + justering for ovariater (en lineær regresjonsmodell) Fordeler: Justering for onfunderende fatorer Mer presis estimering Esempel. s 589: y = α 0 + β * grp + β * grp + β * age + β 4 * sex + e Model Regression Residual Regression - > Linear ANOVA b Sum of Squares df Mean Square F Sig. 607,809 4 504,45 9,07,000 a 460,8 90 5,5 067,97 94 a. Predictors: (Constant), sex, grp, age, grp b. Dependent Variable: maxfwt 7 8

Model Regression - > Linear (forts) (Constant) grp grp age sex a. Dependent Variable: maxfwt Unstandardized Coefficients Coefficients a Standardized Coefficients B Std. Error Beta t Sig.,958,0 0,85,000-5,78,974 -,9 -,674,009-4,97,06 -,70 -,9,09,04,00,705 9,99,000 -,408,55 -, -,589,6 General linear model - > Univariate Dependent Variable: maxfwt Source Corrected Model Intercept age sex group Error Corrected Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 607,809 a 4 504,45 9,07,000 557,87 557,87 00,475,000 5050,89 5050,89 98,80,000 9,6 9,6,55,6 549,784 74,89 5,55,006 460,8 90 5,5 760,000 95 067,97 94 a. R Squared =,566 (Adjusted R Squared =,546) 9 0 General linear model - > Univariate (forts) Dependent Variable: maxfwt Parameter Intercept age sex [group=] [group=] [group=] Parameter Estimates 95% Confidence Interval Partial Eta B Std. Error t Sig. Lower Bound Upper Bound Squared 9,0,5 8,70,000,057 6,006,4,04,00 9,99,000,00,09,5 -,408,55 -,589,6-5,48,60,07 4,97,06,9,09,8 9,0,060 -,5,548 -,8,89-5,4 4,70,000 0 a...... a. This parameter is set to zero because it is redundant. Linear regression vs General linear model Samme modell og dermed samme resultater Ved bru av linear regression: Dummyvariable for ategorise variable med mer enn to nivåer (group i vårt esempel) Artiler om ANCOVA Pococ SJ et al: Subgroup analysis, covariate adjustment and baseline comparison in clinical trial reporting: current practice and problems. Statistics in Medicine 00; : 97-90 Vicers AJ and Altman DG: Statistics notes: Analysing controlled trials with baseline and follow-up measurements. BMJ 00; : -4 Klinis, randomisert utprøving, sammenligning av ulie behandlinger Måler en gitt variabel før og etter behandling Alternative analyser av effet av behandling: Follow-up scores Change scores Analysis of covariance (ANCOVA) 4 4

Follow-up vs Change Score Follow-up vs Change Score Higher baseline scores (by chance) in treatment group? Follow-up score analysis overestimates effect Change score analysis underestimates effect (regression to the mean) Average baseline scores equal? Unbiased effect estimate in both analyses, but low power (wide confidence intervals) Vicers & Altman Results of trial of acupuncture for shoulder pain Placebo (mean) Acupuncture (mean) Difference p Baseline 5,9 60,4 6,5 Analysis Follow-up 6, 79,6 7, 0,008 Change score 8,4 9, 0,8 0,04 Vicers & Altman 00 5 6 Follow-up vs Change Score vs ANCOVA Results of trial of acupuncture for shoulder pain Placebo (mean) Acupuncture (mean) Difference p Baseline 5,9 60,4 6,5 Analysis Follow-up 6, 79,6 7, 0,008 Change score 8,4 9, 0,8 0,04 ANCOVA,7 0,005 ANCOVA Follow-up score = constant + a x baseline score + b x group = constant + 0,7 x baseline score +,7 x group Vicers & Altman 00 Vicers & Altman 00 7 8 Pretreatment and post-treatment scores in each group showing fitted lines Korrelasjon og justering Sva orrelasjon (ρ < 0,) Manglende balanse i ovariatene uten betydning Ster orrelasjon (ρ > 0,5) Vitig å justere for ovariater selv ved balanse mellom gruppene Estimert forsjell mellom gruppene fra ANCOVA er vertial avstand mellom linjene Vicers & Altman Pococ, tredje avsnitt s 94 NB Vanligvis ster orrelasjon mellom baseline og outcome (es fedme) Copyright 00 BMJ Publishing Group Ltd. 9 0 5

Korrelasjon mellom ovariat og og behandlingseffet (:) Sann α = 0,05 ρ = 0: manglende balanse har ingen betydning for resultatene Betydning av orrelasjon mellom ovariat og behandlingseffet (:) Sann α = 0,05 (effet av behandling) ρ = 0,7: x har stor betydning for resultatene, også ved perfet balanse Z x = 0: p=0,00 Z x =,5: p=0,0 Z x = -,5: p < 0,000 Esempel fra Rosner.6 To-veis variansanalyse Table.4 s 59 (. i 5th ed) Mean systolic blood pressure by dietary group and sex 4 To-veis variansanalyse (Modell en-veis: y ij = μ + α i + e ij ) Modell to-veis: y ij = μ + α i + β j + γ ij + e ij Hvor: y ij Målt verdi for person nr i rad i og olonne j μ Forventningsverdien alle obs under ett Grand mean α i Effet av rad i β j Effet av olonne j γ ij Interasjon/samspill mellom rad i og olonne j e ij Støyledd (Normalfordelt med forventningsverdi 0 og variasjon σ ) To-veis variansanalyse (Modell en-veis: y ij = μ + α i + e ij ) Modell to-veis: I vårt esempel har vi: tre rader (diettgrupper) to olonner (to jønn) y ij = μ + α i + β j + γ ij + e ij 5 6 6

Fremgangsmåte Test først samspill, dvs test hypotesen H 0 : γ ij =0 for alle i og j Hvis samspill er signifiant, gå videre med modellen (Eq.) y ij = μ + α i + β j + γ ij + e ij Konvensjon: r c αi = β j = 0 γ ij = j= c r j= γ = 0 ij Samspill Hvis det er samspill er effet av rad forsjellig i forsjellige olonner. (I dette tilfellet: effeten av diett ville vært avhengig av jønn) Hvis samspillet ie er signifiant brues modell uten samspill y ij = μ + α i + β j + e ij 7 8 Samspill () Samspill () Linjene er (tilnærmet) parallelle, ie samspill Effet av alohol er avhengig av jønn: samspill 9 40 Esempel. s 597.6 (forts) To-veis ANCOVA Diett og jønn, betydning for blodtry Justerer for alder og vet Ser bort fra interasjon, modellen blir: y = μ + β *x + β *x + β *jønn + β 4 *alder + β 5 *vet + e 4 4 7

Sammenlining grupper.7 Rosner & Altman..5: Ie-parametrise tester 4 44 Esempel Tabell.7 Rosner. Ocular anti-inflammatory effets of 4 drugs on lid closure NB! 4 aniner! 45 46 Krusall-Wallis test (s 60, 60) Uten ties : Med ties : * H = H = N( N + ) * H = N( N + ) Ri ( N + ) n i i n ( Ri R) NB! Alle n i 5 NB Six rabbits in each group t 4 aniner hvor t j er antall sammenfallende observasjoner i lynge nr j Under H 0 er H hivadratfordelt med - frihetsgrader 47 48 8

SPSS: Nonparametric tests -> independent samples score med 4 Rans N Mean Ran 6 6,5 6 4,7 6 5,5 6 4, 4 Test Statistics a,b Chi-Square df Asymp. Sig. Exact Sig. Point Probability a. Krusal Wallis Test score,804,008,00,000 b. Grouping Variable: med Hvile grupper er forsjellige? Dunn prosedyren (ie i SPSS): Regn ut: z = ij Ri R N( N + ) x( + ) n n Forast H 0 hvis z >z -α* hvor α* = α/(-) j i j 49 50 Mer om 4 aniner z = 0,5 z =0,4 z 4 =,9 z =-0,7 z 4 =,4 z 4 =,67 α* = α/(-)=0,005/(4*(4-))=0,004 z -0,004 =,64 Friedmans to-veis ANOVA Krever ie normalfordeling n subjeter og grupper. Få eller ingen sammenfallende observasjoner (for hvert subjeter) H 0 : Ingen forsjell på gruppene Altså: Gruppe og 4 er statistis signifiant forsjellige Gruppe og 4 er statistis signifiant forsjellige 5 5 Tabell.9 Altman 8 personer tester 4 forsjellige redningsdrater (A, B, C, D) id A B C D. 08 454 64 0 56 0 8 8 4 96 0 4 68 4 64 90 5 66 8 4 4 6 96 458 6 7 98 50 00 90 8 8 74 6 4 snitt 98 8 0 45,7 id A B C D. 4 4 4 4 4 5 4 6 4 7 4 8 4 R(tot) 4 7 9 0 Friedmans test H= n( + ) R n( + ) i Hvor H er tilnærmet χ - under H 0 I esempelet er: H= *(4 * 7 *9 *0 ) *8*(4 + ) =,45 8* 4*(4 + ) p = P (χ -,45)=0,006 5 54 9

Friedmans test i SPSS Analyze - > Nonparametric tests - > related samples Velg opsjonen exact Hvile grupper er forsjellige? Friedmans test viser om minst to grupper er statistis signifiant forsjellige Par av grupper an sammenlines ved hjelp av Wilcoxon test for matchede par. Juster for multiple sammenlininger A B C D Rans Mean Ran,00,8,8,5 Test Statistics a 8 N Chi-Square df Asymp. Sig. Exact Sig. Point Probability,450,006,00,000 Friedmans test for grupper tilsvarer tegntesten a. Friedman Test 55 56 Noen esempler i SPSS Dagens tema var Diettdatasettet fra Rosner-boa ie tilgjengelig Velger esempeldatasett fra Andy Field: Discovering Statistics with SPSS: Libido.sav (ANCOVA med en fixed variabel og justering for én ovariat) Googles.sav (to-veis ANOVA med interasjon) ANOVA en-veis og to-veis ANCOVA Sammenhengen med lineær regresjon I SPSS: ANOVA one-way, linear regression, General linear model UNIVARIATE Ie-parametrise tester for multiple sammenlininger (ie-parede og parede) 57 58 0