Multisample Inference del (Rosner.5.7) Inger Johanne Baen Enhet for anvendt linis forsning, NTNU og Avdeling for forebyggende helsearbeid, SINTEF Inference oversettes med Sluttsats inference n. a. The act or process of deriving logical conclusions from premises nown or assumed to be true. b. The act of reasoning from factual nowledge or evidence. Innhold.-.4: One-Way Analysis of Variance (ANOVA) ********.5 Case study, effect of lead exposure Sammenheng ANOVA og lineær regresjon ANCOVA (Én ategorivariabel + ovariater).6 Two-Way Analysis of Variance (To ategorivariable).7 The Krusall-Wallis Test (Ie-parametris versjon av one-way ANOVA) ANOVA Modell: y ij = μ i + e ij = μ + α i + e ij y ij : j-te observasjon i utvalg fra gruppe i μ i : forventningsverdien i gruppe i μ : forventningsverdien for alle observasjonene grand mean α i : avviet i gruppe i fra grand mean Altman Friedmans test (Ie-parametris versjon av two-way ANOVA) 4 Between SS = n i j= ANOVA ( y y) i ANOVA (tabell) Kilde SS df MS F Within SS = ni ( yij yi j= ) Between A - A/(-) MS between /MS within Within B n- B/(n-) SS = n i j= ( y y) ij A+B n- 5 6
Esempel: Lead exposure Sammenheng ANOVA og lineær regresjon Data ligger på fagets hjemmeside: lead without outliers.sav Hentet fra Rosner CD Beregnet MAXFWT Fjernet outliers (!) Group angir ontroll () tidligere esponert () esponert nå () http://fol.ntnu.no/slyderse/medstat/klmed8005/ 7 8 Box plot MAXFWT ANOVA (Group) Report maxfwt Lead_type Control Currently exposed Previously exposed Mean N Std. Deviation 55,0 6 0,95 47,59 7 7,080 49,40 5 0,97 5,85 95 0,68 maxfwt Between Groups Within Groups ANOVA Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 967,46 9 05, 067,97 94 9 0 Multippel lineær regresjon vs ANOVA Koding av indiatorvariable En ategoris variabel C med nivåer an representeres med - dummy variable x = hvis C=, ellers 0 x = hvis C=, ellers 0 x = hvis C=, ellers 0 Referansegruppen er gitt når alle x er = 0
Her har vi: Lineær regresjon C Grp 0 0 Grp 0 0 Modell: y = α 0 + β * grp + β * grp + e Model Model Regression Residual (Constant) grp grp ANOVA b Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 a 967,46 9 05, 067,97 94 a. Predictors: (Constant), grp, grp Coefficients a b. Dependent Variable: maxfwt Unstandardized Standardized Coefficients Coefficients B Std. Error Beta t Sig. 55,095,9 4,65,000-7,507,80 -,7 -,679,009-5,695,946 -,96 -,9,056 a. Dependent Variable: maxfwt 4 ANOVA vs Lineær regresjon ANOVA maxfwt Between Groups Within Groups Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 967,46 9 05, 067,97 94 ANCOVA Model Regression Residual a. Predictors: (Constant), grp, grp b. Dependent Variable: maxfwt ANOVA b (fra lineær regresjon) Sum of Squares df Mean Square F Sig. 966,79 48,95 4,598,0 a 967,46 9 05, 067,97 94 5 6 ANCOVA ANOVA + justering for ovariater (en lineær regresjonsmodell) Fordeler: Justering for onfunderende fatorer Mer presis estimering Esempel. s 589: y = α 0 + β * grp + β * grp + β * age + β 4 * sex + e Model Regression Residual Regression - > Linear ANOVA b Sum of Squares df Mean Square F Sig. 607,809 4 504,45 9,07,000 a 460,8 90 5,5 067,97 94 a. Predictors: (Constant), sex, grp, age, grp b. Dependent Variable: maxfwt 7 8
Model Regression - > Linear (forts) (Constant) grp grp age sex a. Dependent Variable: maxfwt Unstandardized Coefficients Coefficients a Standardized Coefficients B Std. Error Beta t Sig.,958,0 0,85,000-5,78,974 -,9 -,674,009-4,97,06 -,70 -,9,09,04,00,705 9,99,000 -,408,55 -, -,589,6 General linear model - > Univariate Dependent Variable: maxfwt Source Corrected Model Intercept age sex group Error Corrected Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 607,809 a 4 504,45 9,07,000 557,87 557,87 00,475,000 5050,89 5050,89 98,80,000 9,6 9,6,55,6 549,784 74,89 5,55,006 460,8 90 5,5 760,000 95 067,97 94 a. R Squared =,566 (Adjusted R Squared =,546) 9 0 General linear model - > Univariate (forts) Dependent Variable: maxfwt Parameter Intercept age sex [group=] [group=] [group=] Parameter Estimates 95% Confidence Interval Partial Eta B Std. Error t Sig. Lower Bound Upper Bound Squared 9,0,5 8,70,000,057 6,006,4,04,00 9,99,000,00,09,5 -,408,55 -,589,6-5,48,60,07 4,97,06,9,09,8 9,0,060 -,5,548 -,8,89-5,4 4,70,000 0 a...... a. This parameter is set to zero because it is redundant. Linear regression vs General linear model Samme modell og dermed samme resultater Ved bru av linear regression: Dummyvariable for ategorise variable med mer enn to nivåer (group i vårt esempel) Artiler om ANCOVA Pococ SJ et al: Subgroup analysis, covariate adjustment and baseline comparison in clinical trial reporting: current practice and problems. Statistics in Medicine 00; : 97-90 Vicers AJ and Altman DG: Statistics notes: Analysing controlled trials with baseline and follow-up measurements. BMJ 00; : -4 Klinis, randomisert utprøving, sammenligning av ulie behandlinger Måler en gitt variabel før og etter behandling Alternative analyser av effet av behandling: Follow-up scores Change scores Analysis of covariance (ANCOVA) 4 4
Follow-up vs Change Score Follow-up vs Change Score Higher baseline scores (by chance) in treatment group? Follow-up score analysis overestimates effect Change score analysis underestimates effect (regression to the mean) Average baseline scores equal? Unbiased effect estimate in both analyses, but low power (wide confidence intervals) Vicers & Altman Results of trial of acupuncture for shoulder pain Placebo (mean) Acupuncture (mean) Difference p Baseline 5,9 60,4 6,5 Analysis Follow-up 6, 79,6 7, 0,008 Change score 8,4 9, 0,8 0,04 Vicers & Altman 00 5 6 Follow-up vs Change Score vs ANCOVA Results of trial of acupuncture for shoulder pain Placebo (mean) Acupuncture (mean) Difference p Baseline 5,9 60,4 6,5 Analysis Follow-up 6, 79,6 7, 0,008 Change score 8,4 9, 0,8 0,04 ANCOVA,7 0,005 ANCOVA Follow-up score = constant + a x baseline score + b x group = constant + 0,7 x baseline score +,7 x group Vicers & Altman 00 Vicers & Altman 00 7 8 Pretreatment and post-treatment scores in each group showing fitted lines Korrelasjon og justering Sva orrelasjon (ρ < 0,) Manglende balanse i ovariatene uten betydning Ster orrelasjon (ρ > 0,5) Vitig å justere for ovariater selv ved balanse mellom gruppene Estimert forsjell mellom gruppene fra ANCOVA er vertial avstand mellom linjene Vicers & Altman Pococ, tredje avsnitt s 94 NB Vanligvis ster orrelasjon mellom baseline og outcome (es fedme) Copyright 00 BMJ Publishing Group Ltd. 9 0 5
Korrelasjon mellom ovariat og og behandlingseffet (:) Sann α = 0,05 ρ = 0: manglende balanse har ingen betydning for resultatene Betydning av orrelasjon mellom ovariat og behandlingseffet (:) Sann α = 0,05 (effet av behandling) ρ = 0,7: x har stor betydning for resultatene, også ved perfet balanse Z x = 0: p=0,00 Z x =,5: p=0,0 Z x = -,5: p < 0,000 Esempel fra Rosner.6 To-veis variansanalyse Table.4 s 59 (. i 5th ed) Mean systolic blood pressure by dietary group and sex 4 To-veis variansanalyse (Modell en-veis: y ij = μ + α i + e ij ) Modell to-veis: y ij = μ + α i + β j + γ ij + e ij Hvor: y ij Målt verdi for person nr i rad i og olonne j μ Forventningsverdien alle obs under ett Grand mean α i Effet av rad i β j Effet av olonne j γ ij Interasjon/samspill mellom rad i og olonne j e ij Støyledd (Normalfordelt med forventningsverdi 0 og variasjon σ ) To-veis variansanalyse (Modell en-veis: y ij = μ + α i + e ij ) Modell to-veis: I vårt esempel har vi: tre rader (diettgrupper) to olonner (to jønn) y ij = μ + α i + β j + γ ij + e ij 5 6 6
Fremgangsmåte Test først samspill, dvs test hypotesen H 0 : γ ij =0 for alle i og j Hvis samspill er signifiant, gå videre med modellen (Eq.) y ij = μ + α i + β j + γ ij + e ij Konvensjon: r c αi = β j = 0 γ ij = j= c r j= γ = 0 ij Samspill Hvis det er samspill er effet av rad forsjellig i forsjellige olonner. (I dette tilfellet: effeten av diett ville vært avhengig av jønn) Hvis samspillet ie er signifiant brues modell uten samspill y ij = μ + α i + β j + e ij 7 8 Samspill () Samspill () Linjene er (tilnærmet) parallelle, ie samspill Effet av alohol er avhengig av jønn: samspill 9 40 Esempel. s 597.6 (forts) To-veis ANCOVA Diett og jønn, betydning for blodtry Justerer for alder og vet Ser bort fra interasjon, modellen blir: y = μ + β *x + β *x + β *jønn + β 4 *alder + β 5 *vet + e 4 4 7
Sammenlining grupper.7 Rosner & Altman..5: Ie-parametrise tester 4 44 Esempel Tabell.7 Rosner. Ocular anti-inflammatory effets of 4 drugs on lid closure NB! 4 aniner! 45 46 Krusall-Wallis test (s 60, 60) Uten ties : Med ties : * H = H = N( N + ) * H = N( N + ) Ri ( N + ) n i i n ( Ri R) NB! Alle n i 5 NB Six rabbits in each group t 4 aniner hvor t j er antall sammenfallende observasjoner i lynge nr j Under H 0 er H hivadratfordelt med - frihetsgrader 47 48 8
SPSS: Nonparametric tests -> independent samples score med 4 Rans N Mean Ran 6 6,5 6 4,7 6 5,5 6 4, 4 Test Statistics a,b Chi-Square df Asymp. Sig. Exact Sig. Point Probability a. Krusal Wallis Test score,804,008,00,000 b. Grouping Variable: med Hvile grupper er forsjellige? Dunn prosedyren (ie i SPSS): Regn ut: z = ij Ri R N( N + ) x( + ) n n Forast H 0 hvis z >z -α* hvor α* = α/(-) j i j 49 50 Mer om 4 aniner z = 0,5 z =0,4 z 4 =,9 z =-0,7 z 4 =,4 z 4 =,67 α* = α/(-)=0,005/(4*(4-))=0,004 z -0,004 =,64 Friedmans to-veis ANOVA Krever ie normalfordeling n subjeter og grupper. Få eller ingen sammenfallende observasjoner (for hvert subjeter) H 0 : Ingen forsjell på gruppene Altså: Gruppe og 4 er statistis signifiant forsjellige Gruppe og 4 er statistis signifiant forsjellige 5 5 Tabell.9 Altman 8 personer tester 4 forsjellige redningsdrater (A, B, C, D) id A B C D. 08 454 64 0 56 0 8 8 4 96 0 4 68 4 64 90 5 66 8 4 4 6 96 458 6 7 98 50 00 90 8 8 74 6 4 snitt 98 8 0 45,7 id A B C D. 4 4 4 4 4 5 4 6 4 7 4 8 4 R(tot) 4 7 9 0 Friedmans test H= n( + ) R n( + ) i Hvor H er tilnærmet χ - under H 0 I esempelet er: H= *(4 * 7 *9 *0 ) *8*(4 + ) =,45 8* 4*(4 + ) p = P (χ -,45)=0,006 5 54 9
Friedmans test i SPSS Analyze - > Nonparametric tests - > related samples Velg opsjonen exact Hvile grupper er forsjellige? Friedmans test viser om minst to grupper er statistis signifiant forsjellige Par av grupper an sammenlines ved hjelp av Wilcoxon test for matchede par. Juster for multiple sammenlininger A B C D Rans Mean Ran,00,8,8,5 Test Statistics a 8 N Chi-Square df Asymp. Sig. Exact Sig. Point Probability,450,006,00,000 Friedmans test for grupper tilsvarer tegntesten a. Friedman Test 55 56 Noen esempler i SPSS Dagens tema var Diettdatasettet fra Rosner-boa ie tilgjengelig Velger esempeldatasett fra Andy Field: Discovering Statistics with SPSS: Libido.sav (ANCOVA med en fixed variabel og justering for én ovariat) Googles.sav (to-veis ANOVA med interasjon) ANOVA en-veis og to-veis ANCOVA Sammenhengen med lineær regresjon I SPSS: ANOVA one-way, linear regression, General linear model UNIVARIATE Ie-parametrise tester for multiple sammenlininger (ie-parede og parede) 57 58 0