Praktisk om kursene. Øvingene (forts.) Øvingene. KLMED8005 Medisinsk statistikk del II Innhold: KLMED8006 Anvendt medisinsk statistikk

Like dokumenter
Praktisk om kursene. Øvingene (forts.) Øvingene. KLMED8005 Medisinsk statistikk del II Innhold: KLMED8006 Anvendt medisinsk statistikk

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Forelesning 10 Kjikvadrattesten

Epidemiology. Epidemiology. Rosner, Chapter 13: Tabell Disease Yes No Yes a b a+b=n 1 No c d c+d=n 2 a+c=m 1 b+d=m 2.

Kapittel 3: Studieopplegg

Eksamensoppgave i ST3001

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

ST0202 Statistikk for samfunnsvitere Kapittel 11: Anvendelser av kjikvadratfordelingen Kapittel 12: Variansanalyse (ANOVA)

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Eksamen ST2303 Medisinsk statistikk Onsdag 3 juni 2009 kl

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

TMA4240 Statistikk 2014

Logistisk regresjon 1

Referanser: Tegntesten (The sign test) Ikke-parametriske metoder. Ikke-parametriske metoder. Parametriske vs ikke-parametriske metoder

Testobservator for kjikvadrattester

Slope-Intercept Formula

ST0202 Statistikk for samfunnsvitere

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Testobservator for kjikvadrattester

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Logistisk regresjon 2

Medisinsk statistikk Del I høsten 2009:

Passasjerer med psykiske lidelser Hvem kan fly? Grunnprinsipper ved behandling av flyfobi

Formelsamling i medisinsk statistikk

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Eksamen ST2303 Medisinsk statistikk Torsdag 30 november 2006 kl

Lese og presentere statistikk i medisinske forskningsartikler

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Statistisk analyse av data fra planlagte forsøk

Exercise 1: Phase Splitter DC Operation

Databases 1. Extended Relational Algebra

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Anvendt medisinsk statistikk Vår 2010 Diagnostiske tester

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Oppgave 1a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet.

Fasit for tilleggsoppgaver

UNIVERSITETET I OSLO

TMA4240 Statistikk H2010 (22)

HØGSKOLEN I NARVIK - SIVILINGENIØRUTDANNINGEN

Dynamic Programming Longest Common Subsequence. Class 27

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Eksamen ST2303 Medisinsk statistikk Tirsdag 6 desember 2005 kl

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

Emnedesign for læring: Et systemperspektiv

TMA4240 Statistikk Høst 2013

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Multisample Inference del 2 (Rosner ) Øyvind Salvesen

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Christmas in the round A Holiday Prism for Band. Preview Only

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Neural Network. Sensors Sorter

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Variansanalyse. Uke Variansanalyse. ANOVA=ANalysis Of Variance

The Norwegian Citizen Panel, Accepted Proposals

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Anvendt medisinsk statistikk Vår 2008 Diagnostiske tester. Oversikt. Hierarki (Thornbury 1991)

Bioberegninger, ST november 2006 Kl. 913 Hjelpemidler: Alle trykte og skrevne hjelpemidler, lommeregner.

Eksamen ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister. Nynorsk/Bokmål

UNIVERSITETET I OSLO

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Den som gjør godt, er av Gud (Multilingual Edition)

TMA 4255 Forsøksplanlegging og anvendte statistiske metoder. Høsten 2008

TMA 4255 Forsøksplanlegging og anvendte statistiske metoder

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMENSOPPGAVE KLH3004 Medisinsk statistikk (Medical statistics) KLMED8004 Medisinsk statistikk, del I (Medical Statistics, Part I)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Stationary Phase Monte Carlo Methods

UNIVERSITETET I OSLO

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

SVM and Complementary Slackness

Levetid (varighet av en tilstand)

UNIVERSITETET I OSLO

Innhold. Multisample inference - del 2 (Rosner, ) Data Effect of Lead Exposure (Eks. i Rosner Kap mm)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ST0202 Statistikk for samfunnsvitere

EXAMINATION PAPER. Exam in: STA-3300 Applied statistics 2 Date: Wednesday, November 25th 2015 Time: Kl 09:00 13:00 Place: Teorifagb.

Løsningsforslag eksamen STAT100 Høst 2010

Oppsummering av STK2120. Geir Storvik

Datahandling and presentation. Themes. Respekt og redelighet Masterseminar, Frode Volden

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Information search for the research protocol in IIC/IID

IN2010: Algoritmer og Datastrukturer Series 2

Splitting the differential Riccati equation

PSi Apollo. Technical Presentation

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013

10.1 Enkel lineær regresjon Multippel regresjon

Generelle lineære modeller i praksis

STK Oppsummering

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen

Kort overblikk over kurset sålangt

Transkript:

KLMED8005 Medisinsk statistikk Del II, våren 009 -og - St303 Medisinsk statistikk, våren 009 4 januar 009: Praktisk om kursene Analyse av x tabeller (Avsnitt 0. 0.3) Stian Lydersen Praktisk om kursene Hjemmesider under http://folk.ntnu.no/slyderse/medstat/medstatii_v09.html http://folk.ntnu.no/slyderse/medstat/st303/info_v09.html Forelesninger onsdager 30-45 / 55 Sted: se hjemmesiden Kursleder: Stian Lydersen Kurssekretær: Inger Ådnøy Ellingsen, inger.ellingsen@ntnu.no, tlf 7573070 / 73598660 Obligatoriske øvinger KLMED8005 Medisinsk statistikk del II Innhold: KLMED8006 Anvendt medisinsk statistikk Analyse av kategoriske data x tabeller Generelle tabeller (rxc) Enkel lineær regresjon Multippel lineær regresjon Korrelasjon Variansanalyse (ANOVA) Kovariansanalyse (ANCOVA) Epidemiologiske metoder Logistisk regresjon Overlevelsesanalyse Kaplan-Meier plot Log rank test Cox-regresjon St303 Medisinsk statistikk Generaliserte lineære modeller (GLM) Repeterte målinger I Repeterte målinger II Analyse med manglende data Diagnostiske tester Metaanalyse. Bayesiansk statistikk. Inngår i St303 medisinsk statistikk 3 4 Øvingene 3 øvinger, hver med 8 deloppgaver. Obligatoriske øvinger: KLMED8005: Alle øvingene St303: Øving deloppgave -5. Øving 3 deloppgave 3-8. Evt egne oppgaver fra eget stoff. Øvingene (forts.) Grupper med inntil 8 personer. Hver gruppe får en veileder. Hver gruppe har en kontaktperson i gruppa. Gruppen arbeider gjennom hele øvingen før veiledning. veiledning i timer ca hver 3 uke ( pr øving). Obligatorisk oppmøte! Veileder Svarer på spørsmål, avklarer problemer. Noterer oppmøte Hver gruppe leverer øving til veileder, signert av alle. Veileder retter, godkjenner, returnerer til gruppekontakt. Hver deltaker sørger for å skaffe seg en kopi av godkjent øvingssett. 5 6

Evaluering KLMED8006 Øvingene danner grunnlag for godkjent kurs Fremlegg av oppgaver (5 min) Forevise komplett godkjent øvingssett Noen få enkeltoppgaver trekkes ut og presenteres. Kandidaten blir stilt spørsmål knyttet til oppgaven. Bestått / ikke bestått. Evaluering St303 Øvingene obligatorisk. (Ikke midtsemesterprøve) Skriftlig eller muntlig eksamen. 7 8 Analyse av x tabeller (Avsnitt 0. 0.3) Tre metoder beskrevet i Rosner: To-utvalgstest for binomiske andeler. Normalfordelings-tilnærming. Avsnitt 0... Pearsons kjikvadrattest. Avsnitt 0..-0..4. Fisher s eksakte test. Avsnitt 0.3. Ikke nevnt i Rosner: To metoder som generelt er bedre i små utvalg, og brukes i økende grad Eksakt ubetinget (best) Eksakt betinget mid p Lydersen, S., Fagerland, M., Laake, P. Tutorial in Biostatistics: Recommended tests for association in x tables. In press, Statistics in Medicine, 009. Eksakt ubetinget finnes f.eks i www.stat.ncsu.edu/exact/ 9 0 status kasus (brystkeft) kontroll (ikke brystkreft) Tabell 0. alder v første fødsel > 30 år < 30 år 683 537 30 498 8747 045 8 84 3465 bruker p-pille ja nei Tabell 0. hjerteinfarkt innen 3 år ja nei 3 4987 5000 7 9993 0000 0 4980 5000

Tabell 0.9 dødsårsak ikke CVD CVD diett mye salt lite salt 3 5 5 30 35 7 53 60 To-utvalgstest for binomiske andeler Avsnitt 0.. 3 4 Eksempel 0.4 Beskytter lav alder ved første fødsel mot brystkreft? D kvinnen har (hatt) brystkreft E alder ved første fødsel var 30 år eller mer? PD ( E) PD ( E) Data fra en kasus kontroll studie: Av 30 kvinner med brystkreft hadde 683 (.%) alder første fødsel 30 Av 045 kvinner uten brystkreft hadde 498 (4.6%) alder første fødsel 30 Altså: Vi ønsker å sammenlikne PD ( E) og PD ( E ) Men i en kasus kontroll studie observeres PE ( D) og PE ( D. ) Imidlertid gjelder at PD ( E) PD ( E) PE ( D) PE ( D) 5 6 Bevis-skisse (for spesielt interesserte): For det første (lett å vise) PD ( E) PD ( E) PD ( E) PD ( E) PD ( E) PD ( E) Bevis-skisse (fortsettelse) PD ( E) PD ( E) PD ( E) PD ( E) PD ( E) PD ( E) Siste kalles Odds Ratio (OR) Dessuten gjelder alltid (uansett verdi på OR), vist av Cornfield (956): PD ( E) PD ( E) PE ( D) PE ( D) OR PD ( E ) PD ( E ) PE ( D ) PE ( D ) PE ( D) PE ( D) PE ( D) PE ( D) PE ( D) PE ( D) q.e.d. 7 Sykdoms odds ratio Eksponerings odds ratio 8 3

To grupper av størrelse n og n. Observerer X bin(n, p ) og X bin(n, p ) H 0 : p p (eller p -p 0) mot H : p p. Estimatorer for p og p : pˆ X og p n n ˆ X Forkaster H 0 hvis pˆ ˆ p avviker mye fra 0. pˆ pˆ Under H 0 er z tilnærmet standard normalfordelt. Var( pˆ pˆ ) pga uavh. + Var( pˆ pˆ ) Var( pˆ ) ( ) Var( pˆ ) Under H p 0 ( p) p( p) + + p( p) n n n n Dermed fås z pˆ pˆ + pˆ( pˆ) n n X+ X hvor pˆ n + n 9 0 Likning 0.3 s 357 har en (omdiskutert) kontinuitetkorreksjon i telleren: pˆ pˆ + n n z + pˆ( pˆ) n n Eksempel 0.5, brystkreft og alder ved første barn 0. 0.46 z 8.87 + 0.6( 0.6) 30 045 Forkast H 0 på nivå α0.05 hvis z >z -α/.960 p-verdi (-Φ(8.8)) < 0.00 Tabell 0. Pearsons kjikvadrattest. Avsnitt 0..-0..4. status kasus (brystkeft) kontroll (ikke brystkreft) Er rader og kolonner uavhengige? (Merk symmetri mellom rader og kolonner!) alder v første fødsel > 30 år < 30 år 683 537 30 498 8747 045 8 84 3465 Altså: Er D og E uavhengige: D Kvinnen har (hatt) brystkreft E Alder ved første fødsel 30 år 3 4 D og E er uavhengige hvis og bare hvis Pr(D E)Pr(D)Pr(E) 4

Her er de observerte andelene SPSS, Expected count: ˆ 30 ˆ 8 Pr( D) og Pr( E) 3465 3465 Hvis uavhengighet så er ˆ ˆ ˆ 30 8 Pr( D E) Pr( D) Pr( E) 3465 3465 og forventet antall med D E lik 30 8 30 8 E N ˆPr( D E) 3465 5.6 3465 3465 3465 status kasus kontroll status * alder v første fødsel Crosstabulation Expected Expected Expected alder v første fødsel > 30 år < 30 år 683 537 30 5,6 698,4 30,0 498 8747 045 659,4 8585,6 045,0 8 84 3465 8,0 84,0 3465,0 5 og det observerte antall er O 683 6 Person s kjikvadratobservator er definert som χ ( O E ) ij ij i j Eij E E E E ( O E ) ( O E ) ( O E ) ( O E ) + + + Under H 0 (rader og kolonner uavhengige) så er denne tilnærmet kjikvadratfordelt med frihetsgrad dersom alle E ij >5. Likning 0.5 er gitt med Yates kontinuitetskorreksjon: χ cc ( O E 0.5) i j ij ij ij E 7 8 Eks 0.3 s 366 ( 683 5.6.5) ( 537 698.4.5) χ + 5.6 698.4 ( 498 659.4.5) ( 8747 8585.6.5) + + 659.4 8585.6 60.9 60.9 60.9 60.9 + + + 5.6 698.4 659.4 8585.6 χ 49.66+ 9.599 + 5.608 + 3.07 77.89 under 0 H Tabell 0.7 Generell kontingenstabell a b a+b c d c+d a+c b+d na+b+c+d 9 30 5

Pearson s kjikvadrat: nad ( bc) χ ( a+ b)( c+ d)( a+ c)( b+ d) Med Yates kontinuitetskorreksjon: χ cc n n ad bc ( a+ b)( c+ d)( a+ c)( b+ d) z-test og Pearson s kjikvadrattest for x tabeller Det kan vises at z fra test for sammenlikning av to binomiske proporsjoner er identisk lik χ i Person s kjikvadrattest. Så de to testene er ekvivalente (gir alltid nøyaktig samme p-verdi). De kontinuitetskorrigerte versjonene er også ekvivalente. 3 3 Example, two binomials: Treatment of children with cardiac arrest. (Perondi et al, NEJM, 004) Fisher s eksakte test Avsnitt 0.3. Epinephrine survival at 4 hours treatment yes no High dose 33 34 Standard dose 7 7 34 total 8 60 68 p i P(Survival at 4 hours Treatment no i) H 0 : p p versus H : p p 33 34 dødsårsak ikke CVD CVD Tabell 0.9 diett mye salt lite salt 3 5 5 30 35 7 53 60 p i P(Diett m/ mye salt Dødsårsak nr i) H 0 : p p versus H : p p døds årsak Tabell 0.9 - dødsårsak * diett Crosstabulation ikke CVD CVD Expected Expected Expected diett mye lite salt salt 3 5,9, 5,0 5 30 35 4, 30,9 35,0 7 53 60 7,0 53,0 60,0 Minst en celle har forventet antall (expected count) < 5. Pearson s kjikvadrattest bør ikke brukes. 35 36 6

Fisher s tea-drinker (Fisher, 935) Guess poured first Poured first Milk Tea Milk 3 4 Tea 3 4 total 4 4 8 All marginal sums are fixed! Fisher s eksakte test. For mathematical convenience, we shall assume that the margins (row sums and column sums) of this table are fixed Egentlig ser vi på betingede sannsynligheter (som gir en betinget p-verdi) gitt marginalsummene. Dette gir en test som garantert holder signifikansnivået, men kan være konservativ (dvs har lavere teststyrke enn nødvendig) 37 38 Fisher s eksakte test (forts) Dersom dødsårsak og diett ikke er assosiert, er det helt tilfeldig hvem som hadde hatt saltholdig diett. Tankeeksperiment: Trekk M blant de N objektene (uten tilbakelegging), og la X være antall av de M som var i gruppe (her: ikke CVD). mye salt lite salt Ikke CVD X N CVD N M M N N! N! M! M! Pr( X a) Na!!( N a)!( M a)!( M N+ a)! for alle heltall a som gir ikke-negative tall i alle cellene, dvs a max(0, N M ),...,min( M, N ) 39 40 Kalles hypergeometrisk fordeling. Rosner likn 0.8: Står a 0,...,min( M, N) fordi Rosner først ordner rader og kolonner slik at N Nog M M Eksempel: Tabell 0. mye salt lite salt Ikke CVD 3 5 CVD 5 30 35 7 53 60 5!35!7!53! Pr( X a) 0.5 60!!3!5!30! 4 4 7

0,300 0,300 Pr(Xa) 0,00 Pr(Xa) 0,00 0,00 0,00 0,000 0 3 4 5 6 7 a 0,000 0 3 4 5 6 7 a H 0 : p p versus H : p <p p-verdi Pr(Dette utfall eller noe mer ekstremt) p venstresidig P(X ) 0.375 43 Men hva er mer ekstremt? 44 0,300 -sidig p-verdi, som beskrevet i Rosner eqn 0. s 406: Pr(Xa) 0,00 -sidig p-verdi min(p venstresidig, p høyresidig, 0.5) min(0.375, 0.878, 0.5) 0.749 0,00 Dette er TST (Twice the smallest tail) prinsippet. 0,000 0 3 4 5 6 7 a Merk at SPSS og Stata kun oppgir den ene ensidige p-verdien p ensidig min(p venstresidig, p høyresidig ) H 0 : p p versus H : p >p 45 p høyresidig P(X ) 0.878 46 Tosidig p-verdi beregnet bl.a. i SAS, SPSS, MINITAB, Stata: 0,300 To alternativer for beregning av -sidig p-verdi i Fisher s eksakte test: Pr(Xa) 0,00 0,00 -sidig p-verdi p ensidig p verdi Pr( X i) { i:pr( i) Pr( a)} 0,000 0 3 4 5 6 7 a Hvilken bør brukes? 47 p verdi Pr( X i) Pr( X ) + Pr( X 4) 0.688 { i:pr( i) Pr(} 48 8

Altman (99), page 56: I feel that the second approach is more reasonable, but many statisticians recommend doubling the p-value obtained for one tail. The second approach will always give a value of P less than or equal to that obtained by the first method. Agresti (00), page 93: Each approach has advantages and disadvantages To conduct a test of size 0.05 when one truly believes that the effect has a particular direction, it is safest to conduct the one-sided test at the 0.05 level to guard against criticism Kommentar: det siste tilsvarer p ensidig < 0.05. 49 50 International Conference on Harmonization ICH E9 (998): The approach of setting type I errors for onesided tests at half the conventional type I error used in two-sided tests is preferable in regulatory settings. This promotes consistency with the twosided confidence intervals that are generally appropriate for estimating the possible effect size of the difference between two treatments. Om Yates kontinuitetskorreksjon 5 5 Repetisjon om kontinuitetskorreksjon 53 54 9

Yates korreksjon fremkommer ved å legge til eller trekke fra 0.5 fra hver celle slik at marginalsummene holdes konstant. Trekk fra (legg til) 0.5 fra a hvis ad-bc>0 (<0) a -0.5 b + 0.5 a+b c + 0.5 d - 0.5 c+d Altså: Eksakt 0.35 Normaltinærming uten korreksjon: 0.59 Normaltinærming med korreksjon: 0.309 a+c b+d na+b+c+d 55 56 Da fås χ cc n[( a 0.5)( d 0.5) ( b+ 0.5)( c+ 0.5)] ( a+ b)( c+ d)( a+ c)( b+ d) Skal vi bruke Yates korreksjon? (som er identisk med kontinuitetskorreksjonen i likning 0.3) n[ ad bc 0.5( a + b + c + d)] n[ ad bc 0.5 n] ( a+ b)( c+ d)( a+ c)( b+ d) ( a+ b)( c+ d)( a+ c)( b+ d) n n ad bc ( a+ b)( c+ d)( a+ c)( b+ d) Selvin, S.: Biostatistics. How it works Pearson, 004. page 7-73: The use of this correction factor is equivocal and debate exists in the statistical literature on the appropriate balance between accuracy and power. 57 58 59 Haviland, M. G. (990). Yates s correction for continuity and the analysis of x contingency tables. Statistics in Medicine, 9, 363-367. Summary: Despite recommendations to the contrary, medical researchers still routinely use the Yates-corrected chi-square statistic in analyses of x contingency tables. Research has shown that these corrected statistics are overly conservative and that the conventional Pearson chi-square generally provides accurate control over type I error probabilities. This paper makes a straightforward argument against the use of Yates s correction for continuity and Fisher s exact probability test. 60 Haviland (990) konkluderer: Admittedly, a single best strategy for dealing with this problem across all experimental situations has not emerged. It is clear, however, that if a chi square test of association (independence or homogeneity) is considered appropriate, the conventional statistic is preferable to the one modified by Yates s method. 0

Agresti, A. Categorical Data Analysis. nd Ed, Wiley, 00, page 03 Since software now makes Fisher s exact test feasible even with large samples, this correction is no longer needed. Hirji, K. F. Exact Analysis of Discrete Data. Chapman & Hall / CRC, 006, page 49 An applied statistician today, in our view, may regard such corrections as historic curiosities, though Upton (99) has a different opinion. Tre metoder for analyse av x tabeller. To-utvalgstest for binomiske andeler: Konfidensintervall for p -p kan også beregnes (Avsnitt 3.3) Pearson s kjikvadrattest. Generaliserbar til rxc tabeller (Avsnitt 0.6) Fisher s eksakte test. Garanterer at reelt signifikansnivå nominelt signifikansnivå α Men har noe lavere styrke enn asymptotisk metode uten kontinuitetskorreksjon 6 6 63 Hvilken metode bør brukes for testing i x tabeller? Store tabeller: (Cochran, 954: Alle forventede antall >5) Pearson s asymptotiske kjikvadrattest. (Identisk med z- test for binomiske andeler.) Unngå Yates kontinuitetskorreksjon. Ellers, iflg Rosner: Fisher s eksakte test. Men: Eksakt betinget mid p test og eksakt ubetinget er bedre i små utvalg. Lydersen et al 009. http://folk.ntnu.no/slyderse/nsf%0conference%0007 64 Exact conditional mid p better than Asymptotic (e.g. Pearson χ ) Exact unconditional better than Exact conditional (e.g. Fisher exact) Do not always preserve test size Always preserve test size Unconditional tests in x tables Usually more powerful than conditional tests (Mehta and Hilton, TAS, 993, Mehrotra et al, Biometrics, 003, Lydersen et al, in press, Statistics in Medicine 009). Free software: www.stat.ncsu.edu/exact/ www.ugr.es/~bioest/software.htm www.med.uio.no/imb/stat/two-by-two/manual.html 65