Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Like dokumenter
Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

Forelesning 10 Kjikvadrattesten

Praktisk om kursene. Øvingene (forts.) Øvingene. KLMED8005 Medisinsk statistikk del II Innhold: KLMED8006 Anvendt medisinsk statistikk

Eksamensoppgave i ST3001

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

Logistisk regresjon 1

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

Praktisk om kursene. Øvingene (forts.) Øvingene. KLMED8005 Medisinsk statistikk del II Innhold: KLMED8006 Anvendt medisinsk statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 11: Anvendelser av kjikvadratfordelingen Kapittel 12: Variansanalyse (ANOVA)

ST0202 Statistikk for samfunnsvitere

Testobservator for kjikvadrattester

Medisinsk statistikk Del I høsten 2009:

Logistisk regresjon 2

Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Kort innføring i SPSS

Eksamen ST2303 Medisinsk statistikk Onsdag 3 juni 2009 kl

Epidemiology. Epidemiology. Rosner, Chapter 13: Tabell Disease Yes No Yes a b a+b=n 1 No c d c+d=n 2 a+c=m 1 b+d=m 2.

Testobservator for kjikvadrattester

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

1 11-1: Kji-kvadrat fordelingen : Krysstabeller og kji-kvadrattesten. 3 Kji-kvadrattesten i JMP

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Mål på beliggenhet (2.6) Beregning av kvartilene Q 1, Q 2, Q 3. 5-tallssammendrag. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Levetid (varighet av en tilstand)

Formelsamling i medisinsk statistikk

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Generelle lineære modeller i praksis

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO

Medisinsk statistikk Del I høsten 2008:

Prøveeksamen i STK3100/4100 høsten 2011.

Innhold. Multisample inference - del 2 (Rosner, ) Data Effect of Lead Exposure (Eks. i Rosner Kap mm)

Til bruk i metodeundervisningen ved Høyskolen i Oslo

UNIVERSITETET I OSLO

Lineære modeller i praksis

Klassisk ANOVA/ lineær modell

ST0202 Statistikk for samfunnsvitere

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Mål: SPSS. Litteratur. Noen statistikk-programpakker. Dokumentasjon fra SPSS Inc. Introduksjon til IBM SPSS Statistics 20

Fasit for tilleggsoppgaver

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

EXAMINATION PAPER. Exam in: STA-3300 Applied statistics 2 Date: Wednesday, November 25th 2015 Time: Kl 09:00 13:00 Place: Teorifagb.

Anvendt medisinsk statistikk Vår 2010 Diagnostiske tester

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Anvendt medisinsk statistikk Vår 2008 Diagnostiske tester. Oversikt. Hierarki (Thornbury 1991)

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Hypotesetest: generell fremgangsmåte

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

UNIVERSITETET I OSLO

Multisample Inference del 2 (Rosner ) Øyvind Salvesen

Oppsummering av STK2120. Geir Storvik

Kapittel 3: Studieopplegg

regresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i samfunnsfaglig forskningsmetode 16. mai 2003

Høye skårer indikerer høye nivåer av selvkontroll.

Referanser: Tegntesten (The sign test) Ikke-parametriske metoder. Ikke-parametriske metoder. Parametriske vs ikke-parametriske metoder

STK Oppsummering

Beregning av kvartilen Q 1 (example 2.12) Mer repetisjon. ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2015

Forelesning 9 STK3100/4100

Lese og presentere statistikk i medisinske forskningsartikler

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Utvalgsstørrelse, styrke

Korrelasjon og lineær regresjon, litt om resultatpresentasjon

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Multisample Inference del 2 (Rosner )

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

STK Oppsummering

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Forelesning 6 STK3100/4100

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

LØSNINGSFORSLAG ) = Dvs

UNIVERSITETET I OSLO

Kapittel 7: Inferens for forventningerukjent standardavvik

Forelesning 9 Statistiske mål for bivariat tabellanalyse

Tilleggsoppgaver for STK1110 Høst 2015

Løsningsforslag eksamen STAT100 Høst 2010

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Forelesning 7 STK3100

Løsningsforslag eksamen 27. februar 2004

Transkript:

Kategoriske data, del I: Kategoriske data - del (Rosner, 10.3-10.7) 1 januar 009 Stian Lydersen To behandlinger og to utfall. (generelt: variable, verdier). x tabell. Uavhengige observasjoner Sammenheng mellom behandling og utfall? (er de to variablene assosiert?) Sml to binomiske andeler (10..1), Pearson s χ (10.. 10..4) eller Fisher s eksakte test (10.3) 1 Kategoriske data, del II: x tabell, parede data. McNemar s test (10.4) RxC tabell, uavh. obs. Pearson s χ (10.6) xk tabell, k ordnede kategorier, test for trend (10.6.) Litt om utvalgsstørrelse og styrkeberegninger (10.6) Litt om Goodness of fit (10.7) 3 x tabell, parede data (Mc Nemar s test) Avsnitt 10.4 4 Treatment Table 10.13. x table based on 14 patients A B Outcome Survive for Die within 5 years 5 years 56 95 61 515 106 61 1041 01 14 Feil utgangspunkt: Ikke uavhengige observasjoner! 5 Enhet: Matchet par Behandling A alder klinisk tilstand Behandling B Avhengige observasjoner (hvorfor?) 6 1

Typer par Table 10.14. Matched pairs as sampling unit, 61 matched pairs. Trt A patient survive 5 years die within 5 years Trt B patient survive 5 die within years 5 years 510 16 56 5 90 95 515 106 61 7 Concordant pair (overensstemmende par): Behandling A og B gir samme resultat Discordant pair (uoverensstemmende par): Behandling A og B gir forskjellig resultat. Antall n D Type A uoverensstemmende par: Beh. A gir hendelsen og beh. B gir ikke hendelsen. Antall n A 8 Table 10.14. Matched pairs as sampling unit, 61 matched pairs. Trt A patient survive 5 years die within 5 years Trt B patient survive 5 die within years 5 years 510 16 56 5 90 95 515 106 61 Hypotesetesting: McNemar s test p = Pr(Et uoverensstemmende par er typea) Daern A bin(n D, p) (gitt n D ) H 0 : p=1/ versus H 1 : p 1/ Under H 0 er E(n A )=n D / Forkast H 0 hvis n A avviker mye fra n D / Type A Type B 9 10 Beregning av p-verdi McNemar s test Tilnærmet: Eqn 10.1 Eksakt: Eqn 10.13 SPSS: Legg inn data: En linje per case eller Data -> Weight cases Analyze -> Descriptive statistics -> Crosstabs. Velg Statistics: McNemar Eks 10.4 Brystkreft. n D =1, n A =5 Under H 0 er N A ~ bin(1, 0.5) p-verdi = Pr( N A 10.5 5 10.5 ) Tilnærmet (Eqn 10.1): χ = 4.76, p-verdi = 0.091 (OK tilnærming hvis n D 0) Eksakt (Eqn 10.13) p-verdi=0.066 11 1

Estimert sannsylighet for å overleve 5 år: A: 56 0.847 61 =, B: 515 0.89 61 = Differanse: 0.847 0.89 = 0.018 95% konfidensintervall: Se f.eks Agresti, A: An Introduction to Categorical data Analysis, nd edition, Wiley 007. Page 44-47.) Utvalgsstørrelse og teststyrke Avsnitt 10.5 0.018 ± 1.96 (5 + 16) (5 16) / 61/ 61 = 0.018± 0.014 Dvs 0.004 til 0.03 13 14 10.5 Utvalgsstørrelse og teststyrke Uavhengige observasjoner i x tabell (Pearson s χ eller Fisher s eksakt) Utvalgsstørrelse n 1, n ved gitt p 1, p, α, 1-β, k(=n /n 1 ): Eqn 10.14 Teststyrke 1-β ved gitt p 1, p, α, n 1, n : Eqn 10.15 Ikke-perfekt compliance: Eqn 10.1 Matchede par (McNemar s test): Utvalgsstørrelse Eqn 10.16 Teststyrke: Eqn 10.17 Ikke-ordnet rxc tabell. Avsnitt 10.6 15 16 Tabell 10.18 case/ control case control Brystkreft og alder ved første fødsel age group <0 0-4 5-9 30-34 >=35 30 106 1011 463 0 30 18,4% 1,4% 5,9% 9,8% 35,1% 3,9% 14 443 893 109 406 1045 81,6% 78,6% 74,1% 70,% 64,9% 76,1% 174 5638 3904 1555 66 13465 100,0% 100% 100% 100% 100% 100,0% Hvis rader og kolonner er uavhengige så er forventet antall i celle nr i,j E ij radsum kolonnesum = totalsum 17 18 3

Pearson s kjikvadratobservator er definert som χ = ( O E ) r c ij i= 1 j= 1 Eij ij ( O E ) ( O E ) ( Orc E ) = + +... + E E E 11 11 1 1 11 1 rc rc Under H 0 (rader og kolonner uavhengige) så er denne tilnærmet kjikvadratfordelt med (r-1)(c-1) frihetsgrader dersom minst 80% av cellene har E ij>5 og alle cellene har E ij>1. Eksempel 10.35 sum O 30 106 1011 463 0 14 443 893 109 406 13465 E 416,6 1348 933,6 371,9 149,7 135 490 970 1183 476,3 13465 O-E -96,6-14 77,4 91,1 70,3 96,6 14,3-77,4-91,1-70,3 0 (O-E)^/E,40 15,0 6,4,3 33,01 7,04 4,7,0 7,01 10,38 130,33 19 0 Cochran-Armitage testen: Kjikvadrat-test for trend i binomiske andeler Ordnet xk tabell: Test for trend. Avsnitt 10.6 Sett en score S for hver gruppe: Numerisk egenskap ved gruppen, eller Gruppenr StørrelsenX 1 = A /B kan beregnes etter likning 10.4. (Mye arbeid!) Under H 0 er X 1 ~ kjikvadratfordelt med 1 fr.gr. 1 Cochran-Armitage test: X 1 = nr, hvor r er Pearsons korrelasjonskoeffisient mellom score og gruppe, og n er totalt antall Ekvivalent med score-test for score i logistisk regresjon Mer generell test: Linear-by-linear test for association i dobbelt ordnet rxc tabell X 1 = (n-1)r, hvor r er Pearsons korrelasjonskoeffisient mellom score og gruppenr, og n er totalt antall Dette er Linear-by-Linear Association i SPSS. Analyze -> Descriptive statistics -> Crosstabs Tilnærmet lik test for trend i binomiske andeler. 3 4 4

Eks 10.37 Eks 10.37 - SPSS Persons Agegroup Casecont 30 1 0 14 1 1 106 0 443 1 1011 3 0 893 3 1 463 4 0 109 4 1 0 5 0 406 5 1 case/control case control case/control * age group Crosstabulation Expected % Expected % Expected % age group <0 0-4 5-9 30-34 >=35 30 106 1011 463 0 30 416,6 1348,3 933,6 371,9 149,7 30,0 18,4% 1,4% 5,9% 9,8% 35,1% 3,9% 14 443 893 109 406 1045 135,4 489,7 970 1183 476,3 1045 81,6% 78,6% 74,1% 70,% 64,9% 76,1% 174 5638 3904 1555 66 13465 174,0 5638,0 3904 1555 66,0 13465 100% 100% 100% 100% 100% 100,0% Hvis data ligger slik i SPSS Data Editor: Data -> Weight Cases -> Weight cases by: Persons 5 6 Eks 10.37 - SPSS Chi-Square Tests SPSS: Logistic regression Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Asymp. Sig. Value df (-sided) 130,338 a 4,000 17,385 4,000 19,00 1,000 13465 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 149,70. Step 0 Variables Overall Statistics Variables not in the Equation agegroup Score df Sig. 19,01 1,000 19,01 1,000 Identisk med Cochran- Armitage test for trend 7 8 Data fra tabell 10.1: Passer data med normalfordelingen? 5000 Chi square goodness-of-fit test 4000 3000 Avsnitt 10.7 Frequency 000 1000 0 observed expected normal <50 60-70 80-90 100-110 50-60 70-80 90-100 >110 9 MMHG 30 5

4000 Eksempel 10.41 000 1000 800 600 400 00 gruppe 1 3 4 5 6 7 8 sum O 57 330 13 4584 4604 119 659 51 14736 E 78 547 17 483 4479 431 684 107 14736 O-E -1-17 5 301 15-31 -5 144 0 (O-E)^/E 5,65 86,09 0,01 1,15 3,49 40,04 0,91 193,79 351,14 Frequency 100 80 60 observed expected normal <50 60-70 80-90 100-110 50-60 70-80 90-100 >110 MMHG 31 3 6