Lars Mørkrid NKK-MØTET

Like dokumenter
Medisinsk statistikk Del I høsten 2009:

Kapittel 3: Studieopplegg

TMA4245 Statistikk Eksamen desember 2016

SOS3003 Eksamensoppgåver

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

SOS3003 Eksamensoppgåver

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

UNIVERSITETET I OSLO Matematisk Institutt

Eksamensoppgåve i TMA4240 Statistikk

Binomisk sannsynlighetsfunksjon

ST0202 Statistikk for samfunnsvitere

SOS3003 Eksamensoppgåver

TMA4245 Statistikk Eksamen desember 2016

Seksjon 1.3 Tetthetskurver og normalfordelingen

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Litt enkel matematikk for SOS3003. Om matematikk. Litt om kva vi treng. Erling Berge

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

SOS3003 Eksamensoppgåver

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Et lite notat om og rundt normalfordelingen.

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

TMA4240 Statistikk Høst 2016

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

NS-EN ISO 15189:2007

GeoGebra finner nullpunktene til en innlagt polynomfunksjon f. GeoGebra finner nullpunktene til en innlagt funksjon f i intervallet [1, 8].

EKSAMENSOPPGAVE STA-1001.

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk 2014

Et lite notat om og rundt normalfordelingen.

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Appendiks 5 Forutsetninger for lineær regresjonsanalyse

SOS3003 Eksamensoppgåver

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

UNIVERSITETET I OSLO

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

TMA4240 Statistikk Høst 2012

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Tabell 1: Beskrivende statistikker for dataene

Litt enkel matematikk for SOS3003

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

La U og V være uavhengige standard normalfordelte variable og definer

UNIVERSITETET I OSLO

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

UNIVERSITETET I OSLO

vekt. vol bruk

UNIVERSITETET I OSLO

Løsningsforslag til obligatorisk oppgave i ECON 2130

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO

6.1 Kontinuerlig uniform fordeling

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Normalfordelingen. Univariat normalfordeling (Gaussfordelingen): der µ er forventningsverdien og σ 2 variansen. Multivariat normalfordeling:

TMA4240 Statistikk Eksamen desember 2015

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

STK1100 våren 2019 Mere om konfidensintevaller

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

LYØSINGSFORSLAG Eksamen i MAT111 - Grunnkurs i matematikk I onsdag 18. mai 2011 kl. 09:00-14: i( 3 + 1) = i + i + 1

10.1 Enkel lineær regresjon Multippel regresjon

Histogramprosessering

STK juni 2018

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Formelsamling i medisinsk statistikk

Forelesning 13 Regresjonsanalyse

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

TMA4240 Statistikk H2015

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Seksjon 1.3 Tetthetskurver og normalfordelingen

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Forelesning 3. april, 2017

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

HØGSKOLEN I STAVANGER

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

TMA4240 Statistikk H2010

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

DEL 1 GRUNNLEGGENDE STATISTIKK

Weibullfordelingen. Kjetil L. Nielsen. Innhold. 1 Teori. 1.1 Tetthetsfunksjon og fordelingsfunksjon

Kap. 8: Utvalsfordelingar og databeskrivelse

Utvalgsfordelinger (Kapittel 5)

Om eksamen. Never, never, never give up!

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Transkript:

Lars Mørkrid 13314 NKK-MØTET 1

Nokre målevariable er sterkt korrelerte Ofte kan dette forklarast ut frå biokjemi naboar i reaksjonsvegar: guanidinoacetat kreatin H + - CO (ph pco ) småmolekylær komponent-bindingsprotein: testosteron-shbg albumin-calcium Eller ut frå fysiologi reguleringsmekanismar, for eksempel hormon: PTH-calcium, TSH-FT4 I slike tilfelle kan det bli heilt feil å nytta separate referansegrenser for kvar komponent

antall 18 16 14 1 1 8 6 4 kvinner menn DENMARK FINLAND ICELAND NORWAY SWEDEN SUM antal 434 689 8 816 531 55 1 15 5 3 35 4 45 5 55 6 65 7 75 8 85 9 95 alder (år) Vi skal bruka dette NORIP-materialet med albumin og total calcium i serum som eksempel 3

Konstruer P-verdiar og Z-score B-Hb 11,5 11,9 11,9 1 1,1 1,1 1,1 1, 1, 1, Rank 1 3 4 5 6 7 8 9 1 P-value,5 % 1,4 %, % 3, % 3,8 % 4,7 % 5,5 % 6,3 % 7, % 8, % Z-score -,56 -,11 -,17-1,879-1,769-1,677-1,597-1,56-1,463-1,44 B-Hb 14,4 14,5 14,5 14,6 14,7 14,7 15,1 15, 15,8 17 Rank 111 11 113 114 115 116 117 118 119 1 P-value 9, % 9,8 % 93,7 % 94,5 % 95,3 % 96, % 97, % 97,8 % 98,6 % 99,5 % Z-score 1,44 1,463 1,56 1,597 1,677 1,769 1,879,17,11,56 4

mmol/l calcium,8,7,6,5,4,3,,1 1,9 1,8 3 35 4 45 5 55 albumin (g/l) DENMARK FINLAND ICELAND NORWAY SWEDEN SUM antal 434 689 8 816 531 55 5

Etablering av z-score plot 1 ordens regresjon Z-score vs albumin gjsnitt X z-score z-limit Tukey fence 41,55 4 3 1-1 - -3-4 3 35 4 45 5 55 albumin (g/l) N 55 µ = -intercept/slope s = 1/slope slope (b),36 σ,77 intersept (a) -14,98 µ 41,55 est 5 pers 36,11 et 975 pers 46,98 R,999581751 6

Fjerning av 3 høge slengjarar ( outliers ) Tukey fence, faktor = 15 4 3 1-1 - -3-4 z-score z-limit Tukey fence 3 35 4 45 5 55 N 549 albumin (g/l) gjsnitt X 41,54 slope (b),36 σ,77 intersept (a) -15, µ 41,54 est 5 pers 36,1 et 975 pers 46,97 R,99958787 God approksimasjon til normalfordeling 7

Etablering av z-score plot z-score z-limit Tukey fence 4 3 1-1 - -3-4 1,7 1,9,1,3,5,7,9 calcium (mmol/l) N 55 µ = -intercept/slope s = 1/slope 1 ordens regresjon Z-score vs calcium gjsnitt X,337 slope (b) 1,48 σ,83 intersept (a) -8,155 µ,337 est 5 pers,174 est 975 pers,5 R,99973949 8

4 3 1-1 - -3-4 Fjerning av 19 slengjarar ( outliers ) Tukey fence, faktor = 15 z-score z-limit Tukey fence 1,7 1,9,1,3,5,7 N 533 calcium (mmol/l) gjsnitt X,337 slope (b) 1,166 σ,8 intersept (a) -8,433 µ,337 est 5 pers,176 est 975 pers,498 R,99973657 µ = -intercept/slope s = 1/slope 9

4 3 1-1 - -3 Fjerning av 3 nye slengjarar ( outliers ) Tukey fence, faktor = 15 z-score z-limit Tukey fence -4 1,7 1,9,1,3,5,7 gjsnitt X,337 slope (b) 1,183 σ,8 intersept (a) -8,475 µ,337 est 5 pers,176 est 975 pers,498 R,9997493 N 53 God approksimasjon til normalfordeling 1

på ein firkanta måte mmol/l,8 calcium referanseboks S-albumin est 5 pers,7 36,1,6,5,4 et 975 pers 47,,3,,1 1,9 1,8 3 35 4 45 5 55 albumin (g/l) S-calcium est 5 pers,176 est 975 pers,498 Mistilpassning mellom referensekvadrat og realitet! 11

Uavhengig variabel: albumin (tilnærma normalfordelt med µ = 4157 g/l og σ = 787 g/l) Avhengig variabel: calcium Lage ny uavhengig variabel, albumin-korrigert calcium, ved hjelp av ordinær lineær regresjon (etter å ha fjerna 8 slengjarar) N intercept slope r 54 1,681595,15776,5347 residualane i regresjonsmodellen er ein slags calcium reinsa for albumin 1

med to uavhengige, standard-normalfordelte variable Omformar albumin til ein standard normalfordelt variabel X = (albumin- 4157)/787 Omformar residualane til en standard normalfordelt variabel Y = (residual- )/6956 Y 5 4 3 1-1 - -3-4 -5-5 -4-3 - -1 1 3 4 5 X Referansegrensa ligg ved ytterpunkta i diagrammet 13

Transfomerar til polar-koordinatar X = r cosφ Y = r sinφ,7,6,5 fordeling r teoretisk fordeling r,,18,16,14 fordeling Ø trend y = -,13x +,1635 R =,6,4,3,1,1,8,,1,6,4, 1 3 4 5 6 r 4 6 8 Φ Referansegrensa ligg ved ytterpunkt i fordelinga avr 95-persentil-linja i r,φ fordelinga ligg ved r =,448 14

Begge variablane X og Y er tilnærma standard-normalfordelte med forventningsverdi og standardavvik 1 Dei er også uavhengige Den såkalla joint probability density function = joint pdf blir då der kvar av variablane har dp = pdf(w) = 1/ (p) exp(-w /)dw; w = x eller y Sidan X og Y er uavhengige, er joint pdf produktet pdf(x) pdf(y) Vi fører inn polar koordinatar X = r cosφ og Y = r sinφ dp = (1/π) exp(-r /) r dr dφ dp = P(x<X<x+dx y<y<y+dy) (1) Integrasjon først over alle vinklar Φ [ π] gir dp = exp(-r/) r dr og deretter over mellom og opp til grensa R gir P = 1-exp(-R /) Løyst med omsyn til R blir dette R = (-ln(1-p)) 15

P,5,5,75,9,95,975,99 R,759 1,177 1,665,146,448,716 3,35 Referansegrensa er einsidig, og då skal ein nytta P = 95; dvs R = 448 16

Teiknar inn referansekurva Y referanse-kurve 5 4 3 1-1 - -3-4 -5-5 -4-3 - -1 1 3 4 5 X 95-persentil-linja i r,φ fordelingen ligg ved r =,448 17

Transformerar attende til albumin og calcium mmol/l,8,7,6,5 calcium referansekurve N totalt = 55 # utanfor den raude referansekurva =16 dvs,4,3 6,3 %,,1 1,9 1,8 3 35 4 45 5 55 albumin (g/l) # slengjarar = 8 utanfor ref kurva 5, % Som stemmer bra med eit referanseareal 18

mmol/l,8,7,6,5,4,3,,1, 1,9 referanseboks referansekurve 1,8 3 35 4 45 5 55 albumin (g/l) 19

Mange variable er avhengige av kovariable, td kjønn og alder Ofte er effekten av slike kovariable stor og må korrigerast for Dette kan gjerast ved hjelp av regresjonsanalyse Kjønn er lett å ta inn i ein slik modell som ein variabel som har verdien og 1 For alder kan ein nytta 3 ordens polynom i avgrensa intervall og binda dei saman, denne metoden vert kalla cubic spline Ein må transformera variablane slik at restledda i regresjonen blir normalfordelte Estimat for forventningsverdi og standardavvik (altså sjølve regresjonslikninga kan nyttast til å konvertera eit kvart måleresultat (m) til Z- score Ved standard normal fordeling vil dette bli likt med restleddet Z = (m - µ)/s Deretter undersøkjer ein for kvar avhengig variabel om det er signifikant samanhengen med ein annan, på same måte som vist tidlegare her for albumin og calcium Ein må då korrigera for denne samanhengen På denne måten kan ein laga kontinuerlege alders- og kjønnskorrigerte referansegrenser Framtidsdraumen er å angi eit kvar pasientresultat som ein persentil, analogt med vekstkurvene i pediatri

art-pco (kpa) 18 16 14 1 1 8 6 4 64 66 68 7 7 74 76 78 art-ph Korleis vil referansegrensene gå her? 1