Deskriptiv statistikk for sentrum og spredning i fordelingen. Gjennomsnitt og standardavvik. eller

Like dokumenter
Innhold: 4.1 Sannsynlighetsfordeling (for tellevariabler) Læringsmål statistikk (3 og 7 januar 2013) Eksempel - postoperativ kvalme

Innhold: Hvorfor statistikk? Læringsmål statistikk (3 og 7 januar 2013) Litteratur. For å kunne lese medisinsk litteratur inkl vitenskapelige artikler

Innhold: Hvorfor statistikk? Litteratur

Innhold. Eksempel: Fig. 5.16a. Kovarians. Medisinsk statistikk Del II Forelesning 25 februar 2009 Korrelasjon. Korrelasjon

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Hvorfor statistikk? Innhold (9 og 12 desember 2013): Litteratur. Læringsmål statistikk (9 og 12 desember 2013)

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

TMA4240/4245 Statistikk 11. august 2012

MOT310 Statistiske metoder 1, høsten 2011

To-utvalgstest (def 8.1) vs ettutvalgstest: Hypotesetesting, to utvalg (Kapitel 8) Longitudinell studie (oppfølgingsstudie) - eqn 8.1. Eksempel 8.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

ECON240 Statistikk og økonometri

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Econ 2130 Forelesning uke 11 (HG)

Mer om utvalgsundersøkelser

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Lineær regresjonsanalyse (13.4)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

TMA4240 Statistikk Høst 2016

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Statistikk og økonomi, våren 2017

STK1100 våren 2017 Estimering

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

TMA4245 Statistikk Eksamen mai 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

n 2 +1) hvis n er et partall.

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

MOT310 Statistiske metoder 1, høsten 2012

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4245 Statistikk Eksamen 9. desember 2013

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

TMA4245 Statistikk. Øving nummer 12, blokk II Løsningsskisse. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Kapittel 8: Estimering

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

TMA4240 Statistikk Høst 2015

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

3MX 2007/8 - Kapittel 5: 8. januar 5. februar 2008

Estimering 1 -Punktestimering

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Estimering 1 -Punktestimering

Løsning TALM1005 (statistikkdel) juni 2017

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2009

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

TMA4240 Statistikk H2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforslag til eksamen i STK desember 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

Likningssystem for maksimum likelihood løsning

Tema. Statistikk og prøvetakning. Hvorfor måle mer enn en gang? Fordelinger en innledning. Hvorfor måle mer enn en gang

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

«Uncertainty of the Uncertainty» Del 4 av 6

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

Kap. 9: Inferens om én populasjon

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TMA4240 Statistikk Høst 2015

Kap. 9: Inferens om én populasjon

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Oversikt over konfidensintervall i Econ 2130

TMA4245 Statistikk Vår 2015

Kapittel 7: Noen viktige sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2015

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Oversikt over konfidensintervall i Econ 2130

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Hypotesetesting, del 5

TMA4240 Statistikk 2014

TMA4240 Statistikk Eksamen desember 2015

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

H T. Amundsen INNHOLD

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Transkript:

Eksempel : tall dager i sykehus. Ikke-parametriske tester versus parametriske tester Stia Lyderse Presetert på Regioal forskigskoferase for psykiatri og rusfeltet Ålesud 4 jui 03 Behadlig : 6, 5, 37,, 3, 0, 7,, 3, 38 0,, 3, 5, 7,, 6, 37, 38, 3 Behadlig B 4, 3, 5,, 6,, 03, 65, 40, 5, 3, 49, 43, 5,, 6, 3, 3, 40, 49, 65, 5, 4, 03, 43 3 4 Example : EORTC Quality of life questioaire do you feel depressed? * performace Crosstabulatio Cout do you feel depressed? Total : ot at all : a little 3: partly 4: very much performace who 0- who -4 Total 05 7 3 63 49 49 7 76 0 8 8 437 548 5 6 Deskriptiv statistikk for setrum og spredig i fordelige Gjeomsitt og stadardavvik eller Data: x, x,..., x Lettere å rege ut Gjeomsitt: x ( x x... x ) x i i ( ) (Empirisk) varias: s ( x x ) x x i i i i Media og kvartiler (iterkvartilbredde = avstad mellom edre og øvre kvartil) (Empirisk) stadardavvik: s ( xi x) ( ) i

7 Normalfordelige I e del situasjoer er skalavariable (tilærmet) ormalfordelt, dvs symmetrisk og med e spesiell klokkeformet fasog. x f ( x) e Når data er ormalfordelt: Ca 68% ligger ie stadardavvik fra gjeomsittet Ca 95% ligger ie stadardavvik fra gjeomsittet Visse metoder forutsetter at data er (tilærmet) ormalfordelt. F.eks Studet s t-test, valig regresjosaalyse 8 Data sortert: x() x()... x( ) Media: x( )/ hvis er oddetall ( x( /) x( /) ) / hvis er partall Mediae deler tallmaterialet på midte. Like mage observasjoer uder som over mediae. Nedre kvartil, media, øvre kvartil: Deler tallmaterialet i fire like store deler. 9 0 Eksempel : tall dager i sykehus. Behadlig : 6, 5, 37,, 3, 0, 7,, 3, 38 0,, 3, 5, 7,, 6, 37, 38, 3 Behadlig B 4, 3, 5,, 6,, 03, 65, 40, 5, 3, 49, 43, 5,, 6, 3, 3, 40, 49, 65, 5, 4, 03, 43 Hvilke(t) mål vil du bruke på setrum og spredig i fordeligee? Hva blir media og kvartiler for behadlig? Eksempel - EORTC data Performace status who 0- who -4 Gjeomsitt.73.4 Stadardavvik 0.83 0.87 media

3 4 Valg av deskriptiv statisikk for setrum og spredig i fordelige Gjeomsitt og stadardavvik ELLER media og kvartiler ELLER begge deler? vheger av målsettige med aalyse. Hvis data er symmetrisk fordelt (for eksempel ormalfordelt): Media = gjeomsitt Hvis data ikke er ormalfordelt: Gaske valig å oppgi media og kvartiler. OK å oppgi gjeomsitt og stadardaavvik. Med stadardavviket har ikke samme ekle tolkig som i ormalfordelige. OK å ata ormalforeldig i små datasett? J, hvis rimelig atakelse basert på ae kuskap eller ispeksjo av data. Sammelike to grupper: Studet s t-test (parametrisk metode) eller Wilcoxo-Ma-Whitey s test (ikkeparametrisk metode)? 5 6 Sammelike to grupper Studet s t-test Sammeliker gjeomsitt i fordeligee Forutsetter at data er (tilærmet) ormalfordelt Robust mot avvik fra ormalfordelig såfremt ikke ekstremt store eller ekstremt små observasjoer Ka også berege kofidesitervall for differase Wilcoxo-Ma-Whiteys test Er observasjoee i de ee gruppe høyere e i de adre (ikke bare om mediaee er forskjellige) Baserer seg på ragordig av observasjoee, glemmer deretter verdiee av de opprielige observasjoee Gjør INGEN forutsetig om ormalfordelig (eller ae parametrisk fordelig) Kjært bar har mage av: Wilcoxo s rak sum test Wilcoxo s two sample test Ma-Whitey s U test Wilcoxo-Ma-Whitey s test 7 8 Hvorda sjekke om data avviker fra ormalfordelige? Hvis media avviker mye fra gjeomsitt, så er data ikke symmetrisk fordelt (og dermed ikke ormalfordelt). (Me ikke omvedt!) Statistisk test: Kolmogorov-Smiroff mye brukt me lite eget. Shapiro-Wilk oe bedre eget. Histogram med ormalfordeligskurve: Vaskelig å vurdere Q-Q plott: Veleget! Eksempel: tall dager i sykehus. Behadlig : 6, 5, 37,, 3, 0, 7,, 3, 38 x 3.90, s 36.4, media = 9 Behadlig B 4, 3, 5,, 6,, 03, 65, 40, 5, 3, 49, 43 x 76.54, s 75.86, media = 40 B Hva ka vi si om forskjell mellom og B i populasjoe? 3

9 0 tall dager forutsatt (tilærmet) ormalfordelt Ikke-parametriske metoder: Forutsetter ige parametrisk fordelig: Basert på ragordige av observasjoee, glemmer origialdata Behadlig sortert: 0,, 3, 5, 7,, 6, 37, 38, 3 Rag:,, 4, 5.5, 7, 8, 0.5, 4, 5, 0 Gjeomsittsrag: 8.7 ltså: tall dager er ikke ormalfordelt. Behadlig B sortert:, 5,, 6, 3, 3, 40, 49, 65, 5, 4, 03, 43 Rag: 3, 5.5, 9, 0.5,.5,.5, 6, 7, 8, 9,,, 3 Gjeomsittsrag: 4.54 Wilcoxo-Ma-Whitey s test for to uavhegige utvalg: P=0.04 3 4 Example: EORTC Quality of life questioaire do you feel depressed? * performace Crosstabulatio Cout do you feel depressed? Total : ot at all : a little 3: partly 4: very much performace who 0- who -4 Total 05 7 3 63 49 49 7 76 0 8 8 437 548 4

5 6 Eksempel - EORTC data Studet s t-test eller ikke-parametrisk metode? Er du Performace status deprimert? who 0- who -4 Gjeomsitt.73.4 Stadardavvik 0.83 0.87 media Observert differase:.4.73 = 0.4 Er det forskjell på forvetet depresjos-skåre mellom de to gruppee? Hvis data er ormalfordelt: Ikke-parametriske metoder har tilærmet (dvs este) like høy teststyrke som t-teste i middels store og store datasett Ikke-paramteriske metoder er vesetlig svakere e t-teste i små datasett. Hvis data ikke er ormalfordelt: T-teste OK hvis ikke ekstreme observasjoer Bruke t-teste på trasformerte data? Bruk e ikke-parametrisk test Studet s T-test: 95% KI (0.3, 0.59), p-verdi < 0.00 Wilcoxo-Ma-Whitey (Ikke-parametrisk test): p-verdi < 0.00 Studet s t-test: Ka også berege tilhørede kofidesitervall. Ka geeraliseres til regresjosaalyse med justerig for adre variable 7 Fra Vacouver-retigslijee : Statistics Whe possible, quatify fidigs ad preset them with appropriate idicators of measuremet error or ucertaity (such as cofidece itervals). void relyig solely o statistical hypothesis testig, such as the use of P values, which fails to covey importat iformatio about effect size. 8 Bruk t-teste hvis mulig: Høyere statistisk styrke (i små datasett) Ka også berege kofidesitervall Ka geeraliseres til lieær regresjo for å ikludere adre kovariater ICMJE Iteratioal Committe of Medical Joural Editors http://www.icmje.org/#prepare, jauar 03 9 Refereces: ltma, D. G. & Blad, J. M. 009, "Practice Statistics Notes Parametric v o-parametric methods for data aalysis", British Medical Joural, vol. 338. Blad, J. M. & ltma, D. G. 009, "Practice Statistics Notes alysis of cotiuous data from small samples", British Medical Joural, vol. 338. 5