Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Like dokumenter
Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Obligatorisk oppgave 2

6.2 Signifikanstester

Kapittel 3: Studieopplegg

UNIVERSITETET I OSLO

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

STK1000 Obligatorisk oppgave 2 av 2

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

TMA4240 Statistikk H2010 (20)

Fasit for tilleggsoppgaver

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Introduksjon til inferens

UNIVERSITETET I OSLO

Inferens i fordelinger

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Verdens statistikk-dag.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

ST0202 Statistikk for samfunnsvitere

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

ST0202 Statistikk for samfunnsvitere

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Hypotesetesting. mot. mot. mot. ˆ x

Et lite notat om og rundt normalfordelingen.

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Statistikk og dataanalyse

Econ 2130 uke 16 (HG)

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

UNIVERSITETET I OSLO

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Hypotesetest: generell fremgangsmåte

HØGSKOLEN I STAVANGER

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

ÅMA110 Sannsynlighetsregning med statistikk, våren

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Et lite notat om og rundt normalfordelingen.

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Eksamensoppgave i TMA4255 Anvendt statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Eksamensoppgave i ST3001

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

Kapittel 7: Inferens for forventningerukjent standardavvik

Hypotesetesting av λ og p. p verdi.

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

TMA4240 Statistikk H2010 (22)

TMA4245 Statistikk Eksamen desember 2016

EKSAMENSOPPGAVER STAT100 Vår 2011

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Eksamensoppgave i TMA4255 Anvendt statistikk

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

TMA4240 Statistikk Høst 2007

ECON240 VÅR / 2016 BOKMÅL

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Bruk data fra tabellen over (utvalget) og opplysninger som blir gitt i oppgavene og svar på følgende spørsmål:

ST0202 Statistikk for samfunnsvitere

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

ST0202 Statistikk for samfunnsvitere

i x i

Eksamensoppgave i TMA4240 Statistikk

Forelesning 10 Kjikvadrattesten

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

Notat 3 - ST februar 2005

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

Kapittel 9 og 10: Hypotesetesting

Løsningsforslag Til Statlab 5

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Transkript:

Bivariate analyser Analyse av sammenhengen mellom to variabler H : Ingen sammenheng H 1 : Sammenheng Hvis den ene variabelen er kategorisk er en slik analyse det samme som å sammenligne grupper. Ulike grupper vil alltid være litt forskjellige. En sammenligning bør omfatte: Beskrivelse av gruppene: Figurer, tabeller, oppsummeringstall Hypotesetest (statistisk analyse): Er de observerte forskjellene statistisk signifikante? H : Gruppene er like H 1 : Gruppene er ikke like Effektmål og konfidensintervall En klinisk* vurdering av observasjonene: Er de observerte forskjellene klinisk interessante? (* Når forskningsfeltet ikke er medisin, må observasjonene sees i sammenheng med det fagfeltet du forsker i) 2

Sammenligning av to grupper med uavhengige, kontinuerlige data H : Gruppene er like H 1 : Gruppene er ulike Det er da to* mulige analysemetoder: To-utvalgs t-test Brukes hvis det er normalfordelte data i hver gruppe. OBS: Hvis det er mange nok observasjoner i hver gruppe (n er stor), eller fordelingen til dataene i hver gruppe ikke er for langt fra en normalfordeling, kan man allikevel bruke t-test. Wilcoxon Rank Sum test (Mann-Whitney U) Brukes hvis det er ikke-normalfordelte data i hver gruppe. (Men lik form på fordelingen til dataene i de to gruppene; at de er skjeve til samme side.) OBS: Det er altså ikke en regel at vi må bruke MW hvis vi har få observasjoner. Det er fordelingen til dataene som avgjør. * I STK1 lærer vi om forskjellige testobservatorer (z og t), og nyansene mellom dem. Hvilken vi skal bruke avhenger av hvor stor n er, om data er normalfordelte, og om vi kjenner σ. Det er viktig for eksamen i faget å forstå dette. I en praktisk forskningshverdag vil vi så godt som aldri kjenne σ for de to gruppene på forhånd. Da må σ erstattes med sd. Hvis data er normalfordelte, vil vi alltid ende opp med en t-observator og en t-test når vi er interessert i forskjellen på forventningsverdier. Hvis data ikke er normalfordelte, men n er stor, skulle vi i følge teorien og CLT brukt en z-observator og en z-test. Men med en stor n (hvor stor stor er, avhenger av hvor skjeve data er), vil t-observatoren være så lik z-observatoren at vi kan ofte tillate oss å bruke t-observatoren allikevel. Statistikkprogrammet SPSS har for eksempel bare t-test som valgalternativ hvis du ønsker å teste forskjellen på to forventningsverdier, og til og med i R må du gjøre beregningene på egen hånd hvis du absolutt skal gjøre en to-utvalgs z-test. Her er en nettside som viser deg hvordan: https://www.r-bloggers.com/two-sample-z-test/ Men: i STK1 er det allikevel pensum å vite forskjellen på en z-test og en t-test, fordi dette viser bakgrunnen for testene og hvordan vi tenker når vi formulerer en signifikanstest. 3

Testens idé: T-test Fordelingene i de to gruppene er like (normalfordeling) bortsett fra senteret (muligens forskjøvet). Senteret i fordelingene er gitt ved parameterne og. t-test kalles en parametrisk test Undersøker om gruppene er like, altså om ved å sammenligne x 1 og x 2 Hvis H er sann: x 1 x 2 Hvis H 1 er sann: x 1 x 2 t-test Hvis gruppene er like, forventes også ganske like gjennomsnitt i de to gruppene. 4

Testens idé, WRS-test: Den ene gruppa har systematisk høyere verdier enn den andre gruppa. Antar ingen spesiell fordeling, og kan derfor ikke relatere forskjellen på gruppene til en spesifikk parameter (m.a.o. ikke-parametrisk test). Undersøker om gruppene er like ved å sammenligne rangeringene av observasjonene. Sorter samtlige observasjoner i stigende rekkefølge og gir dem rangeringer. Beregn rangsummene i hver gruppe. (Alt dette gjøres heldigvis av dataprogrammet) Hvis H er sann: Hvis H 1 er sann: Ganske like rangsummer i hver gruppe Ganske forskjellige rangsummer i hver gruppe. t-test MWW-test Parametrisk test: H : gruppene er like x 1 x 2 Ikke-parametrisk test: H : gruppene er like rangsum 1 rangsum 2 5

Eksempel 1: Med Ericsson til Barcelona? Problemstilling: Har førstegangsfødende en annen svangerskapslengde enn de som har født før? Gruppe 1: Førstegangsfødende (ferskmor). Vi har n 1 =19 Gruppe : Har født før Vi har n 1 =16 H : Like lange svangerskap i gruppene, 1 H 1 : Ikke like lange svangerskap i gruppene, 1 boxplot(dager ~ gruppe,horizontal=true, col=c("dark grey", "red")) summary(dager[gruppe==1]) Min. 1st Qu. Median Mean 3rd Qu. Max. 262. 273.5 281. 279.9 285. 3. sd(dager[gruppe==1]) [1] 9.6 summary(dager[gruppe==]) Min. 1st Qu. Median Mean 3rd Qu. Max. 271. 278.8 283. 282.9 288. 298. sd(dager[gruppe==]) [1] 7.2 hist(dager[gruppe ==]) qqnorm(dager[v1==]) hist(dager[gruppe ==1]) qqnorm(dager[gruppe ==1]) Kommentar: Begge gruppene ser rimelig normalfordelte ut. Derfor gir det mening å formulere hypotesene i form av parametere for forventningsverdien. Dette kan vi ikke alltid vite før vi har undersøkt fordelingene i gruppene. Betingelsene for å kjøre t-test er oppfylt kjør t-test! 6

t.test(dager ~ gruppe) Welch Two Sample t-test data: dager by gruppe t = 1.446, df = 32.611, p-value =.339 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: -2.826878 8.78744 sample estimates: mean in group mean in group 1 282.875 279.8947 Testobservator: t sd x n 2 x 1 sd n 2 1 1, som er t-fordelt. Frihetsgrader, df: I følge boka bruker vi df = n 1 1 eller df = n 1 når σ-ene er ukjente og ulike. I dette eksemplet tilsvarer det enten at df=19-1=18, eller df=16-1=15. Men hvis vi kan anta at σ-ene er like (selv om de er ukjente), kan vi bruke df = n 1 +n -2. I dette eksemplet tilsvarer det at df = 19+16-2 = 33. Vi ser at sd 1 =9.6, og sd =7.2, som er litt forskjellig, men ikke veldig forskjellig. I R-utskriften står det df = 32.611, og det betyr at R har beregnet df så det blir riktigst mulig ut i fra hvor like sd-ene er. Effektmål: Effektmålet er et tall som oppsummerer forskjellen på gruppene («effekten» av å ha født før). I dette eksemplet er verdiene i hver gruppe relativt normalfordelt, og gjennomsnittene er derfor gode oppsummeringstall for hver gruppe. Dermed er forskjellen på gjennomsnittet en god oppsummering av forskjellen på gruppene. Et naturlig effektmål er derfor x x1 = 3. Ser vi på gruppestatistikken, tolkes dette som at vi estimerer at de som har født før har gjennomsnittlig 3 dager lenger svangerskap enn førstegangsfødende. 95% konfidensintervall for 1, altså den sanne forskjellen i svangerskapslengde for førstegangs- og flergangsfødende: Fra R: 95% KI er (-2.8, 8.8). Det betyr at selv om vi estimerer forskjellen til å være 3, kan vi ikke (med 95% sikkerhet) utelukke at den er så stor som 8.8 dager. Vi kan heller ikke (med 95% sikkerhet) utelukke at det faktisk er førstegangsfødende som 7

har lengst svangerskap, med 2.8 dager. Men vi tror at dette intervallet dekker den sanne forskjellen. p-verdien og selve testen: p-verdien = P(å observere minst like ekstreme observasjoner som det vi har observert, gitt H ) = P( t sd x n 2 x 1 sd n 2 1 1 7.2 19 2 3 9.6 16 2 t ~ T df ) = P( t 1.3 ) =.3. Forskjellen på 1.3 og R-utskriften (t = 1.4) skyldes avrunding av sd-ene. Tabell-lesing: Mange har lurt på hvordan t-fordelingstabellen brukes. Her er illustrasjoner, basert på tallene over (Bedre oppløsning av bildene ligger bakerst.) Tolkningene kommer på neste side. Figur 1 Figur 2 8

Hvis H er sann, forventer vi at 95% av t-verdiene skal være mellom -2.42 og 2.42, når det er 3 frihetsgrader (se de nederste to fordelingene i Figur 2, og det gule tallet til høyre inne i tabellen i Figur 1), og at en t-verdi på 1.3 tilsvarer en ensidig p-verdi på omtrent.15: t-verdien 1.55 er den nærmeste vi finner i tabellen (finn tallet med strek under i Figur 1), og den tilsvarer en ensidig p-verdi på.15 (finn tallet i øverste linje i Figur 1). Dermed blir den tosidige p-verdien det dobbelte, altså.3, og konfidensgraden C blir 7% (finn tallet i den nederste linja i Figur 1). Når vi bruker R, er vi ikke bundet av begrensningene i de trykte t- fordelingstabellene, og derfor får vi et mer nøyaktig resultat i R enn det vi klarer å regne frem til for hånd og ved å bruke tabeller. Konklusjon: En så høy p-verdi (som.3) betyr at det er ganske sannsynlig («vanlig») å observere så store forskjeller (som 3 dager) på grupper av denne størrelsen og med disse standardavvikene. Disse observasjonene er altså ikke i konflikt med H, og vi beholder derfor H. Vurdering av klinisk signifikans: Hvis forskjellen på gruppene (i populasjonen) virkelig er så stor som 3 dager (nesten en halv uke), ville det vært klinisk interessant. Her har vi to valg: Hvis støtten for dette i fysiologiske teorier er svak, slår vi oss til ro med at observasjonene våre bare var tilfeldige forskjeller. Hvis det derimot er sterk støtte for en slik forskjell i fysiologiske teorier, kan vi ta utgangspunkt i det, og bruke observasjonene i denne studien til å gjøre en utvalgsberegning (ofte kalt en styrkeberegning) for en større studie som vil gi oss sikrere svar på problemstillingen. OBS: En større studie vil ikke garantere at vi finner en stor forskjell, men den vil gjøre konklusjonene våre sikrere, enten vi konkluderer med at det er en forskjell, eller at det ikke er en forskjell. Tilsvarende vil et nytt konfidensintervall basert på et større utvalg bli smalere, selv om det ikke er sikkert at det nye intervallet har 3 i midten. 9

Eksempel 2: Sammenligner to metoder for å operere bort visdomstenner. Registrerer rekonvalesenstid i timer (antall timer etter operasjonen før pasienten er smertefri) for de to metodene. Vi lurer på om rekonvalesentidene for den ene operasjonsmetoden er systematisk høyere eller lavere enn dem for den andre metoden. Opererer 16 med metode 1 og 18 med metode 2. H : Metodene er like gode. Ingen sammenheng mellom operasjonsmetode og smertevarighet H 1 : Metodene er ikke like gode. Smh operasjonsmetode og smertevarighet boxplot(rekonv~metode,horizontal=true, col=c("dark grey", "red")))) summary(rekonv[metode==1]) Min. 1st Qu. Median Mean 3rd Qu. Max. 8. 1.38 12.5 16.9 17.75 36. sd(rekonv[metode==1]) [1] 9.5 summary(rekonv[metode==2]) Min. 1st Qu. Median Mean 3rd Qu. Max. 5. 7.25 1.5 14.14 15.25 48. sd(rekonv[metode==2]) [1] 11.42 hist(rekonv[metode==1]) qqnorm(rekonv[metode==1]) hist(rekonv[metode==2]) qqnorm(rekonv[metode==2]) Gruppene er små og begge fordelingene er skjeve kjør WRS-test! Kommentar: Begge gruppene ser rimelig skjeve og ikke normalfordelte ut. Derfor gir det ikke mening å formulere hypotesene i form av parametere for forventningsverdien. Dette kan vi ikke vite før vi har undersøkt fordelingene i gruppene. 1

wilcox.test(rekonv~metode) Wilcoxon rank sum test with continuity correction data: rekonv by metode W = 186, p-value =.1515 alternative hypothesis: true location shift is not equal to Testobservator: W, som i følge læreboka er rangsummen i den ene gruppa. R beregner W litt annerledes enn boka gjør, og derfor vil du få et annet tall enn R hvis du regner det ut for hånd (som vi nesten aldri gjør i praksis). Les her om hvordan R beregner W: https://www.r-bloggers.com/wilcoxon-mann-whitney-rank.../ Hvis H er sann, har vi statistisk teori som gir oss fordelingen til W. (For eksempel vil en standardisert W være N(,1)-fordelt når n er stor.) Effektmål: Effektmålet er et tall som oppsummerer forskjellen på gruppene («effekten» av å bruke en annen operasjonsmetode). I dette eksemplet med skjevfordelte data, er, og gjennomsnittene er ikke gode oppsummeringstall. Vi kan bruke medianene og forskjellen på medianene i stedet. Jeg velger altså effektmålet median2-median1=2. Ser vi på gruppestatistikken, tolkes dette som at vi estimerer at de som opereres med metode 1 blir smertefrie 2 timer tidligere enn de som opereres med metode 2. 95% konfidensintervall for populasjonsmedian2-populasjonsmedian1, altså den sanne forskjellen i rekonvalesenstid i populasjonen: Det er ikke pensum i kurset å beregne konfidensintervaller for medianer eller differanser av medianer, for da gjelder ikke CLT. Den som vil finne ut av det på egen hånd, må lese om bootstrapping. p-verdien og selve testen: p-verdien = P(å observere minst like ekstreme observasjoner som det vi har observert, gitt H ) = P( W 186 H ) =.15. Konklusjon: En så høy p-verdi (som.15) betyr at det er ganske sannsynlig («vanlig») å observere så store forskjeller (som 3 dager) på grupper av denne størrelsen og med disse standardavvikene. Disse observasjonene er altså ikke i konflikt med H, og vi beholder derfor H. OBS: For å forkaste H er det vanlig å velge signifikansnivået α=.5, altså at vi forkaster H hvis p-verdien er mindre enn.5. Men andre valg av α er fullt mulig. Hvis det har alvorlige negative konsekvenser å gjøre type I-feil, altså forkaste H på feil grunnlag, velges kanskje α =.1 eller enda mindre. 11

Vurdering av klinisk signifikans: Hvis forskjellen på gruppene (i populasjonen) virkelig er så stor som 2 timer, ville det muligens være klinisk interessant, fordi det kan bety en ekstra dose smertestillende. Her har vi to valg: Hvis støtten for dette i fysiologiske teorier er svak, slår vi oss til ro med at observasjonene våre bare var tilfeldige forskjeller, og at H er sann. Hvis det derimot er sterk støtte for en slik forskjell i fysiologiske teorier, kan vi ta utgangspunkt i det, og bruke observasjonene i denne studien til å gjøre en utvalgsberegning (ofte kalt en styrkeberegning) for en større studie som vil gi oss sikrere svar på problemstillingen. OBS: En større studie vil ikke garantere at vi finner en stor forskjell, men den vil gjøre konklusjonene våre sikrere, enten vi konkluderer med at det er en forskjell, eller at det ikke er en forskjell. Ekstrakommentar: t-testen er ganske robust, det vil si at dersom fordelingene ikke er for skjeve (altså at de ikke har for ekstreme ekstremverdier), vil p-verdien fra t- testen også kunne brukes for å sammenligne grupper. La oss sjekke her, siden data er skjevfordelte, men ikke ekstremt skjevfordelte: t.test(rekonv~metode) Welch Two Sample t-test data: rekonv by metode t =.55599, df = 31.621, p-value =.5821 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: -5.21395 9.12117 sample estimates: mean in group 1 mean in group 2 16.9375 14.13889 Da er det ikke aktuelt å rapportere gjennomsnitt, forskjell på gjennomsnitt eller konfidensintervall, men vi ser at p-verdien på.58 gir samme konklusjon som WRS-testen, altså Behold H. Hvis dere velger denne løsningen i praktiske situasjoner, er dette med robusthet vs skjevhet noe som må kommenteres. 12

Generelle betraktninger om de to testene Testene er basert på ulike forutsetninger/betingelser/antakelser, og vil ofte gi ulike (og også uriktige) svar hvis forutsetningene ikke er oppfylt. Hvis tvil: Ja takk begge deler, håp på samme konklusjon! Tilleggsinformasjon: t-tester gir samtidig deskriptiv statistikk for gruppene ( x og SD), samt estimater og KI for effektmål. Å velge WRS-test innebærer at median og kvartiler bør brukes som deskriptive mål for gruppene. Dette må beregnes i tillegg til MWW-testen. 13

14

15