Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Like dokumenter
Hypotesetesting. mot. mot. mot. ˆ x

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

6.2 Signifikanstester

Statistikk og dataanalyse

Fasit for tilleggsoppgaver

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Hypotesetesting av λ og p. p verdi.

Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (20)

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kapittel 10: Hypotesetesting

ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Hypotesetest: generell fremgangsmåte

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

ST0202 Statistikk for samfunnsvitere

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk Eksamen desember 2015

Kapittel 3: Studieopplegg

i x i

Verdens statistikk-dag.

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

TMA4240 Statistikk H2010 (19)

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

TMA4245 Statistikk Eksamen desember 2016

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Formelsamling i medisinsk statistikk

Fra første forelesning:

Eksamensoppgave i TMA4240 Statistikk

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Kort overblikk over kurset sålangt

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

Kapittel 4.4: Forventning og varians til stokastiske variable

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 16. april 2015 kl

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

7.2 Sammenligning av to forventinger

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Mer om hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

UNIVERSITETET I OSLO Matematisk Institutt

Forkurs i kvantitative metoder ILP 2019

Løsningsforslag Til Statlab 5

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Løsningsforslag til obligatorisk innlevering 3.

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

HØGSKOLEN I STAVANGER

Test, 3 Sannsynlighet og statistikk

Seksjon 1.3 Tetthetskurver og normalfordelingen

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

TMA4240 Statistikk H2010 (22)

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Estimering og hypotesetesting

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Obligatorisk oppgave 2

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Inferens i fordelinger

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Tabell 1: Beskrivende statistikker for dataene

Kan vi stole på resultater fra «liten N»?

Betinget sannsynlighet

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

statistikk, våren 2011

1 10-2: Korrelasjon : Regresjon

Estimering og hypotesetesting

Oppgaver til Studentveiledning I MET 3431 Statistikk

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Utvalgsfordelinger (Kapittel 5)

Eksamen i emnet Stat111 - Statistiske metoder 28. mai 2014, kl

Transkript:

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Wilcoxon Signed-Rank Test I uke, bruker vi Z test eller t-test for hypotesen H:, og begge tester er basert på forutsetningen om normalfordeling eller tilnærmet normalitet av populasjon Men i noen situasjoner, er størrelsen på et utvalg veldig lite og vi kan ikke få nyttig informasjon for å se hvilke fordelingen de kommer fra, deretter en fordeling-fritt eller ikke-parametrisk prosedyren er nødvendig, (Bootstrap er en type ikke-parametrisk metode) Her introduseres en ikkeparametrisk test for H: : Wilcoxon signed-rank test Denne testen kan brukes til tilfellet av symmetriske kontinuerlige fordelinger uten antagelser om fordelingen av den underliggende populasjon Antagelse (assumption):, 2, 3,, n er uavhengige stokastiske variabler fra en kontinuerlig og symmetrisk fordeling med forventning (under symmetrisk antagelse, forventning = median) Vi begynner med enklest tilfellet H : Eks En kjemiker gjentar et bestemt eksperiment totalt ganger og fikk følgende verdier av reaksjonstemperatur i stigende rekkefølge: -57, -9, -5, 76, 3, 22, 27, 246, 268, 32 Anta at fordelingen av reaksjonstemperaturen er symmetrisk Vi vil bruke Wilcoxon signed-rank test for å se om forventning til reaksjonstemperaturen er : H : Trinn Ranger de absolutte størrelsene (absolute magnitude) av observasjonene fra til (vi har observasjon her), med den minste (5) får rang og høyeste (32) få rang Trinn 2 Bruk tegn (+ eller -) fra hver opprinnelig observasjon til tilsvarende rangering Trinn 3 Beregn verdi til test statistikk S = summen av de positivt signerte rangeringene ( S er SV før vi har fått observasjon, med tilsvarende verdi s etter vi har fått observasjonene) Tabell Trinn, 2, 3 i Wilcoxon signed-rank test

Prinsippet i Wilcoxon signed-rank test er følgende: Hvis H : er sann, bør utfallet fordele seg jevnt under eller opp Det fører til at positivt signerte rangeringer skal være blandet jevnt med de negativt signerte rangeringene, og s skal ikke være meget stor eller meget liten a H : Når er signifikant større enn, skal de fleste utfall med større absolutte størrelsene være positive, og resulterer i mange store positiv signerte rangeringer i Trinn 2 og en stor verdi av s I Trinn 3 Vi forkaster H når s er større en kritisk verdi c b H : Når er signifikant mindre enn, skal de fleste utfall med større absolutte størrelsene være negative, noe som resulterer i mange store negativ signerte rangering i Trinn 2 og en liten verdi av s I Trinn 3, så vi forkaster H når s er mindre enn kritisk verdi c 2 c H : Vi forkaster H når s er meget stor eller meget liten: vi forkaster H når s < en kritisk verdi c l eller s > en kritisk verdi c o De kritiske verdiene er valgt til å kontrollere = P(type I feil) = P(forkaster H når H er sann) For å finne kritisk verdier, må vi finne fordeling av test statistikken S under H La oss ta n = 5 som eksempel for å se fordeling av S Fordi hver rangering kan ha en - tegn eller et + tegn, når vi har 5 rangeringer, er det 5 2 32 måter (kombinasjoner) å tildele tegn til de 5 rangeringene, 2, 3, 4 og 5 Når H er sann, har enhver kombinasjon av de 5 signerte rangeringene den samme sjansen som noe annen kombinasjon, med sannsynlighet 32 : Tabell 2 32 kombinasjoner av alle mulige rangeringene

Fra verdiene av s i Tabell 2, kan vi få fordeling av S, for eksempel, P( S = 3)= P(vi får kombinasjonene (-, -2, 3,-4,-5) og (,2,-3,-4,-5) = 2 Se Tabell 3 32 32 32 Tabell 3 Fordeling av S under H Verdiene av S er fra til 5, og symmetrisk fordelt rundt median 7,5 Mer generelt, for utvalgsstørrelse n Verdiene av S er fra (alle observasjoner er negative) til + 2+ + n = n(n + ) / 2 (alle observasjoner er positive), og er symmetrisk fordelt rundt n (n + ) / 4 (fordi positivt signerte rangeringer er blandet jevnt med negativt signerte rangeringer under H ) Når n = 5, kan vi da velge kritiske verdier og beregne tilsvarende sannsynlighet for type I feil = P(forkaster H når H er sann), basert på fordelingen i Tabell 3 Eks 2 n = 5, beregne sannsynlighet for type I-feil i de følgende tilfellene a H :, sett c = 3 og vi forkaster H når s c b H :, sett c2 3 og vi forkaster H når s c2 c H :, sett cl, co 4 Vi forkaster H når s < c l eller s > c o (MPF) Vi ser at fordi S har en diskret fordeling, vil det ikke alltid eksistere en kritisk verdi som svarer nøyaktig til en av de vanlige signifikantnivåer (Type I feil), slik som,5,, Men vi kan finne kritisk verdi slik som kan gi ut sannsynlighet for type I feil tilnærmer,5 (Eks 2 a, c) eller, (Eks 2 b) Generelt, for et utvalg med størrelse n, er det 2 n kombinasjoner å tildele tegn til de n rangeringene Når H er sann, har enhver kombinasjon sammen sannsynlighet / 2 n og fordelingen av S kan lett skaffes Vedlegg Tabell A 2 gir kritisk verdier for n opp til 25 Enda mer generelt, nullhypotesen H: håndteres ved å trekke fra hver i og bruker ( i ) 's som i ble tidligere brukt Og nå kan vi få følgende testprosedyre i Wilcoxon signed-rank test ( H er samme som H ):

Eks 3 En produsent av frokostblandinger ønsker å bekrefte at en filler maskin er riktig kalibrert Maskinen er ment å fylle ett boks med 46g på gjennomsnitt Vi når veier 5 full bokser, og får følgende vekter: 454,4 47,8 447,5 453,2 462,6 445, 455,9 458,2, 46,6 457,3 452, 464,3 459,2 453,5 465,8 Det antas at avvikelse fra 46g er like sannsynlig å være positiv som negativ (i samsvar med symmetri antagelsen), men fordelingen kan ikke være normal Derfor vil Wilcoxon signed-rank test anvendes for å se om filler maskinen er riktig kalibrert Signifikantnivå er satt som rundt 5 Hypotesene er H : 46 versus H : 46, hvor er forventet vekt Trekke 46 fra hver observasjoner gir: a -56 8-25 -68 26-5 -4-8 6-27 -8 43-8 -65 58 Basert på de ovennevnte 3 trinnene, kan vi få følgende tabell: Tabell 4 Rangeringene og tilsvarende tegner i Eks3 (MPF) 2 The Wilcoxon Rank-Sum Test Nå antar vi har to uavhengige tilfeldige variabler og med forventningene henholdsvis og Når vi bruker Z-test eller t-test for å sammenligne og i uke, krever vi forutsetningen om normalitet (minst ca) Men når minst en av utvalgsstørrelser fra og er liten og vi kan ikke si mye om fordelingene basert på observasjonene, må vi slå til ikkeparametrisk metode igjen Den Wilcoxon rank-sum testen kan være ikke-parametrisk alternativ til Z eller t-test I likhet med Wilcoxon signed-rank test, er Wilcoxon rank-sum test basert bare på rangeringene av observasjonene fra de to sett av utvalg fra og

Antagelse:, 2, 3, m og, 2, 3, n ( m kontinuerlige variabler og med forventningene n) er uavhengige SV fra to og henholdsvis Fordelingene til og har samme form og spredning, den eneste mulige forskjellen mellom de to variablene er og Når H: er sann, er det fordelingen forskyves med til høyre for -fordeling Vi begynner med enkleste tilfellet med H : og kommer fra samme fordeling, og vi kan bygge statistisk hypotesetest i tre ulike situasjoner: () H : fordelingen av er forskjøvet til høyre for fordeling av (2) H : fordelingen av er forskjøvet til venstre for fordeling av (3) H : tosidig-alternative Anta at vi har observasjonene x, x 2,, x m og y, y 2,, y n, m testen: Trinn Bland x-ene og y-ene i en kombinasjon av størrelse m + n n Vi kan følge 3 trinn i Trinn 2 Ranger observasjonene i kombinasjonen fra minste til største, med den minste få rangering og den største få rangering m + n Trinn 3 Beregn verdien av følgende test statistikk W = summen av de m rangeringene som er forbundet med -ene (W er SV, og vi bruker w etter vi har fått observasjonene og regnet verdien til W) Hvis H : er sann, blir alle m + n observasjoner trekkes faktisk fra den samme fordelingen og w skal ikke være før stor eller for liten Testen prosedyre basert på W er å avvise H dersom den beregnede verdien w er "for ekstrem" () Anta at H : er sann, observasjonene fra vil inneholde flere av de større rangeringene og w vil være stor Vi forkaster H for uvanlig stor w (2) H : vil resultere i en liten w, og vi forkaster H for uvanlig liten w (3) For tosidig test H :, en w som enten er for stor eller for liten gir bevis mot H

Vi tar m = 3, n = 4 som eksempel I dette tilfellet er w summen av de 3 rangeringene (en rangering trippel) forbundet med de tre observert x-ene i Trinn 2 For eksempel, x 3, x 67, x 2 ; y 527, y2 89, y3 386, y4 9 2 3 Trinn Bland x-ene og y-ene i en kombinasjon av størrelse 7 x 3, x2 67, x3 2 y 527 y2 89, y3 386, y4 9 Trinn 2 Ranger observasjonene i kombinasjonen fra minste til største Observasjon: -3 (x), 9(y), 67(x), 89 (y), 2(x), 386(y), 527(y) Rangering: 2 3 4 5 6 7 Trinn 3 Beregn verdien av summen for de 3 rangeringene som er forbundet med - ene: w = + 3 +5 =9 Generelt, når vi har totalt 7 observasjonene, har vi C (Vi har 7 3 7 = 35 mulige rangeringstrippel 3 7 C 3 måter for å velge 3 rangeringer fra totalt 7 rangeringer) Når H er sann, alle syv observasjoner kommer faktisk fra samme populasjon og hver rangeringstrippel som er forbundet med de tre x- ene har den samme sannsynlighet Slik som den rangeringstrippel 35 for de tre x- ene kan være (, 4, 5), w = ; eller (3, 5, 6), w = 5; eller (4, 5, 6), w = 5, med samme sannsynlighet Hvis vi lister opp alle 35 tripler og den tilsvarende w verdi, kan 35 sannsynlighetsfordelingen av W beregnes og vises i Tabell 5 nedenfor: Tabell 5 Fordeling av W under H Den minste mulige verdien av W er w = + 2 + 3 = 6 (hvis alle tre x-ene er mindre enn alle fire y-ene), og den største mulig verdien er w = 5 + 6 + 7 = 8 (hvis alle tre x-ene er større enn alle fire y-ene) Fordelingen er symmetrisk om (6 + 8) / 2 = 2 Vi vil H hvis vi har fått ekstrem verdi om w Basert på fordelingen i Tabell 5, kan vi da regne = sannsynlighet for type I feil = P(forkaster H når H er sann) for et valgt forkast område:

Eks 4 Når m =3, n =4, Beregn for følgende tilfeller a H :, og forkast område er {7, 8} b H :, og forkast område er {6, 7} c H :, og forkast område er {6, 8} (MPF) Samme som den Wilcoxon signed-rank test, på grunn av at W er diskret fordelt, vil det ikke alltid eksistere en kritisk verdi som tilsvarer nøyaktig en av de vanlige signifikantnivåer, slik som,5,, Men vi kan finne kritisk verdi slik som kan gi som tilnærmer,5 eller, For generell m og n ( m n), bli den minst mulige verdi av statistikken W være + 2 + + m = m (m + ) / 2 og størst mulig verdi av statistikken W er + 2 + + (n + m) - ( + 2 + + n) = m (m + 2n + ) / 2 Fordelingen av W er symmetrisk om m (m + n + ) / 2 Enda mer generelt, H: håndteres ved å trekke fra hver i, i,, m og bruker ( i ) 's som i Wilcoxon signed-rank test: i ble tidligere brukt Og nå kan vi bruke følgende testprosedyre Vedlegg Tabell A3 gir kritisk verdier for signifikantnivå nærmer,5,,25,, og,5 Tabellen gir informasjon kun for m = 3, 4,, 8 og n = m, m +,, 8 For m og n som overstiger 8, en normal tilnærming kan benyttes (Gruppe øvelse)

Eks 5 Urin-fluor-konsentrasjon (deler per million) ble målt både for et utvalg (n =7) av husdyr på beite som er tidligere utsatt for fluor forurensning og for et annet utvalg (m =5) av husdyr på beite i et ikke-forurenset område, se Tabell 6 Urin-fluorkonsentrasjon av husdyr fra forurenset beite er, fra ikke-forrenset beite er Tabell 6 Urin-fluor-konsentrasjon fra 2 utvalgte husdyr Vi rangerer observasjonene og få resultat I Tabell7: Tabell 7 Rangering av alle observasjonene Har dataene indikert sterkt at forventet fluor konsentrasjon for husdyr fra beite i forurenset regionen er større enn ikke-forurenset regionen? Bruk den Wilcoxon ranksum test og signifikantnivå er satt som, (MPF) Noen kommentarer: ) Wilcoxon test er mye mindre følsom for «outliers» enn t-test 2) Wilcoxon test har den ulempen at den er følsom på andre forskjeller (foruten forventning forskjell) mellom fordelinger 3) Når forutsetningene i t-test er oppfylt, har Wilcoxon test mindre sannsynlighet for å avsløre en lokasjon forskyvning enn t-test Imidlertid tapene i denne forbindelsen er vanligvis ganske liten 4) Wilcoxon test kan anvendes for kategoriske data hvor det er mulig å rangere observasjonene 5) I en praktisk situasjon hvor vi er ikke helt sikker på om t test eller Wilcoxon test ska anvendes, bruker vi begge og gleder oss når de to føre til like konklusjoner

3 Bivariat normalfordeling ) I mange tilfeller, har vi flere variabler som hver for seg er normalfordelt og avhengige av hverandre Da snakker vi om at variablene er multinomalt fordelte Det enkleste tilfellet: bivariat normalfordeling med to normalfordelte variabler og fesk, Vekt og høyde på en tilfeldig person Varighet og kostnad av et prosjekt Inntekt og formue for en tilfeldig industriarbeider Def Den simultane sannsynlighetsfordelingen for og som er bivariat normalt fordelte er Vi har 5 parameter ligning (): Cov(, ) E( ), E( ), Var( ), Var( ), For at forenkler regningen, kan vi gjennomføre variabelskiftene slik: Da har vi, og den simultane sannsynlighetsfordelingen for ny og ny er slik: 2) Formen på den simultane sannsynlighetsfordelingen har sterk forbindelse med Se på den følgende grafen: i alle figurene har vi ; 35, men er forskjellige:

8 97 8 *Hvis og er bivariat normalt fordelte, da er og uavhengige if and only if!! Dette er en matematisk fordel for normal fordelt variablene betyr ikke bare lineære uavhengige, det betyr totalt uavhengige!! 3) Vi kan også regne ut marginalfordelinger f ( x ) og f ( y ) er henholdsvis: *Hvor er? Hvis vi omskriver ligningen (2) slik i ligningen (3): Vi har også: Da kan vi få den betinget fordeling, feks, f : f er fortsatt en normalfordeling med forventningsverdi og varians:

4) Lineær kombinasjon av bivariat normalfordelte variabler Hvis og er bivariat normalt fordelte, da er hver eneste lineær kombinasjonen Z a b er normal fordelt med E( Z) E( a b ) a b 2 2 2 2 Var( Z) Var( a b) a b 2ab Eks 6 Anta at høyder av ektepar er bivariat normalfordelt Dersom koner har en forventet høyde på 66,8 inches, og standardavvik på 2 inches mens høydene av ektemenn har en forventning på 7 inches, og et standardavvik på 2 inches Korrelasjonen av høydene til menn og koner er 68 Hva er sannsynligheten for at en tilfeldig valgt kone er høyere enn sin mann? (MPF)