Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)

Like dokumenter
Forelesning Enveis ANOVA

Forelesning Punktestimering

Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Løsningsforslag Eksamen i Statistikk Nov 2001 Oppgave 1 a) Det fins 8 mulige kombinasjoner. Disse finnes ved å utelate ett og ett tall.

Oversikt over tester i Econ 2130

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

TMA4245 Statistikk Eksamen august 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Estimering. Målemodellen. Kp. 5 Estimering. Målemodellen.

TMA4245 Statistikk Eksamen mai 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk

Forelesning 19 og 20 Regresjon og korrelasjons (II)

Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

Om enkel lineær regresjon II

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

1. Konfidens intervall for

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

Regler om normalfordelingen

Regler om normalfordelingen

Introduksjon til generelle lineære modeller (GLM)

Om enkel lineær regresjon II

Regler om normalfordelingen

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Oversikt over tester i Econ 2130

Analyse av sammenhenger

Forelesning Ordnings observatorer

STK1100 våren Konfidensintevaller

Om enkel lineær regresjon II

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

Statistikk med anvendelse i økonomi

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

TMA4245 Statistikk Eksamen 21. mai 2013

Innføring i medisinsk statistikk

Econ 2130 uke 15 (HG)

Eksempel 1 - Er gjennomsnittshøyden for kvinner i Norge økende?

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Løsningskisse seminaroppgaver uke 17 ( april)

TMA4240 Statistikk Høst 2016

Oversikt over konfidensintervall i Econ 2130

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

(ii) Anta vi vet om en observasjon av X at den ikke er større enn 5. Hva er da sannsynligheten for at den er lik 5? (Hint: Finn PX ( = 5 X 5) ).

Seminaroppgaver for uke 13

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Oversikt over tester i Econ 2130

EKSAMEN løsningsforslag

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

Medisinsk statistikk, del II, vår 2008 KLMED Lineær regresjon, Rosner Regresjon?

Medisinsk statistikk, del II, vår 2009 KLMED 8005

Mer om Hypotesetesting (kap 5) Student t-fordelingen. Eksamen. Fordelingene blir like ved stor n:

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT. Innleveringssted: Ekspedisjonen i 12. etasje (mellom ) OG Fronter (innen klokken 15).

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Visuell/grafisk presentasjon av data. Datainnsamling; utdanning og inntekt

Forelesning Z-, t-test, test for forventningsdifferanser

ECON240 Statistikk og økonometri

Erling Siring INNHOLD

Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Econ 2130 uke 13 (HG)

Forelesning 3 mandag den 25. august

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

STK1100 våren 2015 P A B P B A. Betinget sannsynlighet. Vi trenger en definisjon av betinget sannsynlighet! Eksemplet motiverer definisjonen:

Positive rekker. Forelest: 3. Sept, 2004

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Statistikk og økonomi, våren 2017

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Algoritmer og datastrukturer Avsnitt Algoritmeanalyse

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

2005/11 Notater Anna-Karin Mevik. Notater. Usikkerhet i ordrestatistikken. Seksjon for statistiske metoder og standarder

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

TMA4240 Statistikk Høst 2016

Hypotesetesting, del 4

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Kapittel 1: Beskrivende statistikk

Econ 2130 Forelesning uke 11 (HG)

Oversikt over konfidensintervall i Econ 2130

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ØVINGER 2017 Løsninger til oppgaver

ECON 2200 VÅREN 2014: Oppgaver til plenumsøvelse den 12.mars

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Oversikt over konfidensintervall i Econ 2130

Løsning TALM1005 (statistikkdel) juni 2017

TMA4240 Statistikk Høst 2016

Transkript:

Eves varasaalyse (Oe-way ANOVA, fxed effects model) (Notat tl Kap. Roser) V reaptulerer først t-teste for to uavhegge utvalg. Stuasjoe var at v hadde to grupper, f.es. G og G og et sett uavhegge og dets ormalfordelte observasjoer fra begge. Observasjoer fra G : Observasjoer fra G : j N (, σ ), j=,,..., j N (, σ ), j=,,..., Estmatoree for forvetgee er heholdsvs ˆ = j = og ˆ = j =. j= j= Oppgave er å å teste hypotese H 0 : = mot H :. Forutsatt at varase er de samme begge grupper, får v uder H 0 testobservatore ˆ ˆ T = s / + / der s er estmert felles stadardavv, og v foraster H 0 dersom T > t +, α / I tlfelle H 0 forastes, er olusjoe ete at > eller at <. Hvle at de to alteratvee er bestemt av størrelse på de tlhørede estmatee ˆ og ˆ. V eder således opp med e etydg olusjo. Nå teer v oss at v har flere e to grupper der v sal sammele forvetgee. Dette blr på sett og vs e geeralserg av to-utvalgsteste ovefor. Ata at v har uavhegge grupper, hver med uavhegge og ormalfordelte observasjoer med varas σ, =,,..., og j=,,. V får da: Observasjoer fra G : Observasjoer fra G :... Observasjoer fra G : j j j N(, σ ), j=,,..., j j N(, σ ), j=,,..., N(, σ ), j=,,..., j V sal å teste H 0 : = =...=. Alteratvet tl H 0 rommer e ree mulgheter. Dersom =3, a v f.es. ha at ete er alle forvetgee forsjellge, eller så er to le og de tredje forsjellg fra de to. Geerelt a H formuleres som H : ' for mst ett j

par,. V sal m.a.o. teste mot H 0 : = =... = : ', ' for mst ett par ' H,. Dersom resultatet av teste er forastg av H 0, blr det este å fe ut hva avvet fra H 0 består av. Dette sal v omme tlbae tl seere. V har følgede modell: = + α + e j j j er j-te observasjo gruppe er forvetge tl alle j -ee samlet sett, "grad mea". α er avvet -te gruppes forvetg fra "grad mea". V har mao at hver eelt observasjo består av e ostat, et gruppespesft tllegg (eller fradrag) α og et stoasts tllegg (fradrag) e j. V forutsetter at e j -ee er ormalfordelte med forvetg ull og fra å av samme ujete varasσ, sl at e N(0, σ ) for alle og j j Dessute forutsettes at alle e j -ee er uavhegge. Modelle gr at E ( j ) = = + α. Dette medfører at H 0 : = =... = er evvalet med H 0 : α = α =... = α = 0. Alteratvee blr H : 0 α for mst é. V deferer oe otasjoer tl seere bru: j j= = = = j= = j j, dvs gjeomsttet av alle observasjoee gruppe, dvs summe av alle observasjoee N =, dvs atall observasjoer totalt.. = N, dvs gjeomsttet av alle observasjoee Dersom = for alle (lt atall alle grupper), har v balasert desg, oe som bør tlstrebes ford det gr optmaltet testg. For å largjøre otasjoe samler v alle observasjoee e tabell:

Gruppe Gruppe Gruppe Mer otasjoe. For esempel vl 34 bety observasjo r. 4 gruppe 3, osv. Det a vses at ˆ = er e forvetgsrett estmator for = + α og at σ Var( ˆ )=. Varase σ a prspp estmeres separat e hver gruppe, me det er mer effetvt å estmere de ut fra samtlge data, oe v sal omme tlbae tl. Som regresjosaalyse betrater v å vadratsummer basert på varasjo dataee. De totale vadratsumme er et uttry for dataes (resposvarabeles) varasjo rudt det store gjeomsttet. De del av Total SSsom forlares av modelle, uttryes ved de eelte gruppers varasjo rudt det store gjeomsttet uttryt ved vadratsumme Det som å gjestår av de totale varasjoe, er de som syldes varasjoe e de eelte grupper, oe som v tlsrver de tlfeldge avv og som seere daer grulag for estmerg av varase σ. Kvadratsummee dette represeterer, uttryes som Wth SS = ( ) Total SS = ( ) = j= Betwee SS = ( ) = j= = j j Det a vses at Total SS=Betwee SS + Wth SS V ser at jo mer ett eller flere av gruppegjeomsttee avver fra det totale gjeomstt, desto større blr adele av modellforlart varasjo forhold tl total varasjo, oe som treer retg av at ullhypotese må forastes. Me for å ue ta e formell beslutg, må v ostruere e testobservator med jet fordelg år H 0 gjelder. Som regresjosaalyse samler v resultatee e ANOVA-tabell: 3

Klde tl varasjo Kvadratsum (SS) df SS MS = df F p Betwee (grupper mellom) Wth (e grupper, resdual) Total Betwee SS = ( ) = Wth SS = ( ) = j= Total SS = ( ) = j= j j - N- N- Betwee SS Betwee MS = Wth SS Wth MS = N F = 0 Betwee MS Wth MS Det a vses at Wth MS er e osstet estmator for σ, varase tl støyleddee og dermed tl. E av forutsetge ANOVA-modelle var at varase var l alle grupper. De fleste programpaer har test for dette. Uder H 0 har v at Betwee MS F0 = F(, N ) Wth MS dvs F-fordelt med (-, N-) frhetsgrader. Dersom observert F0 > F, N, α, forastes H 0, og v oluderer at mst ett par, er forsjellge, eller evvalet, mst é α 0. Noe utover det a v foreløpg e uttale oss om. Etter ANOVA ANOVA-alulasjoee tester ullhypotese at alle observasjoee fra alle gruppee stammer fra fordelger med samme forvetg. Å teste dee hypotese alee er sjelde formålet med e stude. Heste er som regel å vurdere gruppee seg mellom, for esempel å sammele grupper parvs eller gruppesammesetg mot e ae gruppesammesetg. Multple sammelger er e fellesbetegelse for dette. Dersom F-teste ovefor e gr sgfat resultat, er sae avgjort: De observerte data gr e gru tl å hevde at gruppeforvetgee er forsjellge, og v stopper der. Slår dermot teste sgfat ut, må v gå vdere og fe ut hva avvet fra H 0 består. Me her fs ge automat. Ata at v har 5 grupper beteget A, B, C, D og F. Prspelt a v tee oss 4 stuasjoer:. Alle mulge sammelger, også gjeomstt eller evt. vede gjeomstt av grupper. For esempel a det være teressat å sammele gjeomsttet av gruppe A og B mot gjeomsttet av gruppe C, D og E. Eller sammele A mot gjeomsttet av B, C og D osv. Tl dette formålet e Scheffé s test de rette.. Alle mulge parvse sammelger. Har v g grupper, utgjør dette alt 4

gg ( )/ eelttester. Tl dette formålet beyttes Tuey eller Newma-Keuls test. 3. Alle mot é otroll. Dersom gruppe A er otroll, sal det testes mot gruppe B, C, D, E og F. Her beytter Duett s test. 4. Bare oe få sammelger bestemt på forhåd ut fra vtesapelge rterer. For esempel gruppe A mot B og C, og det et alt. He beyttes Boferro s test. Multple sammelger betyr at det utføres flere sammelger samtdg sl som alle 4 stuasjoer ovefor. Post hoc- test brues stuasjoer der ma etter å ha studert de atuelle data avgjør hvle tester som sal utføres. Ma treger e å plalegge på forhåd. Stuasjo ovefor er åpebart post hoc-testg. Stuasjo og 3 rever at det gjøres oe beslutger basert på orete problemstllger. Hvs ma for esempel sammeler alle par av grupper, har ma mplstt besluttet e å utføre alle de geerelle sammelger evt put. I stuasjo 3 har ma besluttet e å sammele alle grupper seg mellom, bare å sammele mot é otroll. Ford brue av dsse testee rever beslutger foretatt før dataee observeres, er stuasjo og 3 stregt tatt e post hoc-tester. Plalagte sammelger forutsetter at ma osetrerer seg om et fåtall vtesapelg baserte problemstllger. Det er e tllatt å la dataee tale for seg og på det grulag velge ut hva som sal sammeles. Hva som sal testes, må være bestemt på forhåd som ledd desg av e stude eller et espermet vd forstad. Stuasjo 4 er et typs esempel på dette. Termologe ovefor er e alltd brut osstet. Tester for multple sammelger brues ofte syoymt med post hoc-tester. Stregt tatt utgjør sstevte tester e udergruppe av multple sammelger og beyttes de tlfeller der ma etter å ha observert dataee bestemmer seg for hvle sammelger som sal gjøres. I sle tfeller stlles det høyere rav tl testvået for e å begå fel av Type I. Alle multple sammelgstester er forsjellge fra ordære t-tester. Selv ved sammelg av to og to grupper, der e stadard toutvalgs t-test vlle være ærlggede, bruer teste et varasestmat basert på data fra alle gruppee, også fra de gruppee som e er drete volverte hypotese. Ata at v har g grupper og sal teste H 0 : = mot H 0 :. V har da at og V foraster H 0 dersom σ N(, ) σ N( ', ) ( ) > t Wth MS / + / N g, α / 5

Mer at varaseσ estmeres med Wth MS fra ANOVA-tabelle. Dette gr flere frhetsgrader og derved et pressere estmat e u å brue dataee fra de to gruppee v sammeler. Det gr mdre sgfassasylghet (lavere p-verd) og større teststyre. Geerelt gjelder det statst at e bør tlstrebe å brue mest mulg tlgjegelg formasjo. I esemplet ovefor er det beyttet formasjo fra grupper som selv e er atuelle for sammelg, me som bdrar med formasjo om varase. Det adre aspetet ved multple sammelger er forsøet på å opprettholde sgfasvået for hele famle av sammelger sarere e vået tl de eelte sammelgstest. Det betyr at dersom alle gruppee vrelghete hadde de samme forvetgsverd, er sasylghete α for at e hvle som helst eller flere av sammelgee vlle få e statsts sgfat olusjo ved re tlfeldghet. For å oppå dette må metodee for multple sammelger beytte e mer strt defsjo av sgfas. E eel orresjo for sle multple t-tester er å stramme vået for de eelte t-test tl α / m, der α er vået F-teste og m er atall parsammelger. Dette alles Boferro-orresjo. Metode er mdlertd oservatv de forstad at det mage tlfeller stlles uødg strege rav tl vået tl de eelte test. Eelte statstere abefaler e å orrgere for multple sammelger år ma bare utfører et fåtall, opptl g-, plalagte sammelger. Begruelse er at ma sal få e slags bous som beløg for å ha plalagt e målrettet stude. Argumetet er dette: Ata at det på forhåd plalegges tre sammelger ett og samme espermet. Alteratvet er å utføre tre separate espermeter. I så tlfelle tregte ma e å justere for multple sammelger, me hvorfor gjøre det dersom ma plala på forhåd og utførte sammelgee som del av ett og samme espermet desget tl det bestemte formålet? Adre statstere meer at ma alltd sal justere for multple sammelger. Ettersom sae er otroversell, er det ødvedg at ma besrver s problemstllg og metode detaljert. Harald Johse, februar 008 6

7