Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

Like dokumenter
Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

MASTER I IDRETTSVITENSKAP 2012/2014. Individuell skriftlig eksamen. MAS 402- Statistikk. Tirsdag 9. oktober 2012 kl

Forelesning Enveis ANOVA

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TMA4240/4245 Statistikk Eksamen august 2016

UNIVERSITETET I OSLO

ØVINGER 2017 Løsninger til oppgaver

STK1000 Innføring i anvendt statistikk Eksamensdag: Tirsdag 12. desember 2017

Oppgaver. Multiple regresjon. Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

Oppgaven består av 9 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Log Linear Model. . Web Page: 2. (estimating parameter) ก (main effect) interaction effect

Medisinsk statistikk, del II, vår 2008 KLMED Lineær regresjon, Rosner Regresjon?

Lineære modeller i praksis

Medisinsk statistikk, del II, vår 2009 KLMED 8005

2005/11 Notater Anna-Karin Mevik. Notater. Usikkerhet i ordrestatistikken. Seksjon for statistiske metoder og standarder

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Generelle lineære modeller i praksis

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Tidspunkt for 10eksamen: 15. mai ,5 timer

De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Median og kvartiler for hver gruppe.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER STATISTICS FOR ECONOMISTS

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 07. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Forelesning Punktestimering

STK1100 våren 2015 P A B P B A. Betinget sannsynlighet. Vi trenger en definisjon av betinget sannsynlighet! Eksemplet motiverer definisjonen:

Investering under usikkerhet Risiko og avkastning Høy risiko. Risikokostnad prosjekt Snøskuffe. Presisering av risikobegrepet

Statistisk analyse av data fra planlagte forsøk

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Testobservator for kjikvadrattester

STK desember 2007

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2011

Løsningsforslag eksamen STAT100 Høst 2010

Multisample Inference del 2 (Rosner )

Eksamensoppgave i ST3001

Innhold. Multisample inference - del 2 (Rosner, ) Data Effect of Lead Exposure (Eks. i Rosner Kap mm)

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Variansanalyse. Uke Variansanalyse. ANOVA=ANalysis Of Variance

Eksamensoppgave i TMA4255 Anvendt statistikk

Analyse av sammenhenger

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

Alle deloppgaver teller likt i vurderingen av besvarelsen.

Kap. 12: Variansanalyse

ST0202 Statistikk for samfunnsvitere

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Appendiks 1: Organisering av Riksdagsdata i SPSS. Sannerstedt- og Sjölins data er klargjort for logitanalyse i SPSS filen på følgende måte:

EKSAMENSOPPGAVER STAT100 Vår 2011

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Statistikk og økonomi, våren 2017

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Analyse med uavhengige variabler på nominal- /ordinalnivå

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

ST0202 Statistikk for samfunnsvitere Kapittel 11: Anvendelser av kjikvadratfordelingen Kapittel 12: Variansanalyse (ANOVA)

ST0202 Statistikk for samfunnsvitere

Fra krysstabell til regresjon

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Eksamensoppgåve i TMA4255 Anvendt statistikk

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Hvordan får man data og modell til å passe sammen?

UNIVERSITETET I OSLO

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Klassisk ANOVA/ lineær modell

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Eksamensoppgave i TMA4255 Anvendt statistikk

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

Fylogeni. Eksempel på trær. Hvorfor fylogeni. Definisjoner

TMA4300 Mod. stat. metoder

UNIVERSITETET I OSLO

Econ 2130 uke 16 (HG)

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

Forsøksplaner, oppsett og datainnsamling, fra et statistisk ståsted

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Eksamensoppgave i SØK2900 Empirisk metode Empirical methods in Economics

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Transkript:

Enves varansanalyse (One-way ANOVA, fxed effects model Reaptulerng av t-testen for uavhengge utvalg fra to grupper, G og G : Observasjoner fra G : Y N(, σ j, j=,,...,n Observasjoner fra G : Y N(, σ, j=,,...,n j Estmatorene for forventnngene: ˆ = n Y = j Y og n j= n ˆ = n Y = Y j j= Tester hypotesen H 0: = mot H 0:. Forutsatt at varansen er den samme begge grupper, fås under H 0 testobservatoren ˆ ˆ T = t s / n + / n Dvs. t-fordelt med n +n - frhetsgrader. s er estmert felles standardavv. H 0 forastes dersom T > tn n α +, / ( n + n I tlfelle H 0 forastes, er onlusjonen enten > eller <, avhengg av størrelsen på de tlhørende estmatene ˆ og ˆ. Altså entydg onlusjon. Flere enn to grupper En generalserng av to-utvalgstesten ovenfor. Anta uavhengge utvalg fra grupper, G G, hvert med n uavhengge og normalfordelte observasjoner med onstant varans σ, og =,,...,. Observasjoner fra G : Y j N(, σ, j=,,...,n Observasjoner fra G : Y j N(, σ, j=,,...,n... Observasjoner fra G : Y N(, σ, j=,,...,n j Tester H 0: = =...=. Alternatvet tl H 0 rommer en ree mulgheter. Dersom f.es. =3, an alle forventnngene være forsjellge, eller så er to le og den tredje forsjellg fra de to. Generelt uttryt er testen: ' H :, ' mot H 0: = =... = for mnst ett par, '. I tlfelle forastnng av H 0, blr det neste å fnne ut hva avvet fra H 0 består av. Dette sal v omme tlbae tl senere. Enves ANOVA, modell V har følgende modell: Y = + e = + α + e j Y j er j-te observasjon gruppe er forventnngen gruppe er forventnngen tl alle Y j -ene samlet sett, "grand mean". α er avvet -te gruppes forventnng fra "grand mean". Hver enelt observasjon består av en onstant, et gruppespesft tllegg (eller fradrag α og et stoasts tllegg (fradrag e. e-ene antas normalfordelte og uavhengge med forventnng null og varans σ. Dette medfører E Y α H H0 : α = α =... = α = 0 Alternatvene blr H : α 0 for mnst én. ( j = = + og at 0 : = =... = er evvalent med Notasjoner, gjennomsntt og vadratsummer n Y = j n Y, gjennomsnttet av alle observasjonene gruppe j= N = n, totalt antall observasjoner = n Y = N Yj, gjennomsnttet av alle observasjonene = j= n ( Yj Y, Total Sums of Squares, (Total SS SS Tot = j= n ( Yj Y = j= n ( Y Y = ny ( Y = j= =, Wthn Sums of Squares, (Wthn SS SS Wthn SS E, Between Sums of Squares, (Between SS SS Between Det an vses at Total SS=Wthn SS + Between SS 3 4

Varabltet B 5 6 ANOVA-tabellen F-test av forventnngene Klde tl varasjon Kvadratsum (SS df SS F p MS = df Under H 0 : = =... = har v at Between (grupper mellom n = j= ( Y Y - Between MS = Between SS 0 F = Between MS Wthn MS F0 = Between MS F(, N Wthn MS Wthn (nnen grupper, resdual Total n = j= n = j= ( Y Y j ( Y Y j N- N- Wthn MS = Wthn SS N Det an vses at Wthn MS er en onsstent estmator for σ (varansen tl støyleddene og dermed tl Y. En av forutsetnngen ANOVA-modellen var at varansen var l alle grupper. De fleste programpaer har test for dette. 7 dvs F-fordelt med (-, N- frhetsgrader. Jo større Between MS er forhold tl Wthn MS, desto større blr F. Dersom observert 0 F0 > F, N, α, forastes H 0, og v onluderer at mnst ett par (, ' er forventnngene forsjellge, eller evvalent mnst én α 0. Noe utover det an v foreløpg e uttale oss om. F-testen er m.a.o. global den forstand at den e ser noe om hva en eventuell ulhet mellom forventnngene består. 8

9 0 Esempel Summary statstcs Teste ut 3 ule tlsetnnger (hemmere en jems prosess der utbyttet er Y. Prmært spørsmål: Har noen av hemmerne effet på utbyttet? Seundært spørsmål: I tlfelle effet, hvlen, evt. hvle hemmere har effet, og hvlen har størst effet? Desgn: Balansert desgn, 4 serer á 0 prøver. Én sere uten hemmer (Sere, de 3 andre serer (Sere,3,4 med hver sn type hemmer. Dette er et planlagt forsø der v har ontroll over espermentelle betngelser. Mer at allerede før nnsamlng av dataene har v en plan for hvordan de første omgang sal analyseres! Utbytte,00,00 3,00 4,00 Total N Mean Std. Devaton Std. Error 95% Confdence Interval for Mean Lower Upper Mnmu m Maxmu m 0 5,9000 3,0737,975 3,709 8,097 9,00 9,00 0 9,6000,9546,93333 7,4887,73 6,00 5,00 0,000 3,48967,0353 9,7036 4,6964 7,00 8,00 0 0,0000,9439,93095 7,8940,060 6,00 5,00 40,950 3,9486,6057 0,6698 3,80 6,00 9,00

Box-plott Søyledgram 30,00 30,00 7,50 Utbytte 5,00,50 3 Mean Utbytte 0,00 0,00 0,00 6 7,50 Utlggere?,00,00 3,00 4,00 0,00,00,00 Error bars: +/- SD 3,00 4,00 3 4 ANOVA-tabell Source Between Groups Wthn Groups Total Test for homogen varans Sum of Squares df Mean Square F Sg. 49,875 3 83,9 8,545,000 350,900 36 9,747 600,775 39 Levene Statstc df df Sg.,509 3 36,679 Dependent Varable: Utbytte Mean 95% Confdence Interval (I (J Dfference (I-J Std. Error Sg. Upper Lower LSD,00,00 6,30000(*,3963,000 3,4683 9,37 3,00 3,70000(*,3963,0,8683 6,537 4,00 5,90000(*,3963,000 3,0683 8,737,00,00-6,30000(*,3963,000-9,37-3,4683 3,00 -,60000,3963,07-5,437,37 4,00 -,40000,3963,776-3,37,437 3,00,00-3,70000(*,3963,0-6,537 -,8683,00,60000,3963,07 -,37 5,437 4,00,0000,3963,4 -,637 5,037 4,00,00-5,90000(*,3963,000-8,737-3,0683,00,40000,3963,776 -,437 3,37 3,00 -,0000,3963,4-5,037,637 Dunnett t (-,00,00-6,30000(*,3963,000-9,737 -,8763 sded 3,00,00-3,70000(*,3963,03-7,37 -,763 4,00,00-5,90000(*,3963,000-9,337 -,4763 Mer: SD( = MS Wthn( / n + / n = 9. 747( / 0 + / 0 =. 3963 5 6

Foreløpge onlusjoner Alle tre hemmere har statsts sgnfant effet og 4 er leverdge og ser ut tl å ha større effet enn hemmer 3, men er denne forsjellen statsts sgnfant? Undersøer med en mer onservatv test Ie-planlagte sammenlnnger Multple Comparsons Dependent Varable: Utbytte Tuey HSD Mean Dfference 95% Confdence Interval Lower (I (J (I-J Std. Error Sg. Upper,00,00 6,30000(*,3963,000,5396 0,0604 3,00 3,70000,3963,055 -,0604 7,4604 4,00 5,90000(*,3963,00,396 9,6604,00,00-6,30000(*,3963,000-0,0604 -,5396 3,00 -,60000,3963,6-6,3604,604 4,00 -,40000,3963,99-4,604 3,3604 3,00,00-3,70000,3963,055-7,4604,0604,00,60000,3963,6 -,604 6,3604 4,00,0000,3963,405 -,5604 5,9604 4,00,00-5,90000(*,3963,00-9,6604 -,396,00,40000,3963,99-3,3604 4,604 3,00 -,0000,3963,405-5,9604,5604 * The mean dfference s sgnfcant at the.05 level. 7 8 Homogeneous Subsets Testng ved hjelp av ontrast Tuey HSD Subset for alpha =.05 N,00 0 9,6000 4,00 0 0,0000 3,00 0,000,000 + 4 H 0 : 3 = Contrast Coeffcents Contrast,00,00 3,00 4,00 0,5 -,5,00 0 5,9000 Sg.,6,055 Means for groups n homogeneous subsets are dsplayed. a Uses Harmonc Mean Sample Sze = 0,000. Grupper som opptrer samme undergruppe (subset er e sgnfant forsellge. Contrast Tests Utbytte Assume equal varances Does not assume equal varances Contrast Value of Contrast Std. Error t df Sg. (- taled -,4000,097 -,985 36 0,055 -,4000,8539 -,867 5,576 0,08 9 0

Endelg onlusjon Kan e onludere entydg om gruppe 3 versus og 4. Den lgger en gråsone mellom det å høre tl ontrollgruppen og det å høre tl de to gruppene som med god margn er forsjellge fra ontrollgruppen. Velger enten hemmer fra gruppe eller hemmer fra gruppe 4.