MOT310 Statistiske metoder 1, høsten 2011

Like dokumenter
Kp. 13. Enveis ANOVA

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Oppgave 1. Kilde SS df M S F Legering Feil Total

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

Oppgave N(0, 1) under H 0. S t n 3

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Kp. 12 Multippel regresjon

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Oppgave 14.1 (14.4:1)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Eksamensoppgave i TMA4255 Anvendt statistikk

Løsningsforslag eksamen 27. februar 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Løsningsforslag eksamen 25. november 2003

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

HØGSKOLEN I STAVANGER

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgave i TMA4255 Anvendt statistikk

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Kp. 9.8 Forskjell mellom to forventninger

UNIVERSITETET I OSLO

Eksamensoppgåve i TMA4255 Anvendt statistikk

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Oppgave 13.1 (13.4:1)

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4240 Statistikk H2010 (20)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

ÅMA110 Sannsynlighetsregning med statistikk, våren

Eksamensoppgåve i TMA4255 Anvendt statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

Tilleggsoppgaver for STK1110 Høst 2015

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Eksamensoppgåve i TMA4255 Anvendt statistikk

TMA4240 Statistikk Høst 2016

ECON240 VÅR / 2016 BOKMÅL

Kapittel 3: Studieopplegg

ST0202 Statistikk for samfunnsvitere

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

EKSAMENSOPPGAVER STAT100 Vår 2011

UNIVERSITETET I OSLO

Eksamensoppgåve i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Statistisk analyse av data fra planlagte forsøk

HØGSKOLEN I STAVANGER

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Løsningsforslag eksamen STAT100 Høst 2010

TMA4245 Statistikk Eksamen august 2014

ST0202 Statistikk for samfunnsvitere

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Eksamensoppgåve i TMA4255 Anvendt statistikk

Kapittel 9 og 10: Hypotesetesting

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Fasit for tilleggsoppgaver

Variansanalyse. Uke Variansanalyse. ANOVA=ANalysis Of Variance

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Testobservator for kjikvadrattester

ST0202 Statistikk for samfunnsvitere

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Eksamen i emnet Stat111 - Statistiske metoder 28. mai 2014, kl

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

TMA4245 Statistikk Eksamen desember 2016

10.1 Enkel lineær regresjon Multippel regresjon

MOT310 Statistiske metoder 1, høsten 2011

UNIVERSITETET I OSLO

ST1201 Statistiske metoder

Inferens i fordelinger

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Transkript:

MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 2 / 15

Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely Randomized Design 13.13 Potential Misconceptions... (13.4 13.12 er ikke med i pensum.) Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 3 / 15 Enveis variansanalyse -tabell En-veis variansanalyse: undersøker eventuell effekt av én faktor. sammenligner flere (>2) grupper (undersøker om forventningene er ulike i gruppene) Eksempel: Bremselengde; fire ulike dekktyper. Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 4 / 15

Enveis variansanalyse, modell -tabell gruppe 1 2 k y 11 y 21 y k1.. y 1n1 y 2n2 y knk gj.sn. y 1 y 2 y k y. Her er: y i = 1 ni n i j=1 y ij, y = 1 k N i=1 (og N = n 1 + + n k ) ni j=1 y ij Modell: Y ij N(μ i,σ 2 ), og alle Y ij uavhengige. Eller: Y ij = μ i + ɛ ij, der ɛ ij N(0,σ 2 )... antakelsene er...? Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 5 / 15 Enveis variansanalyse, modell reformulert -tabell Modell: Y ij = μ i + ɛ ij, der ɛ ij N(0,σ 2 ) Antar at ɛ ij ene 1) er uavhengige, 2) er normalfordelte og 3) har samme varians (og null forventing). Modellen kan også skrives: Y ij = μ + α i + ɛ ij, der μ = 1 k k i=1 μ i er et felles nivå og α i er gruppe nr i sitt eventuelle avvik fra dette nivået. Hypotesen: H 0 : μ 1 = μ 2 = = μ k mot H 1 : minst én μ i ulik de andre er da ekvivalent med Hypotesen: H 0 : α 1 = α 2 = = α k =0mot H 1 : minst én α i ulik null Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 6 / 15

Hypotesetest -tabell Aktuell hypotese: H 0 : μ 1 = μ 2 = = μ k mot H 1 : minst én μ i ulik de andre Dersom variasjonen mellom y 1, y 2,...,y k er stor, indikerer dette at H 1 er riktig. k Mål på denne variasjonen ( mellom gruppene ): n i (y i y ) 2 Denne variasjonen bør sees i forhold til tilfeldig variasjon målt ved variasjonen innen gruppene ; hvor mye y i1,y i2,...,y ini varierer. i=1 Mål på denne ( innen gruppene ): k n i (y ij y i ) 2. i=1 j=1 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 7 / 15 Hypotesetest -tabell Utskrift fra EXCEL (dekkdata): Vi har videre: Totalt gjennomsnitt: y =25.92, og SUMMARY Groups Count Sum Average Variance dekk 1 5 127,8 25,56 2,713 dekk 2 5 136,9 27,38 1,592 dekk 3 5 125,6 25,12 1,257 dekk 4 5 128,1 25,62 1,947 SSA ( mellom gruppene, A for Average): k n i (y i y ) 2 =5(25.56 25.92) 2 + +5(25.62 25.92) 2 =14.956 i=1 SSE ( innen gruppene ): n k i (y ij y i ) 2 = =30.036 i=1 j=1 Hvordan sammenligne SSA og SSE?? Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 8 / 15

Inferens -tabell Dataene, y ij ene, betraktes som utfall av: Y ij = μ i + ɛ ij Definer: ni SST = k i=1 j=1 (Y ij Y ) 2, total variasjon SSE = k ni i=1 j=1 (Y ij Y i ) 2, tilf. variasjon innen grupper og SSA = k i=1 n i(y i Y ) 2, variasjon mellom grupper. Vi kan vise at (Theorem 13.1): SST = SSE + SSA Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 9 / 15 Inferens -tabell Vi har at: SSE σ 2 χ 2 N k Under H 0 : α 1 = = α k =0, gjelder: ( ) SSE og derfor at E = σ 2 N k (uansett H 0 eller ei) ( ) SSA Theorem 13.2 (s. 515): E = σ 2 + N k 1 k 1 k i=1 SSA σ 2 α 2 i χ 2 k 1 Derfor er det naturlig å forkaste H 0 dersom SSA/ (k 1) SSE / (N k) blir stor. (Størrelsen er F (k 1,N k)-fordelt under H 0.) Se også s. 36 i tabellheftet; Q 0 =SSE og Q 1 =SSA, osv.... Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 10 / 15

Inferens -tabell Forkast H 0 dersom: F = Dekkdataene: SSA / σ (k 1) 2 SSE / = σ (N k) 2 Utfall av F : 14.956/(4 1) 30.036/(20 4) =2.6557 <f 0.05,3,16 =3.24 Dvs. Behold H 0 det er ikke grunnlag for å hevde at det er forskjell mellom dekktypene. SSA / (k 1) SSE / (N k) = MSA MSE f α,k 1,N k Kommentar: det kan se ut som om type 2 er dårligere enn de andre. Men det er litt for få data til å fastslå dette (signifikant). Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 11 / 15 -tabell -tabell -tabell, struktur: Kilde SK fg GK F p-verdi Source SS df MS F p-value Faktor (mellom grupper) SSA k 1 Tilfeldig (innen grupper) SSE N k Total SST N 1 SSA k 1 SSE N k MSA MSE P (F >f obs ) -tabell, for dekkdataene: Source of Variation SS df MS F P-value F crit Between Groups 14,956 3 4,9853 2,6557 0,0837 3,2389 Within Groups 30,036 16 1,8773 Total 44,992 19 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 12 / 15

Sjekk av -tabell Modellantakelsene sjekkes vha. å studere egenskapene til residualene (tilsvarende det vi gjør i regresjonsanalyse). plott rådata (y ij ene) for hver grupppe plott residualene, e ij = y ij y i Skal være utfall av uavhnegige N(0,σ 2 )-variabler histogram, også ev. gruppevis (normalitet) normalplott (normalitet) prikkdiagram gruppevis (lik varians) Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 13 / 15 Kp. 13: Enveis variansanalyse -tabell Alternativ modellformulering (jf. kp. 14): Y ij = μ + α i + ɛ ij, der ɛ ij N(0,σ 2 ),ogα 1 + α 2 + + α k =0 Tilsvarende hypoteser: H 0 : α 1 = α 2 = = α k =0mot H 1 : minst én α i 0 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 14 / 15

Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely Randomized Design 13.13 Potential Misconceptions... (13.4 13.12 er ikke med i pensum.) Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 15 / 15