Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting



Like dokumenter
Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

TMA4240 Statistikk H2010 (20)

Estimering og hypotesetesting

Estimering og hypotesetesting

Mer om utvalgsundersøkelser

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Hypotesetest: generell fremgangsmåte

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Hypotesetesting, del 5

Statistikk og økonomi, våren 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

Kapittel 8: Estimering

Hypotesetesting, del 4

ECON240 Statistikk og økonometri

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TMA4240 Statistikk H2010 (19)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

TMA4240 Statistikk Høst 2015

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

TMA4240 Statistikk H2010

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

Kapittel 10: Hypotesetesting

Eksempler fra slutten av forrige uke. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

TMA4240 Statistikk Høst 2016

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Kap. 9: Inferens om én populasjon

Oppgaver fra boka: X 2 X n 1

TMA4245 Statistikk Eksamen mai 2017

Kap. 9: Inferens om én populasjon

Estimering 1 -Punktestimering

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

MOT310 Statistiske metoder 1, høsten 2011

Estimering 1 -Punktestimering

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Løsningsforslag ST2301 øving 3

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

TMA4240 Statistikk Høst 2009

Estimering 2. -Konfidensintervall

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Eksamen REA3028 S2, Våren 2011

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

TMA4245 Statistikk. Øving nummer b5. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk H2010 (22)

TMA4240/4245 Statistikk 11. august 2012

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

STK1100 våren 2017 Estimering

TMA4240 Statistikk Eksamen desember 2015

Løsningsforslag til eksamen i STK desember 2010

Løsningsforslag Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

TMA4245 Statistikk Vår 2015

TMA4240 Statistikk Høst 2015

11,7 12,4 12,8 12,9 13,3.

Econ 2130 Forelesning uke 11 (HG)

TMA4245 Statistikk Eksamen 9. desember 2013

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

n 2 +1) hvis n er et partall.

TMA4240 Statistikk Høst 2016

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Oversikt over konfidensintervall i Econ 2130

Løsning TALM1005 (statistikkdel) juni 2017

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Transkript:

3 Estimerig og hypotesetestig Kapittel 10 Ett- og toutvalgs hypotesetestig TMA445 V007: Eirik Mo Feome Bilkjørig Høyde til studeter Estimator ˆp = X, X atall ˆµ = X gjeomsittlig høyde. som syes de er flikere e gjeomsittet av spurte. Størrelse med kjet fordelig For store, og p ikke for ært 0 eller 1, så er Z = ormal- tilærmet fordelt ˆp p ˆp(1 ˆp)/ T = X µ S/ t-fordelt med 1 frihetsgrader. Estimerig og hypotesetestig Feome Bilkjørig Høyde til studeter Spørsmål Hvor stor adel av studetee syes de er flikere e gjeomsittet til å kjøre bil? Hvor høye er studetee? Populasjo Alle studeter, eller evt. me og kvier som to populasjoer. Parameter Utvalg Data, u.i.f og represetative? Adele p som syes de er flikere e gjeomsittet. Alle studeter som svarte på spørreudersøkelse. Flikere eller ikke e gjeomsittet. Alle studeter, eller evt. me og kvier som to populasjoer. Forvetet høyde, µ. Alle studeter som svarte på spørreudersøkelse. Høyde. 4 Estimerig og hypotesetestig Feome Bilkjørig Høyde til studeter Kvatiler i fordelig z α/ og z α/ t α/,( 1) og t α/,( 1) Itervall Hypotesetestig: [ˆp z α/ ˆp(1 ˆp), [ X t α/,( 1)) s, ˆp(1 ˆp) ˆp + z α/ ] X + s tα/,( 1)) ] Er adele av studeter som syes de er malige stude- Er dette årets flikere e gjeomsittet til å kjøre bil ter høyerer e gjeomsittet større e 0.5? Tror flere me e kvier at de er gode sjåfører? for værepliktige, 179.8cm? Er byggstudeter høyere e studeter fra mari?

5 7 Hypotese Hypotesetestig og rettsak DEF 10.1: E statistisk hypotese er e atakelse eller påstad om egeskaper ved e eller fl ere populasjoer. Nullhypotese: Hypotese vi vil udersøke om vi har grulag fra data for å forkaste. E bestemt verdi for e parameter. Alterativ hypotese: Hvis vi forkaster ullhypotese så aksepterer vi de alterative hypotese. Ofte mer e e verdi for e parameter (større e, midre e og ulik). Spørsmål: Er gru til å tro at skruee som produseres ikke er 15 mm lage? Statistisk hypotesetestig: Udersøke om det er ok bevis som uderbygger at skruee ikke er 15 mm lage. Som i rettssak: tiltalte er atatt uskyldig til ha er bevist skyldig. Nullhypotese: skruee som produseres er 15 mm. Alterativ hypotese: skuee som produseres er ikke 15 mm. H 0 : µ = 15mm vs. H 1 : µ 15mm 6 8 Kvalitetskotroll av skruer Hypoteser og tester Hypoteser: Nullhypotese (H 0 ): Hypotese vi vil udersøke om vi har grulag fra data for å forkaste. Ieholder e bestemt verdi for e parameter. Alterativ hypotese (H 1 ): Hypotese vi aksepterer dersom vi forkastar ullhypotese. Ofte mer e e verdi for e parameter. Produksjo av skruer. Legde på produsert skrue skal være 15 mm. Tar jevlig stikkprøve fra prosesse, for å sjekke om skruee som produseres er 15 mm lage. Hvis stikkprøve tyder på at de produserte skruee ikke er 15 mm, må maskie som lager skruee kalibreres på ytt. Hvilke ullhypotese og alterativ hypotese vil vi udersøke? Statistisk hypotesetestig: Udersøke om dataee gir tilstrekkelig bevis for at de alterative hypotese er sa. To typer tester: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 E-sidig test: H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ < θ 0, eller H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ > θ 0

9 To typer feil 11 Ett utvalg: test for µ med σ kjet DEF 10.: Forkastig av ullhypotese år dee er sa, kalles e type-i-feil. Vi vil være sikre på at skruee ikke er 15 mm før vi bestemmer oss for å stoppe produksjoe for å kalibrere. Produksjosstopp for kalibrerig av maski gjør at produsete taper peger pga. forsiket produksjo. DEF 10.3: Å ikke forkaste ullhypotese år de er gal, kalles e type-ii-feil. Vi vil gjere kalibrere maskie på ytt hvis skruee som produseres ikke er 15 mm. For lage og for korte skruer påfører kjøper problemer. Geerell fremgagsmåte 0 X 1, X,..., X u.i.f. ormal(µ, σ) der σ er kjet. Kvalitetskotroll av skruer Stikkprøve (utvalg) av = 10 skruer, atar ormalfordelig og kjeer σ =0.1mm. 1 To-sidig test Er gru til å tro at skruee som produseres ikke er 15 mm lage? H 0 : µ = µ 0 vs. H 1 : µ µ 0 H 0 : µ = 15 vs. H 1 : µ 15 Sigifikasivå α bestemmes. Velger α = 0.05 3 Testobservator Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt Forkast H 0 hvis z 0 > z α eller z 0 < z α. 10 To typer feil 1 Ett utvalg: test for µ med σ kjet Type-I: forkaste H 0 gitt at H 0 er sa. Justismord. Type-II-feil: ikke forkaste H 0 gitt at H 0 er falsk. La skyldig tiltalt gå fri. H 0 sa H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt Geerell fremgagsmåte Kvalitetskotroll av skruer 4 z α z 0.05 = 1.96 Observerer x fra utvalget x = 15.05 mm. (stikkprøve) Bereger z = x µ 0 σ/ z 0 = 15.05 15 0.1/ = 1.58 10 Sammeliger z α, z 0 og z α -1.96<1.58<1.96 Forkast H 0 og kokluder med Beholder H 0. Har ikke sterke H 1, eller behold H 0. ok bevis for at µ 15mm.

13 Ett utvalg: tosidig test for µ med σ kjet X 1, X,..., X u.i.f. ormal(µ,σ) der σ er kjet. To-sidig test: 1. H 0 : µ = µ 0 vs. H 1 : µ µ 0. Sigifikasivå α bestemmes. 3. Testobservator uder H 0 er Z 0. Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt. Forkast H 0 hvis Z 0 > z α. 4. Bereg x fra utvalget, og videre z 0 = x µ 0 σ/. Sammelig z 0 og z α, og forkast H 0 hvis z 0 > z α. 15 P-verdi [10.4] DEF 10.5: E P-verdi er det laveste ivået hvor de observerte verdie til testobservatore er sigifikat. Utregig: P-verdi = P(for det vi har observert eller oe verre H 0 er sa) Steg: Bestem ull- og alterativ hypotese. Velg testobservator. Bereg P-verdie basert på testobservatore. Bestem om vi vil forkaste eller beholde ullhypotese basert på P-verdie og kuskap om systemet. Tilleggsiformasjo: Ka også gjøre hypotesetestig basert på sigifikasivå og forkastigsregio og oppgi P-verdi som tilleggsiformasjo. 14 Ett utvalg: tosidig test for µ med σ kjet [10.5] 16 Kvalitetskotroll: legde av skruer X 1, X,..., X u.i.f. N(µ,σ ) der σ er kjet. To-sidig test: 1. H 0 : µ = µ 0 vs. H 1 : µ µ 0. Sigifikasivå α bestemmes. 3. Testobservator uder H 0 er Z 0. Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt. Regel: Forkast H 0 hvis Z 0 > z α. 4. Bereg x fra utvalget, og videre z 0 = x µ 0 σ/. Sammelig z 0 og z α, og forkast H 0 hvis z 0 > z α. X 1, X,...,X er legde på skruer. Ata at X 1, X,...,X er u.i.f N(µ, σ = 0.1 ). Estimerig Gi et aslag (puktestimat) og itervall (kofidesitervall) der vi har 95% tillit til at sa legde for produserte skruer ligger. Hypotesetest Udersøk om det er gru til å tro at de produserte skruee ikke er 15 mm lage (test hypotese). Bruk sigifikasivå 5%. H 0 : µ = 15 vs. H 1 : µ 15 Z = X µ σ/ er stadard ormalfordelt, Z 0 = X µ 0 σ/

17 Kvalitetskotroll: legde av skruer Estimerig 95% kofidesitervall for µ. x z α σ < µ < x + z α σ 95 % kofidesitervall: [14.99, 15.11] Hypotesetest Forkast H 0 hvis z 0 > z α eller z 0 < z α. Behold H 0 hvis z α < z 0 < z α σ < dvs. behold hvis x z α µ 0 < x + z α σ z 0 = 1.58, z 0.05 = 1.96, dermed ikke forkast H 0. p-verdi 0.11. Hvis et (1 α)100% kofidesitervall ieholder µ 0 vil vi med e tosidig hypotesetest med sigifikasivå α ikke forkaste H 0 på ivå α. Hvis et (1 α)100% kofidesitervall ikke ieholder µ 0 vil vi med e tosidig hypotesetest med sigifikasivå α forkaste H 0 på ivå α. 19 Ett utvalg: esidig test for µ med σ ukjet [10.7] X 1, X,..., X u.i.f. N(µ, σ ) der σ er ukjet. S = 1 1 i=1 (X i X). E-sidig test (større): 1. H 0 : µ = µ 0 vs. H 1 : µ > µ 0. Sigifikasivå α bestemmes. 3. Testobservator T 0 = X µ 0 s/ er uder H 0 t-fordelt med 1 frihetsgrader. Forkast H 0 hvis T 0 > t α,( 1). 4. Bereg x og s fra utvalget, og videre t 0 = x µ 0 s/. Sammelig t 0 og t α,( 1), og forkast H 0 hvis t > t α,( 1). E-sidig test (midre): H 0 : µ = µ 0 H 1 : µ < µ 0... Forkast H 0 hvis t 0 < t α,( 1). 18 Ett utvalg: esidig test for µ med σ kjet [10.5] X 1, X,..., X u.i.f. N(µ, σ ) der σ er kjet. E-sidig test (større): 1. H 0 : µ = µ 0 vs. H 1 : µ > µ 0. Sigifikasivå α bestemmes. 3. Testobservator Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt. Forkast H 0 hvis Z 0 > z α. 4. Observerer x fra utvalget, bereg z 0 = x µ 0 σ/. Sammelig z 0 og z α, og forkast H 0 hvis z 0 > z α. E-sidig test (midre): H 0 : µ = µ 0 H 1 : µ < µ 0... Forkast H 0 hvis z < z α. 0 Ett utvalg: tosidig test for µ med σ ukjet [10.7] X 1, X,..., X u.i.f. N(µ, σ ) der σ er ukjet. S = 1 1 i=1 (X i X). To-sidig test: 1. H 0 : µ = µ 0 vs. H 1 : µ µ 0. Sigifikasivå α bestemmes. 3. Testobservator T 0 = X µ 0 s/ er uder H 0 t-fordelt med 1 frihetsgrader. Forkast H 0 hvis T 0 > t α,( 1). 4. Bereg x og s fra utvalget, og videre t 0 = x µ 0 s/. Sammelig t 0 og t α,( 1), og forkast H 0 hvis t 0 > t α,( 1).

1 Sigifikasivå og teststyrke Defierer α β = P(Type I-feil) = P(Type II-feil) Sigifikasivået for e test = P(Type I-feil) = α. Styrke for e test er sasylighete for å forkaste H 0 år et bestemt alterativ er sat (DEF 10.4), dvs. Styrke = 1 P(Type II-feil, bestemt alterativ) = 1 β. Har at Reduserer α β øker og 1 β (styrke) miker. Øker α miker, β miker og 1 β (styrke) øker. 3 Fartskotroll med laser Ved fartskotroll beytter ofte politiet laser til å måle farte til bilee. Hvis Y er målt fart (km/t) til e tilfeldig valgt bil, atar vi at Y er ormalfordelt med forvetig µ og stadardavvik σ = 1.5 km/t. Politiet gjeomfører e fartskotroll i e 50-soe der farte til hver bil måles med e lasermålig. Politiet vil fastsette e verdi k slik at sasylighete for at e bilist feilaktig beskyldes for fartsovertredelse blir høyst 0.01. a) Formuler hypotesetest og fi miste verdi k ka være. b) Hva er sasylighete for at e bilist som kjører i 55 km/t ikke blir beskyldt for fartsovertredelse? c) Hvor mage måliger må vi har for å oppdager at biliste kjører for fort med styrke 0.95 år biliste kjører i 55 km/t? Fasit: k=53.5, ikke beskyldt=0.16, mist observasjoer. Teststyrke, illustrasjo Tester hypotese H 1 : µ = µ 0 mot H 1 : µ < µ 0. Forkastar H 0 dersom z 0 < z α, eller ekvivalet x < k, der k = µ 0 z α σ/. Ata sa verdi µ = µ 1, hva er teststyrke 1 β? Areal:α Areal:β Forkast H[0] µ 1 k µ 0 σ Aksepter H[0] 4 Hypotesetest: geerell fremgagsmåte Geerell fremgagsmåte Kvalitetskotroll av skruer 0 Observasjoer X 1, X,..., X Stikkprøve (utvalg) av = 10 u.i.f. fra fordelig med kjete og ukjete parametere. skruer, atar ormalfordelig og kjeer σ =0.1mm. 1 Esidig eller to-sidig test Er gru til å tro at skruee som produseres ikke er 15 mm lage? H 0 vs. H 1 H 0 : µ = 15 vs. H 1 : µ 15 Sigifikasivå α bestemmes. Velger α = 0.05 3 Testobservator: størrelse med kjet fordelig uder ullhypotese. Forkasigsområde fra P(forkaste H 0 H 0 sa) α. Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt Forkast H 0 hvis z 0 z 0 < z α. > z α eller

5 Hypotesetest: geerell fremgagsmåte 7 To utvalg: eksempler Geerell fremgagsmåte 4 Koklusjo basert på observasjoer Forkast H 0 og kokluder med H 1, eller behold H 0. 5 Tilleggsiformasjo: p- verdi=p(det vi har observert eller oe verre H 0 er sa), teststyrke ved bestemt alterativ Kvalitetskotroll av skruer = 1.96, x = 15.05 mm. z 0.05 z 0 = 15.05 15 0.1/ = 1.58 10-1.96<1.58<1.96 Beholder H 0. Har ikke sterke ok bevis for at µ 15mm. p-verdi 0.11. Betog: to ulike oppskrifter, A og B, skal sammeliges. Er det forskjell i styrke ( crushig stregth ) for betog fra oppskrift A og fra oppskrift B? Sykdom: tester ut y blodtrykksmedisi. Er de ye medisie bedre e de åværede markedsledede blodtrykksmedisi? Kosthold: får jeg e vektreduksjo på mer e 10 kg hvis jeg følger Dr Fedo Lidbergs kostråd i et halvt år? (balase i blodsukker, lav glykemisk ideks) Bildekk: to typer dekk, A og B, skal sammeliges mhp slitasje. Slites A og B dekk forskjellig? 6 Utvalgsstørrelse [10.9] 8 To utvalg: statistisk situasjo Esidig test, σ kjet. H 0 : µ = µ 0 vs. H 1 : µ > µ 0 Hvis vi øsker å ha sasylighet (1 β) for å oppdage µ = µ 0 + δ (for gitt δ) og øsker sigifikasivå α, må vi mist ha utvalgsstørrelse Tosidig test, σ kjet. = (z α + z β ) σ δ H 0 : µ = µ 0 vs. H 1 : µ µ 0 Som over, da blir mist utvalgsstørrelse (tilærmet) Øsker å sammelige to populasjoer basert på et u.i.f. utvalg fra hver populasjo. Nå: Studerer e egeskap som ka sies å være ormalfordelt i hver populasjo, og øsker å utføre e hypotesetest om forholdet medllom forveigsverdiee i de to populasjoee Sammeligigee ka være parvise eller ikke parvise. I 10.1 ser vi på egeskaper som er biomisk fordelt. = (z α + z β) σ δ

9 10.8: To utvalg, ormalfordelig Situasjo: X A 1, X A,..., X A 1 er u.i.f., X A i N(µ A, σ A ). X B 1, X B,..., X B er u.i.f., X B j N(µ B, σ B ). Problemstillig: Vil teste hypotese H 0 : µ A µ B = d 0 mot H 1 : µ A µ B d 0 (Alterativt: H 1 : µ A µ B < d 0 eller H 1 : µ A µ B > d 0 ) Hypotesetest, tre tilfelle: 1. σ A og σ B kjete.. σ A = σ B = σ, der σ er ukjet 3. σ A σ B, σ A og σ B ukjete. 31 To utvalg, ormalfordelig (forts.) 1. σa og σ B kjete: Normalfordelig.. σ A = σ B = σ, der σ er ukjet: Estimator for σ : S p = Bruker at A 1 A + B [ (Xi A X A ) + i=1 T 0 = (X A X B ) d 0 1 S p A + 1 B B j=1 (X B j X B ) ] er t-fordelt med A + B frihetsgrader uder H 0. Forkast H 0 dersom t 0 > t α,( A+ B ), der t 0 er observert verdi for T 0. 3. σa σ B, σ A og σ B ukjete: Se læreboka. 30 To utvalg, ormalfordelig (forts.) 3 Parvist eksempel: Dekkslitasje 1. σa og σ B kjete: Bruker at σ A 1 Z 0 = ( X A X B ) d 0 + σ B N(0, 1) uder H 0. Forkast H 0 dersom z 0 > z α, der z 0 er observert verdi for Z 0.. σ A = σ B = σ, der σ er ukjet: T-fordelig med A + B frihetsgrader. 3. σa σ B, σ A og σ B ukjete: Se læreboka. Spørsmål: Er slitasje for A-dekka større e for B-dekka? Forsøk: Utstyr tilfeldig valgte biler med to dekk av type A og to av type B. La X i, i = 1,..., være slitasje til type A-dekka på de bilee (gj.sitt over to dekk). La Y i, i = 1,..., være slitasje til de tilsv. paree av type B-dekk (gj.sitt over to dekk). Da er D i = X i Y i, i = 1,..., uavhegige, og D i N(µ D, σ D ). Observasjoer: = 15 forsøk med observerte verdier d = 0.7 og s d = 0.97.

33 Parvist eksempel: Dekkslitasje Hypotesetest: H 0 : µ D = µ 0 mot H 1 : µ D > µ 0, der µ 0 = 0. 35 [10.13] Hypotesetest av varias La X 1, X,..., X være et tilfeldig utvalg fra e populasjo som beskrives av e ormalfordelig med forvetig µ og varias σ. S = 1 1 i=1 (X i X) er e estimator for σ (forvetigsrett, me ikke SME). Størrelse V = ( 1)S σ er kjikvadrat-fordelt med 1 frihetsgrader. T 0 = D µ 0 S D / = D 0 S D / er t-fordelt med 1 frihetsgrader uder H 0. Gjeomfør teste som for ett utvalg. 1 α α α 0 χ (1 α ) ν χ α 34 Hypotesetest av varias (10.13) Ispirert av eksame, august 003, oppgave 1. E laborat skal udersøke måleusikkerhete til et istrumet som beyttes til å bestemme kosetrasjoe av et stoff i e oppløsig. Det gjeomføres måliger med istrumetet på e oppløsig. Observasjoee X 1, X,..., X ka atas å være uavhegige og ormalfordelte med forvetig µ og varias σ. I oppgave arbeider ma med kjet kosetrasjo av stoffet, me vi skal her ata at kosetrasjoe er ukjet. Vi ka teke oss at produsete av måleistrumetet reklamerer med at måleusikkerhete i istrumetet ikke er høyere e σ0 = 0.04. Vi øsker å teste om dette er tilfellet. Data fra oppgave: = 10, 10 i=1 (x i x) = 0.43 og α = 0.05. 36 Laba strakk seg ikke leger, me smaker de bedre? Vi øsker å fie ut om studeter syes at Nidar Laba smaker bedre e COOP Seigme. Formuler spørsmålet som e hypotesetest. Etter seigma-strekkige på forelesige, svarte de studetee som hadde strukket (og spist) både Laba og Seigme på hvilket av merkee som smakte best. Data: = 51 studeter svarte, av disse likte x = 30 studeter Laba bedre e COOP Seigma. Gjeomfør teste. Hva blir koklusjoe? Hva ville koklusjoe blitt hvis vi hadde observert samme adel, ˆp = 30 51 = 0.59, me = 10 og x = 6, = 100 og x = 59.

37 [10.11] Hypotesetest av e adel X er atall suksesser i et biomisk forsøk med parametere atallet og adele p. Vi vil teste e hypotese om p, dvs. relatere p til bestemte verdier (esidig eller tosidig test). Estimator ˆp = X p(1 p), der E(ˆp) = p og Var(ˆp) =. Forkastigsområdet ka ete fies fra biomisk fordelig: relatert til verdie av X, treger å fie forkastigsområde fra tabell over kumulativ biomisk fordelig, fra ormaltilærmig av ˆp år er stor, og p > 5, (1 p) > 5 og p ikke er ær 0 eller 1. ˆp p 0 Z 0 = 1 p 0(1 p 0 ) er tilærmet stadard ormalfordelt uder H 0. 39 Studeter og bilkjørig x x Me 10 50 0.49 Kvier 37 9 0.4 Alle 139 59 0.4 b) La p være sasylighete for at e tilfeldig valgt studet syes ha/hu er bedre e gjeomsittet til å kjøre bil. Ville hypotese H 0 : p = 0.5 vs. H 0 : p 0.5 blitt forkastet? Hvilke sigifikasivå ville ført til forkastig? Baser resoemetet på fasit fra a), dvs. ute regig. Hvilke hypoteser (valg av p 0 ) ville ikke blitt forkastet på ivå 0.01? 38 Studeter og bilkjørig Her agir atall studeter i utvalget som hadde sertifikat, og x atall studeter som svarte at de er bedre e gjeomsittet av Norges befolkig til å kjøre bil. x x Me 10 50 0.49 Kvier 37 9 0.4 Alle 139 59 0.4 a) Fi puktestimat og 99% kofidesitervall for adele av studeter som syes sie kjøreegeskaper er bedre e gjeomsittet. Fasit: 0.4 ±.576 0.4 (1 0.4) 139 =[0.3, 0.53]. 40 Studeter og bilkjørig, forts. x x Me 10 50 0.49 Kvier 37 9 0.4 Alle 139 59 0.4 c) Fi puktestimat og 99% kofidesitervall for differese mellom adele av malige studeter og kvilige studeter som syes sie kjøreegeskaper er bedre e gjeomsittet. Fasit: [0.03, 0.47]. d) La p 1 være sasylighete for at e tilfeldig valgt malig studet syes ha er bedre e gjeomsittet til å kjøre bil, og tilsvarede p for kvier. Ville hypotese H 0 : p 1 p = 0 vs. H 0 : p 1 p 0 blitt forkastet? Hvilke sigifikasivå ville ført til forkastig? Baser resoemetet på fasit fra c), dvs. ute regig. Hvilke hypoteser ville ikke blitt forkastet på ivå 0.01?

41 Lovlydige bilførere? BOT: Kjørig med motorvog på eller over sperrelije og/eller i sperreområde begreset av heltrukke lije, på fortau, gagveg/gagbae, sykkelveg/sykkelbae og gag- og sykkelveg/gag- og sykkelbae. Kr. 500,- sub. 5 dgs fegsel. Måliger av kryssig av hvit heltrukket sperrelije ved fartsdempere ved bussholdeplass Gløshauge Nord (9.03.004, fra 08:0 til 08:35). =atall observasjoer X =atall bilister som kjører rudt fartsdempere (over hvit heltrukket sperrelije). x x Me 74 9 0.39 Kvier 37 10 0.7 Alle 111 39 0.35 4 Lovlydige bilførere? x x Me 74 9 0.39 Kvier 37 10 0.7 Alle 111 39 0.35 a) Er det gru til å tro at det er flere e 5% av bilistee som sviger rudt fartsdempere? (Fasit: forkast esidig test på ivå 0.01, p-verdi= 0.004) b) Er det gru til å tro at kvier og me er like lovlydige i dee situasjoe? (Fasit: ikke forkast tosidig hypotese, p-verdi 0.1)