Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Like dokumenter
Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Estimering og hypotesetesting

Estimering og hypotesetesting

TMA4240 Statistikk H2010 (20)

Hypotesetest: generell fremgangsmåte

TMA4240 Statistikk H2010

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Hypotesetesting, del 4

TMA4240 Statistikk Høst 2016

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4240 Statistikk Høst 2015

Kap. 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Statistikk og økonomi, våren 2017

ECON240 Statistikk og økonometri

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

MOT310 Statistiske metoder 1, høsten 2011

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Kapittel 8: Estimering

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

TMA4240 Statistikk H2010 (19)

Oppgaver fra boka: X 2 X n 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Kap. 9: Inferens om én populasjon

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

TMA4245 Statistikk Eksamen mai 2017

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Estimering 1 -Punktestimering

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Løsningsforslag Oppgave 1

Estimering 1 -Punktestimering

Estimering 2. -Konfidensintervall

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

TMA4240 Statistikk Høst 2009

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Løsningsforslag ST2301 øving 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

STK1100 våren 2017 Estimering

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

TMA4245 Statistikk Eksamen 9. desember 2013

TMA4240 Statistikk H2010 (22)

TMA4245 Statistikk Eksamen august 2015

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

TMA4240/4245 Statistikk 11. august 2012

Kapittel 10: Hypotesetesting

Løsning TALM1005 (statistikkdel) juni 2017

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

TMA4240 Statistikk Eksamen desember 2015

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Løsningsforslag til eksamen i STK desember 2010

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

TMA4240 Statistikk Høst 2016

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

Eksempler fra slutten av forrige uke. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Oversikt over konfidensintervall i Econ 2130

Oversikt over konfidensintervall i Econ 2130

MOT310 Statistiske metoder 1, høsten 2012

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Econ 2130 Forelesning uke 11 (HG)

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Hypotesetesting, del 5

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

TMA4245 Statistikk Vår 2015

Mer om utvalgsundersøkelser

Hva er statistikk? TMA4240 Statistikk H2015. Denne forelesningen. Pensum

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Transkript:

3 Estimerig og hypotesetestig Kapittel 10 Ett- og toutvalgs hypotesetestig TMA4240 H2006: Eirik Mo Feome Bilkjørig Høyde til studeter Estimator ˆp = X, X atall ˆµ = X gjeomsittlig høyde. som syes de er flikere e gjeomsittet av spurte. Størrelse med kjet fordelig For store, og p ikke for ært 0 eller 1, så er Z = ormal- tilærmet fordelt ˆp p ˆp(1 ˆp)/ T = X µ S/ t-fordelt med 1 frihetsgrader. 2 Estimerig og hypotesetestig Feome Bilkjørig Høyde til studeter Spørsmål Hvor stor adel av studetee syes de er flikere e gjeomsittet til å kjøre bil? Hvor høye er studetee? Populasjo Alle studeter, eller evt. me og kvier som to populasjoer. Parameter Utvalg Data, u.i.f og represetative? Adele p som syes de er flikere e gjeomsittet. Alle studeter som svarte på spørreudersøkelse. Flikere eller ikke e gjeomsittet. Alle studeter, eller evt. me og kvier som to populasjoer. Forvetet høyde, µ. Alle studeter som svarte på spørreudersøkelse. Høyde. 4 Estimerig og hypotesetestig Feome Bilkjørig Høyde til studeter Kvatiler i fordelig z α/2 og z α/2 t α/2,( 1) og t α/2,( 1) Itervall Hypotesetestig: [ˆp z α/2 ˆp(1 ˆp), [ X t α/2,( 1)) s, ˆp(1 ˆp) ˆp + z α/2 ] X + s tα/2,( 1)) ] Er adele av studeter som syes de er malige stude- Er dette årets flikere e gjeomsittet til å kjøre bil ter høyerer e gjeomsittet større e 0.5? Tror flere me e kvier at de er gode sjåfører? for værepliktige, 179.8cm? Er byggstudeter høyere e studeter fra mari?

5 7 Hypotese Hypotesetestig og rettsak DEF 10.1: E statistisk hypotese er e atakelse eller påstad om egeskaper ved e eller fl ere populasjoer. Nullhypotese: Hypotese vi vil udersøke om vi har grulag fra data for å forkaste. E bestemt verdi for e parameter. Alterativ hypotese: Hvis vi forkaster ullhypotese så aksepterer vi de alterative hypotese. Ofte mer e e verdi for e parameter (større e, midre e og ulik). Spørsmål: Er gru til å tro at skruee som produseres ikke er 15 mm lage? Statistisk hypotesetestig: Udersøke om det er ok bevis som uderbygger at skruee ikke er 15 mm lage. Som i rettssak: tiltalte er atatt uskyldig til ha er bevist skyldig. Null hypotese: skruee som produseres er 15 mm. Alterativ hypotese: skuee som produseres er ikke 15 mm. H 0 : µ = 15mm vs. H 1 : µ 15mm 6 8 Kvalitetskotroll av skruer To typer feil Produksjo av skruer. Legde på produsert skrue skal være 15 mm. Tar jevlig stikkprøve fra prosesse, for å sjekke om skruee som produseres er 15 mm lage. Hvis stikkprøve tyder på at de produserte skruee ikke er 15 mm, må maskie som lager skruee kalibreres på ytt. Hvilke ullhypotese og alterativ hypotese vil vi udersøke? DEF 10.2: Forkastig av ullhypotese år dee er sa, kalles e type-i-feil. Vi vil være sikre på at skruee ikke er 15 mm før vi bestemmer oss for å stoppe produksjoe for å kalibrere. Produksjosstopp for kalibrerig av maski gjør at produsete taper peger pga. forsiket produksjo. DEF 10.3: Å ikke forkaste ullhypotese år de er gal, kalles e type-ii-feil. Vi vil gjere kalibrere maskie på ytt hvis skruee som produseres ikke er 15 mm. For lage og for korte skruer påfører kjøper problemer.

9 Type-I og type-ii-feil 11 Ett utvalg: test for µ med σ kjet H 0 sa H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt Geerell fremgagsmåte Kvalitetskotroll av skruer 4 z α z 0.05 = 1.96 2 2 Observerer x fra utvalget x = 15.05 mm. (stikkprøve) Bereger z = x µ 0 σ/ z 0 = 15.05 15 0.1/ = 1.58 10 Sammeliger z α, z 2 0 og z α -1.96<1.58<1.96 2 Forkast H 0 og kokluder med Beholder H 0. Har ikke sterke H 1, eller behold H 0. ok bevis for at µ 15mm. 10 Ett utvalg: test for µ med σ kjet Geerell fremgagsmåte 0 X 1, X 2,..., X u.i.f. ormal(µ, σ) der σ er kjet. Kvalitetskotroll av skruer Stikkprøve (utvalg) av = 10 skruer, atar ormalfordelig og kjeer σ =0.1mm. 1 To-sidig test Er gru til å tro at skruee som produseres ikke er 15 mm lage? H 0 : µ = µ 0 vs. H 1 : µ µ 0 H 0 : µ = 15 vs. H 1 : µ 15 2 Sigifikasivå α bestemmes. Velger α = 0.05 3 Testobservator Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt Forkast H 0 hvis z 0 > z α eller z 2 0 < z α. 2 12 Ett utvalg: tosidig test for µ med σ kjet X 1, X 2,..., X u.i.f. ormal(µ,σ) der σ er kjet. To-sidig test: 1. H 0 : µ = µ 0 vs. H 1 : µ µ 0 2. Sigifikasivå α bestemmes. 3. Testobservator uder H 0 er Z 0. Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt. Forkast H 0 hvis Z 0 > z α 2. 4. Bereg x fra utvalget, og videre z 0 = x µ 0 σ/. Sammelig z 0 og z α 2, og forkast H 0 hvis z 0 > z α 2.

13 Kvalitetskotroll av skruer 15 To typer feil Type-I: forkaste H 0 gitt at H 0 er sa. Justismord. Type-II-feil: ikke forkaste H 0 gitt at H 0 er falsk. La skyldig tiltalt gå fri. Produksjo av skruer. Legde på produsert skrue skal være 15 mm. Tar jevlig stikkprøve fra prosesse, for å sjekke om skruee som produseres er 15 mm lage. Hvis stikkprøve tyder på at de produserte skruee ikke er 15 mm, må maskie som lager skruee kalibreres på ytt. Hvorda skal vi bestemme om maskie skal rekalibreres? H 0 sa H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt 14 Hypoteser og tester Hypoteser: Nullhypotese (H 0 ): Hypotese vi vil udersøke om vi har grulag fra data for å forkaste. Ieholder e bestemt verdi for e parameter. Alterativ hypotese (H 1 ): Hypotese vi aksepterer dersom vi forkastar ullhypotese. Ofte mer e e verdi for e parameter. Statistisk hypotesetestig: Udersøke om dataee gir tilstrekkelig "bevis" for at de alterative hypotese er sa. To typer tester: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 E-sidig test: H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ < θ 0, eller H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ > θ 0 16 Ett utvalg: tosidig test for µ med σ kjet [10.5] X 1, X 2,..., X u.i.f. N(µ,σ 2 ) der σ er kjet. To-sidig test: 1. H 0 : µ = µ 0 vs. H 1 : µ µ 0 2. Sigifikasivå α bestemmes. 3. Testobservator uder H 0 er Z 0. Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt. Regel: Forkast H 0 hvis Z 0 > z α 2. 4. Bereg x fra utvalget, og videre z 0 = x µ 0 σ/. Sammelig z 0 og z α 2, og forkast H 0 hvis z 0 > z α 2.

17 P-verdi [10.4] DEF 10.5: E P-verdi er det laveste ivået hvor de observerte verdie til testobservatore er sigifikat. Utregig: P-verdi = P(for det vi har observert eller oe verre H 0 er sa) Steg: Bestem ull- og alterativ hypotese. Velg testobservator. Bereg P-verdie basert på testobservatore. Bestem om vi vil forkaste eller beholde ullhypotese basert på P-verdie og kuskap om systemet. Tilleggsiformasjo: Ka også gjøre hypotesetestig basert på sigifikasivå og forkastigsregio og oppgi P-verdi som tilleggsiformasjo. 19 Kvalitetskotroll: legde av skruer Estimerig 95% kofidesitervall for µ. x z α σ 2 < µ < x + z α 2 σ 95 % kofidesitervall: [14.99, 15.11] Hypotesetest Forkast H 0 hvis z 0 > z α eller z 2 0 < z α. Behold H 2 0 hvis z α < z 2 0 < z α σ < dvs. behold hvis x z α 2 2 µ 0 < x + z α σ 2 z 0 = 1.58, z 0.025 = 1.96, dermed ikke forkast H 0. p-verdi 0.11. Hvis et (1 α)100% kofidesitervall ieholder µ 0 vil vi med e tosidig hypotesetest med sigifikasivå α ikke forkaste H 0 på ivå α. Hvis et (1 α)100% kofidesitervall ikke ieholder µ 0 vil vi med e tosidig hypotesetest med sigifikasivå α forkaste H 0 på ivå α. 18 Kvalitetskotroll: legde av skruer X 1, X 2,...,X er legde på skruer. Ata at X 1, X 2,...,X er u.i.f N(µ, σ 2 = 0.1 2 ). Estimerig Gi et aslag (puktestimat) og itervall (kofidesitervall) der vi har 95% tillit til at sa legde for produserte skruer ligger. Hypotesetest Udersøk om det er gru til å tro at de produserte skruee ikke er 15 mm lage (test hypotese). Bruk sigifikasivå 5%. H 0 : µ = 15 vs. H 1 : µ 15 Z = X µ σ/ er stadard ormalfordelt, Z 0 = X µ 0 σ/ 20 Ett utvalg: esidig test for µ med σ kjet [10.5] X 1, X 2,..., X u.i.f. N(µ, σ 2 ) der σ er kjet. E-sidig test (større): 1. H 0 : µ = µ 0 vs. H 1 : µ > µ 0 2. Sigifikasivå α bestemmes. 3. Testobservator Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt. Forkast H 0 hvis Z 0 > z α. 4. Observerer x fra utvalget, bereg z 0 = x µ 0 σ/. Sammelig z 0 og z α, og forkast H 0 hvis z 0 > z α. E-sidig test (midre): H 0 : µ = µ 0 H 1 : µ < µ 0... Forkast H 0 hvis z < z α.

21 Ett utvalg: esidig test for µ med σ ukjet [10.7] X 1, X 2,..., X u.i.f. N(µ, σ 2 ) der σ er ukjet. S 2 = 1 1 i=1 (X i X) 2. E-sidig test (større): 1. H 0 : µ = µ 0 vs. H 1 : µ > µ 0 2. Sigifikasivå α bestemmes. 3. Testobservator T 0 = X µ 0 s/ er uder H 0 t-fordelt med 1 frihetsgrader. Forkast H 0 hvis T 0 > t α,( 1). 4. Bereg x og s fra utvalget, og videre t 0 = x µ 0 s/. Sammelig t 0 og t α,( 1), og forkast H 0 hvis t > t α,( 1). E-sidig test (midre): H 0 : µ = µ 0 H 1 : µ < µ 0... Forkast H 0 hvis t 0 < t α,( 1). 23 Sigifikasivå og teststyrke Defierer α β = P(Type I-feil) = P(Type II-feil) Sigifikasivået for e test = P(Type I-feil) = α. Styrke for e test er sasylighete for å forkaste H 0 år et bestemt alterativ er sat (DEF 10.4), dvs. Styrke = 1 P(Type II-feil, bestemt alterativ) = 1 β. Har at Reduserer α β øker og 1 β (styrke) miker. Øker α miker, β miker og 1 β (styrke) øker. 22 Ett utvalg: tosidig test for µ med σ ukjet [10.7] X 1, X 2,..., X u.i.f. N(µ, σ 2 ) der σ er ukjet. S 2 = 1 1 i=1 (X i X) 2. To-sidig test: 24 Teststyrke, illustrasjo Tester hypotese H 1 : µ = µ 0 mot H 1 : µ < µ 0. Forkastar H 0 dersom z 0 < z α, eller ekvivalet x < k, der k = µ 0 z α σ/. Ata sa verdi µ = µ 1, hva er teststyrke 1 β? 1. H 0 : µ = µ 0 vs. H 1 : µ µ 0 2. Sigifikasivå α bestemmes. 3. Testobservator T 0 = X µ 0 s/ er uder H 0 t-fordelt med 1 frihetsgrader. Forkast H 0 hvis T 0 > t α 2,( 1). 4. Bereg x og s fra utvalget, og videre t 0 = x µ 0 s/. Sammelig t 0 og t α 2,( 1), og forkast H 0 hvis t 0 > t α 2,( 1). Areal:α Areal:β k σ µ 1 µ 0 Forkast H[0] Aksepter H[0]

25 Fartskotroll med laser Ved fartskotroll beytter ofte politiet laser til å måle farte til bilee. Hvis Y er målt fart (km/t) til e tilfeldig valgt bil, atar vi at Y er ormalfordelt med forvetig µ og stadardavvik σ = 1.5 km/t. Politiet gjeomfører e fartskotroll i e 50-soe der farte til hver bil måles med e lasermålig. Politiet vil fastsette e verdi k slik at sasylighete for at e bilist feilaktig beskyldes for fartsovertredelse blir høyst 0.01. a) Formuler hypotesetest og fi miste verdi k ka være. b) Hva er sasylighete for at e bilist som kjører i 55 km/t ikke blir beskyldt for fartsovertredelse? c) Hvor mage måliger må vi har for å oppdager at biliste kjører for fort med styrke 0.95 år biliste kjører i 55 km/t? Fasit: k=53.5, ikke beskyldt=0.16, mist 2 observasjoer. 27 Hypotesetest: geerell fremgagsmåte Geerell fremgagsmåte Kvalitetskotroll av skruer 0 Observasjoer X 1, X 2,..., X Stikkprøve (utvalg) av = 10 u.i.f. fra fordelig med kjete og ukjete parametere. skruer, atar ormalfordelig og kjeer σ =0.1mm. 1 Esidig eller to-sidig test Er gru til å tro at skruee som produseres ikke er 15 mm lage? H 0 vs. H 1 H 0 : µ = 15 vs. H 1 : µ 15 2 Sigifikasivå α bestemmes. Velger α = 0.05 3 Testobservator: størrelse med kjet fordelig uder ullhypotese. Forkasigsområde fra P(forkaste H 0 H 0 sa) α. Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt Forkast H 0 hvis z 0 z 0 < z α. 2 > z α 2 eller 26 Fartskotroll med laser 28 Hypotesetest: geerell fremgagsmåte Ved fartskotroll beytter ofte politiet laser til å måle farte til bilee. Hvis Y er målt fart (km/t) til e tilfeldig valgt bil, atar vi at Y er ormalfordelt med forvetig µ og stadardavvik σ = 1.5 km/t. Politiet gjeomfører e fartskotroll i e 50-soe der farte til hver bil måles med e lasermålig. Politiet vil fastsette e forkastigsregel slik at sasylighete for at e bilist feilaktig beskyldes for fartsovertredelse blir høyst 0.01. a) Formuler hypotesetest og fi forkastigsregel. b) Hva er sasylighete for at e bilist som kjører i 55 km/t ikke blir beskyldt for fartsovertredelse? c) Hvor mage måliger må vi har for å oppdager at biliste kjører for fort med styrke 0.95 år biliste kjører i 55 km/t? Fasit: k=53.5, ikke beskyldt=0.16, mist 2 observasjoer. Geerell fremgagsmåte 4 Koklusjo basert på observasjoer Forkast H 0 og kokluder med H 1, eller behold H 0. 5 Tilleggsiformasjo: p- verdi=p(det vi har observert eller oe verre H 0 er sa), teststyrke ved bestemt alterativ Kvalitetskotroll av skruer = 1.96, x = 15.05 mm. z 0.05 2 z 0 = 15.05 15 0.1/ = 1.58 10-1.96<1.58<1.96 Beholder H 0. Har ikke sterke ok bevis for at µ 15mm. p-verdi 0.11.

29 Hypoteser og tester Hypoteser: Nullhypotese (H 0 ): Hypotese vi vil udersøke om vi har grulag fra data for å forkaste. Ieholder e bestemt verdi for e parameter. Alterativ hypotese (H 1 ): Hypotese vi aksepterer dersom vi forkastar ullhypotese. Ofte mer e e verdi for e parameter. Statistisk hypotesetestig: Udersøke om dataee gir tilstrekkelig "bevis" for at de alterative hypotese er sa. To typer tester: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 E-sidig test: H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ < θ 0, eller H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ > θ 0 31 Sigifikasivå og teststyrke Defierer α β = P(Type I-feil) = P(Type II-feil) Sigifikasivået for e test = P(Type I-feil) = α. Styrke for e test er sasylighete for å forkaste H 0 år et bestemt alterativ er sat (DEF 10.4), dvs. Styrke = 1 P(Type II-feil, bestemt alterativ) = 1 β. 30 To typer feil Type-I: forkaste H 0 gitt at H 0 er sa. Justismord. Type-II-feil: ikke forkaste H 0 gitt at H 0 er falsk. La skyldig tiltalt gå fri. 32 Teststyrke, illustrasjo Tester hypotese H 1 : µ = µ 0 mot H 1 : µ < µ 0. Forkastar H 0 dersom z 0 < z α, eller ekvivalet x < k, der k = µ 0 z α σ/. Ata sa verdi µ = µ 1, hva er teststyrke 1 β? Areal:α µ 1 µ 0 Areal:β H 0 sa H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt σ k Forkast H[0] Aksepter H[0]

33 35 Utvalgsstørrelse [10.9] To utvalg: statistisk situasjo Esidig test, σ kjet. H 0 : µ = µ 0 vs. H 1 : µ > µ 0 Hvis vi øsker å ha sasylighet (1 β) for å oppdage µ = µ 0 + δ (for gitt δ) og øsker sigifikasivå α, må vi mist ha utvalgsstørrelse Tosidig test, σ kjet. = (z α + z β ) 2 σ 2 δ 2 H 0 : µ = µ 0 vs. H 1 : µ µ 0 Som over, da blir mist utvalgsstørrelse (tilærmet) Øsker å sammelige to populasjoer basert på et u.i.f. utvalg fra hver populasjo. Nå: Studerer e egeskap som ka sies å være ormalfordelt i hver populasjo, og øsker å utføre e hypotesetest om forholdet medllom forveigsverdiee i de to populasjoee Sammeligigee ka være parvise eller ikke parvise. I 10.12 ser vi på egeskaper som er biomisk fordelt. = (z α 2 + z β) 2 σ 2 δ 2 34 36 To utvalg: eksempler 10.8: To utvalg, ormalfordelig Situasjo: Betog: to ulike oppskrifter, A og B, skal sammeliges. Er det forskjell i styrke ( crushig stregth ) for betog fra oppskrift A og fra oppskrift B? Sykdom: tester ut y blodtrykksmedisi. Er de ye medisie bedre e de åværede markedsledede blodtrykksmedisi? Kosthold: får jeg e vektreduksjo på mer e 10 kg hvis jeg følger Dr Fedo Lidbergs kostråd i et halvt år? (balase i blodsukker, lav glykemisk ideks) Bildekk: to typer dekk, A og B, skal sammeliges mhp slitasje. Slites A og B dekk forskjellig? X A 1, X A 2,..., X A 1 er u.i.f., X A i N(µ A, σ 2 A ). X B 1, X B 2,..., X B 2 er u.i.f., X B j N(µ B, σ 2 B ). Problemstillig: Vil teste hypotese H 0 : µ A µ B = d 0 mot H 1 : µ A µ B d 0 (Alterativt: H 1 : µ A µ B < d 0 eller H 1 : µ A µ B > d 0 ) Hypotesetest, tre tilfelle: 1. σ 2 A og σ2 B kjete. 2. σ 2 A = σ2 B = σ2, der σ 2 er ukjet 3. σ 2 A σ2 B, σ2 A og σ2 B ukjete.

37 To utvalg, ormalfordelig (forts.) 39 Parvist eksempel: Dekkslitasje 1. σa 2 og σ2 B kjete: Bruker at σ 2 A 1 Z 0 = ( X A X B ) d 0 + σ2 B 2 N(0, 1) uder H 0. Forkast H 0 dersom z 0 > z α 2, der z 0 er observert verdi for Z 0. 2. σ 2 A = σ2 B = σ2, der σ 2 er ukjet: T-fordelig med A + B 2 frihetsgrader. 3. σa 2 σ2 B, σ2 A og σ2 B ukjete: Se læreboka. Spørsmål: Er slitasje for A-dekka større e for B-dekka? Forsøk: Utstyr tilfeldig valgte biler med to dekk av type A og to av type B. La X i, i = 1,..., være slitasje til type A-dekka på de bilee (gj.sitt over to dekk). La Y i, i = 1,..., være slitasje til de tilsv. paree av type B-dekk (gj.sitt over to dekk). Da er D i = X i Y i, i = 1,..., uavhegige, og D i N(µ D, σ 2 D ). Observasjoer: = 15 forsøk med observerte verdier d = 0.72 og s 2 d = 0.97. 38 To utvalg, ormalfordelig (forts.) 1. σa 2 og σ2 B kjete: Normalfordelig. 2. σ 2 A = σ2 B = σ2, der σ 2 er ukjet: Estimator for σ 2 : S 2 p = Bruker at A 1 A + B 2 [ (Xi A X A ) 2 + i=1 T 0 = (X A X B ) d 0 1 S p A + 1 B B j=1 (X B j X B ) 2 ] 40 Parvist eksempel: Dekkslitasje Hypotesetest: H 0 : µ D = µ 0 mot H 1 : µ D > µ 0, der µ 0 = 0. T 0 = D µ 0 S D / = D 0 S D / er t-fordelt med 1 frihetsgrader uder H 0. Gjeomfør teste som for ett utvalg. er t-fordelt med A + B 2 frihetsgrader uder H 0. Forkast H 0 dersom t 0 > t α 2,( A+ B 2), der t 0 er observert verdi for T 0. 3. σa 2 σ2 B, σ2 A og σ2 B ukjete: Se læreboka.

41 Hypotesetest av varias (10.13) Ispirert av eksame, august 2003, oppgave 1. E laborat skal udersøke måleusikkerhete til et istrumet som beyttes til å bestemme kosetrasjoe av et stoff i e oppløsig. Det gjeomføres måliger med istrumetet på e oppløsig. Observasjoee X 1, X 2,..., X ka atas å være uavhegige og ormalfordelte med forvetig µ og varias σ 2. I oppgave arbeider ma med kjet kosetrasjo av stoffet, me vi skal her ata at kosetrasjoe er ukjet. Vi ka teke oss at produsete av måleistrumetet reklamerer med at måleusikkerhete i istrumetet ikke er høyere e σ0 2 = 0.04. Vi øsker å teste om dette er tilfellet. Data fra oppgave: = 10, 10 i=1 (x i x) 2 = 0.43 og α = 0.05. 43 Laba strakk seg ikke leger, me smaker de bedre? Vi øsker å fie ut om studeter syes at Nidar Laba smaker bedre e COOP Seigme. Formuler spørsmålet som e hypotesetest. Etter seigma-strekkige på forelesige, svarte de studetee som hadde strukket (og spist) både Laba og Seigme på hvilket av merkee som smakte best. Data: = 51 studeter svarte, av disse likte x = 30 studeter Laba bedre e COOP Seigma. Gjeomfør teste. Hva blir koklusjoe? Hva ville koklusjoe blitt hvis vi hadde observert samme adel, ˆp = 30 51 = 0.59, me = 10 og x = 6, = 100 og x = 59. 42 [10.13] Hypotesetest av varias La X 1, X 2,..., X være et tilfeldig utvalg fra e populasjo som beskrives av e ormalfordelig med forvetig µ og varias σ 2. S 2 = 1 1 i=1 (X i X) 2 er e estimator for σ 2 (forvetigsrett, me ikke SME). Størrelse V = ( 1)S2 σ 2 α 2 er kjikvadrat-fordelt med 1 frihetsgrader. 1 α 0 χ 2 (1 α 2) ν χ 2 α 2 α 2 44 [10.11] Hypotesetest av e adel X er atall suksesser i et biomisk forsøk med parametere atallet og adele p. Vi vil teste e hypotese om p, dvs. relatere p til bestemte verdier (esidig eller tosidig test). Estimator ˆp = X p(1 p), der E(ˆp) = p og Var(ˆp) =. Forkastigsområdet ka ete fies fra biomisk fordelig: relatert til verdie av X, treger å fie forkastigsområde fra tabell over kumulativ biomisk fordelig, fra ormaltilærmig av ˆp år er stor, og p > 5, (1 p) > 5 og p ikke er ær 0 eller 1. ˆp p 0 Z 0 = 1 p 0(1 p 0 ) er tilærmet stadard ormalfordelt uder H 0.

45 Studeter og bilkjørig Her agir atall studeter i utvalget som hadde sertifikat, og x atall studeter som svarte at de er bedre e gjeomsittet av Norges befolkig til å kjøre bil. x x Me 102 50 0.49 Kvier 37 9 0.24 Alle 139 59 0.42 a) Fi puktestimat og 99% kofidesitervall for adele av studeter som syes sie kjøreegeskaper er bedre e gjeomsittet. Fasit: 0.42 ± 2.576 0.42 (1 0.42) 139 =[0.32, 0.53]. 47 Studeter og bilkjørig, forts. x x Me 102 50 0.49 Kvier 37 9 0.24 Alle 139 59 0.42 c) Fi puktestimat og 99% kofidesitervall for differese mellom adele av malige studeter og kvilige studeter som syes sie kjøreegeskaper er bedre e gjeomsittet. Fasit: [0.03, 0.47]. d) La p 1 være sasylighete for at e tilfeldig valgt malig studet syes ha er bedre e gjeomsittet til å kjøre bil, og tilsvarede p 2 for kvier. Ville hypotese H 0 : p 1 p 2 = 0 vs. H 0 : p 1 p 2 0 blitt forkastet? Hvilke sigifikasivå ville ført til forkastig? Baser resoemetet på fasit fra c), dvs. ute regig. Hvilke hypoteser ville ikke blitt forkastet på ivå 0.01? 46 Studeter og bilkjørig x x Me 102 50 0.49 Kvier 37 9 0.24 Alle 139 59 0.42 b) La p være sasylighete for at e tilfeldig valgt studet syes ha/hu er bedre e gjeomsittet til å kjøre bil. Ville hypotese H 0 : p = 0.5 vs. H 0 : p 0.5 blitt forkastet? Hvilke sigifikasivå ville ført til forkastig? Baser resoemetet på fasit fra a), dvs. ute regig. Hvilke hypoteser (valg av p 0 ) ville ikke blitt forkastet på ivå 0.01? 48 Lovlydige bilførere? BOT: Kjørig med motorvog på eller over sperrelije og/eller i sperreområde begreset av heltrukke lije, på fortau, gagveg/gagbae, sykkelveg/sykkelbae og gag- og sykkelveg/gag- og sykkelbae. Kr. 2500,- sub. 5 dgs fegsel. Måliger av kryssig av hvit heltrukket sperrelije ved fartsdempere ved bussholdeplass Gløshauge Nord (29.03.2004, fra 08:20 til 08:35). =atall observasjoer X =atall bilister som kjører rudt fartsdempere (over hvit heltrukket sperrelije). x x Me 74 29 0.39 Kvier 37 10 0.27 Alle 111 39 0.35

49 Lovlydige bilførere? x x Me 74 29 0.39 Kvier 37 10 0.27 Alle 111 39 0.35 a) Er det gru til å tro at det er flere e 25% av bilistee som sviger rudt fartsdempere? (Fasit: forkast esidig test på ivå 0.01, p-verdi= 0.004) b) Er det gru til å tro at kvier og me er like lovlydige i dee situasjoe? (Fasit: ikke forkast tosidig hypotese, p-verdi 0.21)