TMA4240 Statistikk H2010 (20) 10.5: Ett normalfordelt utvalg, kjent varians (repetisjon) 10.4: P-verdi 10.6: Konfidensintervall vs. hypotesetest 10.7: Ett normalfordelt utvalg, ukjent varians Mette Langaas Foreleses onsdag 27.oktober, 2010
2 Kvalitetskontroll av skruer Produksjon av skruer. Lengden på produsert skrue skal være 15 mm. Tar jevnlig stikkprøve fra prosessen, for å sjekke om skruene som produseres er 15 mm lange. Hvis stikkprøven tyder på at de produserte skruene ikke er 15 mm, må maskinen som lager skruene kalibreres på nytt. Hvordan skal vi bestemme om maskinen skal rekalibreres?
3 Hypoteser og tester Hypoteser: Nullhypotese (H 0 ): Hypotesen vi vil undersøke om vi har grunnlag fra data for å forkaste. Inneholder en bestemt verdi for en parameter. Alternativ hypotese (H 1 ): Hypotesen vi aksepterer dersom vi forkastar nullhypotesen. Ofte mer enn en verdi for en parameter. Statistisk hypotesetesting: Undersøke om dataene gir tilstrekkelig "bevis" for at den alternative hypotesen er sann. To typer tester: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 En-sidig test: H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ < θ 0, eller H 0 : θ θ 0 ( evt. θ = θ 0 ) mot H 1 : θ > θ 0
4 To typer feil Type-I: forkaste H 0 gitt at H 0 er sann. Justismord. Type-II-feil: ikke forkaste H 0 gitt at H 0 er falsk. La skyldig tiltalt gå fri. http://www.pitt.edu/ upjecon/mcg/stat/deadlysins.jpg H 0 sann H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt
5 Ett utvalg: tosidig test for µ med σ kjent [10.5] 0. X 1, X 2,..., X n u.i.f. N(µ, σ 2 ) der σ er kjent. 1. To-sidig test: H 0 : µ = µ 0 vs. H 1 : µ µ 0 2. Signifikansnivå α bestemmes. 3. Testobservator under H 0 er Z 0. Z 0 = X µ 0 σ/ n er under H 0 standard normalfordelt. Regel: Forkast H 0 hvis Z 0 > z α. 2 4. Beregn x fra utvalget, og videre z 0 = x µ 0 σ/ n. Sammenlign z 0 og z α, og forkast H 0 hvis z 2 0 > z α. 2
6 P-verdi [10.4] DEF 10.5: En P-verdi er det laveste nivået hvor den observerte verdien til testobservatoren er signifikant. Utregning: P-verdi = P(for det vi har observert eller noe verre H 0 er sann) Steg: Bestem null- og alternativ hypotese. Velg testobservator. Beregn P-verdien basert på testobservatoren. Bestem om vi vil forkaste eller beholde nullhypotesen basert på P-verdien og kunnskap om systemet. Tilleggsinformasjon: Kan også gjøre hypotesetesting basert på signifikansnivå og forkastningsregion og oppgi P-verdi som tilleggsinformasjon.
7 Kvalitetskontroll: lengde av skruer X 1, X 2,..., X n er lengden på n skruer. Anta at X 1, X 2,..., X n er u.i.f N(µ, σ 2 = 0.1 2 ). Estimering Gi et anslag (punktestimat) og intervall (konfidensintervall) der vi har 95% tillit til at sann lengde for produserte skruer ligger. Hypotesetest Undersøk om det er grunn til å tro at de produserte skruene ikke er 15 mm lange (test hypotese). Bruk signifikansnivå 5%. H 0 : µ = 15 vs. H 1 : µ 15 Z = X µ σ/ n er standard normalfordelt, Z 0 = X µ 0 σ/ n
8 Kvalitetskontroll: lengde av skruer Estimering 95% konfidensintervall for µ. x z α σ 2 n < µ < x + z α 2 σ n 95 % konfidensintervall: [14.89, 15.11] Hypotesetest Forkast H 0 hvis z 0 > z α eller z 2 0 < z α. Behold H 2 0 hvis z α < z 2 0 < z α σ n < dvs. behold hvis x z α 2 2 µ 0 < x + z α σ 2 n z 0 = 1.58, z 0.025 = 1.96, dermed ikke forkast H 0. p-verdi 0.11. Hvis et (1 α)100% konfidensintervall inneholder µ 0 vil vi med en tosidig hypotesetest med signifikansnivå α ikke forkaste H 0 på nivå α. Hvis et (1 α)100% konfidensintervall ikke inneholder µ 0 vil vi med en tosidig hypotesetest med signifikansnivå α forkaste H 0 på nivå α.
9 Ett utvalg: ensidig test for µ med σ kjent [10.5] Ensidig test (større): 0. X 1, X 2,..., X n u.i.f. N(µ, σ 2 ) der σ er kjent. 1. En-sidig test (større): H 0 : µ = µ 0 vs. H 1 : µ > µ 0 2. Signifikansnivå α bestemmes. 3. Testobservator Z 0 = X µ 0 σ/ er under H n 0 standard normalfordelt. Forkast H 0 hvis Z 0 > z α. 4. Observerer x fra utvalget, beregn z 0 = x µ 0 σ/. n Sammenlign z 0 og z α, og forkast H 0 hvis z 0 > z α. En-sidig test (mindre): 1. H 0 : µ = µ 0 H 1 : µ < µ 0 3. Forkast H 0 hvis z < z α.
10 Ett utvalg: ensidig test for µ med σ ukjent [10.7] Ensidig test (større): 0. X 1, X 2,..., X n u.i.f. N(µ, σ 2 ) der σ er ukjent. S 2 = 1 n n 1 i=1 (X i X) 2. 1. En-sidig test (større), H 0 : µ = µ 0 vs. H 1 : µ > µ 0 2. Signifikansnivå α bestemmes. 3. Testobservator T 0 = X µ 0 s/ er under H n 0 t-fordelt med n 1 frihetsgrader. Forkast H 0 hvis T 0 > t α,(n 1). 4. Beregn x og s fra utvalget, og videre t 0 = x µ 0 s/. n Sammenlign t 0 og t α,(n 1), og forkast H 0 hvis t > t α,(n 1). En-sidig test (mindre): 1. H 0 : µ = µ 0 H 1 : µ < µ 0 3. Forkast H 0 hvis t 0 < t α,(n 1).
11 Ett utvalg: tosidig test for µ med σ ukjent [10.7] 0. X 1, X 2,..., X n u.i.f. N(µ, σ 2 ) der σ er ukjent. S 2 = 1 n 1 n i=1 (X i X) 2. 1. To-sidig test: H 0 : µ = µ 0 vs. H 1 : µ µ 0 2. Signifikansnivå α bestemmes. 3. Testobservator T 0 = X µ 0 s/ n er under H 0 t-fordelt med n 1 frihetsgrader. Forkast H 0 hvis T 0 > t α 2,(n 1). 4. Beregn x og s fra utvalget, og videre t 0 = x µ 0 s/ n. Sammenlign t 0 og t α 2,(n 1), og forkast H 0 hvis t 0 > t α 2,(n 1).
12 Fartskontroll med laser Ved fartskontroll benytter ofte politiet laser til å måle farten til bilene. Hvis Y er målt fart (km/t) til en tilfeldig valgt bil, antar vi at Y er normalfordelt med forventning µ og standardavvik σ = 1.5 km/t. Politiet gjennomfører en fartskontroll i en 50-sone der farten til hver bil måles med en lasermåling. Politiet vil fastsette en verdi k slik at sannsynligheten for at en bilist feilaktig beskyldes for fartsovertredelse blir høyst 0.01. a) Formuler hypotesetest og finn minste verdi k kan være. b) Hva er sannsynligheten for at en bilist som kjører i 55 km/t ikke blir beskyldt for fartsovertredelse? c) Hvor mange målinger må vi har for å oppdager at bilisten kjører for fort med styrke 0.95 når bilisten kjører i 55 km/t? Fasit: k=53.5, ikke beskyldt=0.16, minst 2 observasjoner.