ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren 2010 1 / 50

Oversikt over delene i Bjørn H. Auestad Oppsummering våren 2010 2 / 50

Oversikt over delene i Kp. 1: Kp. 2, 3, 4: Sannsynlighetsregning (sannsynlighetsteori) Kp. 5: konfidensintervall Kp. 6: Bjørn H. Auestad Oppsummering våren 2010 3 / 50

Beskrivende statistikk Bjørn H. Auestad Oppsummering våren 2010 4 / 50

Beskrivende statistikk Vi studerer data og er vanligvis interessert i: sentrum/belilggenhet til dataene spredning til dataene Grafiske metoder: Histogram, relativfrekvenshistogram...... ikke gjør dette (enkle) feil! Prikkdiagram (boksdiagram) Bjørn H. Auestad Oppsummering våren 2010 5 / 50

Beskrivende statistikk Numeriske mål (data: x 1,...,x n ): (relativ)frekvensfordeling (i tabell, f.eks.) klasse (intervall) 1 2 g frekvens n 1 n 2 n g n rel.frekv. 1 n 2 n n n g n Gjennomsnitt, empirisk median, empirisk prosentil empirisk varians (s 2 = 1 n n 1 i=1 (x i x) 2 ) og 1 emp. standardavvik (s = n n 1 i=1 (x i x) 2 ), variasjonsbredde, kvartilbredde Summasjon n a i = a m +a m+1 + +a n i=m Bjørn H. Auestad Oppsummering våren 2010 6 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Bjørn H. Auestad Oppsummering våren 2010 7 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Grunnleggende definisjoner (stokastisk forsøk, (enkelt)utfall, utfallsrom: Ω, sannsynligheter, relativfrekvenser, begivenheter) Sannsynlighetsmodell: Ω = {u 1,u 2,...}; P(u i ) = p i, i = 1,2,... Uniform sannsynlighetsmodell: Ω = {u 1,u 2,...,u k }; P(u i ) = p i = 1 k, i = 1,2,...,k Gyldig modell? realistisk modell?? Bjørn H. Auestad Oppsummering våren 2010 8 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Operasjoner med begivenheter: Venndiagram; Union, snitt, komplement; disjunkte begivenheter Operasjon Skrivemåte Inntreffer Unionen mellom A og B A B A eller B inntreffer Snittet mellom A og B A B, AB A og B inntreffer Komplementet til A A C, A A ikke inntreffer Vi sier at A og B er disjunkte dersom A B = φ (ingen felles utfall). Regneregler for sannsynligheter: komplementsetningen (P(A) = 1 P(A)), addisjonssetningen (P(A B) = P(A)+P(B) P(A B)) Bjørn H. Auestad Oppsummering våren 2010 9 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Kombinatorikk: Opptellingsregler: Produktregelen: m 1 m 2, permutasjonsregelen: (N) s,(n) N = N! ( ) N utvalgsregelen: = (N) s s s! ; ikke-ordnede utvalg uten tilbakelegging (det er kun denne situasjonen vi ser på), tilfeldig utvalg Bjørn H. Auestad Oppsummering våren 2010 10 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Betinget sannsynlighet: P(A B) = P(A B) P(B) Multiplikasjonssetningen for sannsynligheter: P(A B) = P(A B)P(B) Statistisk uavhengighet; P(A B) = P(A) (Ekvivalent med: P(A B) = P(A)P(B)) Setning om total sannsynlighet (forenklet): P(A) = P(A B)P(B)+P(A B)P(B) Bjørn H. Auestad Oppsummering våren 2010 11 / 50

Grunnleggende sannsynlighetsteori (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Tilfeldig variabel, sannsynlighetsfordeling (diskret, kontinuerlig) Tilfeldig variabel: abstrakt størrelse Tilf.var. og data betraktet som utfall av tilf.var. (eks. terningkast; viktig for forståelse av statistisk modellering) Forventning; Varians/standardavvik Regneregler... E(a 1 X 1 + +a n X n ) = a 1 E(X 1 )+ +a n E(X n ) Var(a 1 X 1 + +a n X n ) = a 2 1 Var(X 1)+ +a 2 nvar(x n ), når X i ene er ukorrelerte (alle parvise kovarianser er null). Bjørn H. Auestad Oppsummering våren 2010 12 / 50

Grunnleggende sannsynlighetsteori (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Generelt: Var(X +Y) = Var(X)+Var(Y)+2Cov(X,Y) { (X )( ) } Kovarians: Cov(X,Y) = E µx Y µy Korrelasjon: Corr(X,Y) = Cov(X,Y) SD(X)SD(Y) Uavhengige tilfeldige variable; uavhengighet og korrelasjon Bjørn H. Auestad Oppsummering våren 2010 13 / 50

Viktige (diskrete) sannsynlighetsfordelinger (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Binomisk modell: (Binomisk forsøksrekke, utledning av binomiske sannsynligheter, beregninger, bruk av tabell; Utledning av forventning og varians) Hypergeometrisk modell: (Definisjon, forventning og varians, beregne sannsynligheter, binomisk tilnærming) Geometrisk modell: (definisjon, forventning og varians, beregne sannsynligheter) Poissonmodell: (definisjon, forventning og varians, beregne sannsynligheter, tabellbruk) Bjørn H. Auestad Oppsummering våren 2010 14 / 50

Viktige (diskrete) sannsynlighetsfordelinger (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Det er viktig å kunne gjenkjenne hvilken situasjon som passer til hvilken modell. Binomisk modell: X = antall sukesser i n delforsøk (i en binomisk forsøksrekke). Hypergeometrisk modell: X = antall defekte i et utvalg fra en populasjon av defekte og ikkedefekte. Geometrisk modell: X = antall forsøk til første suksess (forsøk som i en binomisk forsøksrekke). Poissonmodell: X = antall ganger en bestemt begivenhet inntreffer i et tidsrom, på et areal eller i et volum. Bjørn H. Auestad Oppsummering våren 2010 15 / 50

Viktige (kontinuerlige) sannsynlighetsfordelinger (kp. 4) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Kontinuerlige sannsynlighetsfordelinger generelt: Sannsynlighetstetthet Sannsynliget: areal under tetthetskurve: Dersom X har tettheten f(x), så P(a < X < b) = b a f(x)dx Definisjon av forventning og varians Bjørn H. Auestad Oppsummering våren 2010 16 / 50

Viktige (kontinuerlige) sannsynlighetsfordelinger (kp. 4) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) 1. Eksponesialfordelingen: (Definisjon, forventning og varians, spesielle egenskaper, beregne sannsynligheter) 2. Normalfordelingen: (Definisjon, forventning og varians, spesielle egenskaper, beregne sannsynligheter) anvendelser, beregne sannsynligheter (standardisering og bruk av N(0,1)-tabell) to setninger; 1) a+bx, 2) X 1 +X 2 Normaltilnærming til binomisk fordeling Sentralgrensesetningen 3. (Students) t-fordeling: (anvendelser, bruk av tabell) Bjørn H. Auestad Oppsummering våren 2010 17 / 50

Estimering Konfidensintervall Bjørn H. Auestad Oppsummering våren 2010 18 / 50

Estimering. Målemodellen. Konfidensintervall (kp. Estimering Konfidensintervall Oversikt: (Punkt)estimering Målemodellen (Punkt)estimering i målemodellen (Intervallestimering) Konfidensintervall estimering og konfidensintervall i ulike situasjoner (modeller); jf. oversikt... Bjørn H. Auestad Oppsummering våren 2010 19 / 50

Estimering. Målemodellen. Konfidensintervall (kp. Estimering Konfidensintervall Begrep: estimator (tilfeldig variabel, θ) estimat (utfall (verdi) av θ) fortolkning av statistisk usikkerhet (jf.: fordeling til estimator) standardfeil: SD( θ); forventningsretthet: E( θ) = θ best estimator Bjørn H. Auestad Oppsummering våren 2010 20 / 50

Estimering i binomisk modell Estimering Konfidensintervall Modell: Y B(n, p); (ukjent) parameter: p Estimator: p = Y n Standardfeil: SD( p) = p(1 p) n Estimator av standardfeil: ŜD( p) = p(1 p) n Bjørn H. Auestad Oppsummering våren 2010 21 / 50

Estimering i målemodellen Estimering Konfidensintervall Modell: X 1,...,X n er n uif. tilf.var. med E(X i ) = µ og Var(X i ) = σ 2. (ukjente) parametere: µ, σ 2 Estimator for µ: µ = X Standardfeil: SD( µ) = σ 2 n Estimator av standardfeil: ŜD( µ) = S 2 n Estimator av σ 2 : σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Oppsummering våren 2010 22 / 50

Estimering i Poissonmodellen Modell: Y Poisson(λt); (ukjent) parameter: λ Estimering Konfidensintervall Estimator: λ = Y t ( λt = Y er estimator for λt.) Standardfeil: SD( λ) = λ t Estimator av standardfeil: ŜD( λ) = λ t Bjørn H. Auestad Oppsummering våren 2010 23 / 50

Konfidensintervall Estimering Konfidensintervall Generell definisjon av konfidensintervall: Situasjon: Data x 1,...,x n ; utfall av : X 1,...,X n ; n u.i.f. tilfeldige variable Ukjent parameter (i fordelingen til X i ene): θ Dersom L og U (L < U) er to funksjoner av X 1,...,X n, som er slik at: ( ) 1 α = P L θ U, sier vi at det utregnete intervallet (l, u) er et (1 α) 100% konfidensintervall for θ. Typisk: L = θ z α/2 SD( θ), U = θ +z α/2 SD( θ) Bjørn H. Auestad Oppsummering våren 2010 24 / 50

Konfidensintervall Estimering Konfidensintervall Obs. 1: (1 α): konfidensgrad Obs. 2: Det utregnete intervallet (l, u): Framkommer når vi setter dataverdiene x 1,...,x n inn i funksjonene L og U. Obs. 3: a) Eventuelt tilnærmede intervall (for p i binomisk modell og for µ i målemodellen med n stor og uten normalantakelse); b) Bytt z α/2 med t n 1,α/2 for t-intervall (for µ i målemodellen med normalantakelse, ukjent varians) Obs. 4, fortolkning Strengt tatt: Intervallet (l, u) er konfidensintervallet; ( ) Vi kan ikke si: P l θ u = 1 α Bjørn H. Auestad Oppsummering våren 2010 25 / 50

Konfidensintervall Estimering Konfidensintervall Målemodell 1; (1 α) 100% konfidensintervall for µ er ) σ (X z 2 α/2, X +z σ 2 n α/2 n Målemodell 2; tiln. (1 α) 100% konfidensintervall for µ er ) S (X z 2 α/2, X +z S 2 n α/2 n Binomisk modell; tiln. (1 α) 100% konfidensintervall for p er ( ) p(1 p) p(1 p) p z α/2, p+z n α/2 n Målemodell 3; (1 α) 100% konfidensintervall for µ er S (X t 2 α/2,n 1, X +t n α/2,n 1 S 2 n ) Bjørn H. Auestad Oppsummering våren 2010 26 / 50

Introduksjon Standardtester µ, målemodell, 3 Teori Bjørn H. Auestad Oppsummering våren 2010 27 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori : Trekke konklusjoner på bakgrunn av data med statistisk usikkerhet. Hypotesetesting, Kp. 6 i Begrep: null- og alternativhypotese (ensidig / tosidig) teststørrelse (testobservator), nullfordeling kritisk verdi, forkastningsområde signifiaknsnivå styrke, styrkefunksjon p-verdi hypotesetest vs. konfidensintervall Bjørn H. Auestad Oppsummering våren 2010 28 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Eksempel på problemstilling: 10 ph-målinger: 6.00, 5.59, 5.74, 3.43, 5.30, 6.48, 5.15, 4.28, 4.52, 6.20; Gjennomsnitt: 5.27 3 4 5 6 7 8 9 ph-data Målemodell: målingene oppfattes som utfall av 10 u.i.f. tilfeldigevariable X 1,...,X 10. E(X i ) = µ: virkelig ph, ukjent størrelse 5.27 er et estimat av µ med statistisk usikkerhet! Kan vi hevde at µ < 6.0?? Bjørn H. Auestad Oppsummering våren 2010 29 / 50

Hypotesetesting Vi betrakter våre data som utfall av tilfeldige variable (X 1,...,X 10 ). Forventningen, µ, kjenner vi ikke. (Var(X i ) = σ 2 = 1 antas å være riktig, kjent.) Introduksjon Standardtester µ, målemodell, 3 Teori Tyder dataene (klart) på at µ < 6? 3 4 5 6 7 8 9 Kan datene med rimelighet sees på som utfall av N(6, 1)-tettheten (heltrukket linje)? Eller må vi bruke µ < 6 for å få det til å virke rimelig? (Jf. f.eks. tetthet med prikket linje.) Bjørn H. Auestad Oppsummering våren 2010 30 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Spørsmålet besvares ved å teste H 0 : µ = 6 mot H 1 : µ < 6 Vi baserer oss på gjennomsnittsresultatet 5.27 Omfanget av statistisk usikkerhet i estimatet 5.27, gjenspeiles av variansen eller fordelingen til gjennomsnittet av X 1,...,X 10, X. Nullfordeling til X: N(6, 0.1) (Var(X) = σ2 n = 1 10 ) (Normalantakelse og kjent σ 2 = 1.) Er 5.27 et rimelig utfall av X dersom µ = 6? 4 5 6 7 8 N (6, 0.1) tetthet Bjørn H. Auestad Oppsummering våren 2010 31 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 σ 2 n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 32 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Begrepene null- og alternativhypotese (ensidig/tosidig) teststørrelse (testobservator), nullfordeling kritisk verdi, forkastningsområde signifiaknsnivå styrke, styrkefunksjon p-verdi hypotesetest vs. konfidensintervall Bjørn H. Auestad Oppsummering våren 2010 33 / 50

µ, målemodell, normalantakelse, kjent varians Målemodellen m/normalantakelse og kjent σ 2 : n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n Introduksjon Standardtester µ, målemodell, 3 Teori X i normalfordelt og σ 2 kjent. Bjørn H. Auestad Oppsummering våren 2010 34 / 50

µ, målemodell, normalantakelse, kjent varians Introduksjon Standardtester µ, målemodell, 3 Teori Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 σ 2 n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom 0.5 0.4 X µ 0 σ 2 n Fork.omr.: (z α, ) z α 0.3 0.2 0.1 )( α 0-3 -2-1 0 1 2 3 Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 35 / 50

µ, målemodell, normalantakelse, kjent varians Introduksjon Standardtester µ, målemodell, 3 Teori Tosidig: Vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Teststørrelse: Z = X µ 0 σ 2 n Test (m/sign.nivå α): Forkast H 0 dersom Z z α/2 eller Z z α/2, Nullfordeling: N(0, 1) 0.5 0.4 0.3 Fork.område: 0 (, z α/2 ) (z α/2, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 N(0, 1) tetthet. )( Bjørn H. Auestad Oppsummering våren 2010 36 / 50

µ, målemodell, n stor og tilnærmet normalfordeling Introduksjon Standardtester µ, målemodell, 3 Teori Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n. σ 2 (og µ ) ukjent; (ingen forutsetning om fordeling til X i ene eller om kjent varians) Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Oppsummering våren 2010 37 / 50

µ, målemodell, n stor og tilnærmet normalfordeling Introduksjon Standardtester µ, målemodell, 3 Teori Test (tiln. sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Test (tiln. sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom 0.5 0.4 X µ 0 S 2 n Fork.omr.: (z α, ) z α 0.3 0.2 0.1 )( α 0-3 -2-1 0 1 2 3 Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 38 / 50

µ, målemodell, n stor og tilnærmet normalfordeling Introduksjon Standardtester µ, målemodell, 3 Teori Tosidig: Vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Teststørrelse: Z = X µ 0 S 2 n Test (m/tiln. sign.nivå α): Forkast H 0 dersom Z z α/2 eller Z z α/2, Nullfordeling: N(0, 1), tiln. 0.5 0.4 0.3 Fork.område: 0 (, z α/2 ) (z α/2, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 N(0, 1) tetthet. )( Bjørn H. Auestad Oppsummering våren 2010 39 / 50

p, i binomisk modell; n stor og normaltilnærming Introduksjon Standardtester µ, målemodell, 3 Teori Generelt Situasjon: Binomisk modell (ev. som tilnærming til hypergeom.) Data: antall suksesser av n mulige er registrert. Resultatet betraktes som utfall av den tilfeldige variable Y der Y B(n,p) n og p er slik at fordelingen til Y kan tilnærmes med normalfordelingen. La p = Y n (estimator for p). Bjørn H. Auestad Oppsummering våren 2010 40 / 50

p, i binomisk modell; n stor og normaltilnærming Introduksjon Standardtester µ, målemodell, 3 Teori Test (tiln. sign.nivå α) for: H 0 : p = p 0 mot H 1 : p < p 0 Forkast H 0 dersom p p 0 p 0 (1 p 0 ) n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Test (tiln. sign.nivå α) for: H 0 : p = p 0 mot H 1 : p > p 0 Forkast H 0 dersom 0.5 0.4 p p 0 p 0 (1 p 0 ) n Fork.omr.: (z α, ) z α 0.3 0.2 0.1 )( α 0-3 -2-1 0 1 2 3 Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 41 / 50

p, i binomisk modell; n stor og normaltilnærming Introduksjon Standardtester µ, målemodell, 3 Teori Tosidig test: Vil teste: H 0 : p = p 0 mot H 1 : p p 0 Teststørrelse: Z = p p 0 p 0 (1 p 0 ) n Test (m/tiln. sign.nivå α): Forkast H 0 dersom Z z α/2 eller Z z α/2, Nullfordeling: N(0, 1), tiln. 0.5 0.4 0.3 Fork.område: 0 (, z α/2 ) (z α/2, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 N(0, 1) tetthet. )( Bjørn H. Auestad Oppsummering våren 2010 42 / 50

Binomisk og Poisson uten normaltilnærming Tester kan også gjennomføres i binomisk- og Poissonmodell uten bruk av normaltilnærming. Se eksempler i forelesningsnotatene Introduksjon Standardtester µ, målemodell, 3 Teori Bjørn H. Auestad Oppsummering våren 2010 43 / 50

µ, målemodell, normalantakelse, ukjent varians, n liten Generelt, t-tester Introduksjon Standardtester µ, målemodell, 3 Teori Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Målemodell 3 Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Oppsummering våren 2010 44 / 50

µ, målemodell, normalantakelse, ukjent varians, n liten. t-test, ensidig. Introduksjon Standardtester µ, målemodell, 3 Teori Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n t α,n 1 Fork.omr.: (, t α,n 1 ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av t-fordeling og forkastningsområde. Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom 0.5 0.4 X µ 0 S 2 n t α,n 1 Fork.omr.: (t α,n 1, ) 0.3 0.2 0.1 0 ) ( α Skisse av t-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 45 / 50

µ, målemodell, normalantakelse, ukjent varians, n liten. t-test, tosidig. Introduksjon Standardtester µ, målemodell, 3 Teori Generelt; tosidig t-test: Vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Teststørrelse: T = X µ 0 S 2 n Test (m/sign.nivå α): Forkast H 0 dersom T t α/2,n 1 eller T t α/2,n 1, Nullfordeling: t(n 1) 0.5 0.4 0.3 Fork.område: 0 (, t α/2,n 1 ) (t α/2,n 1, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 t tetthet og forkastningsområde. )( Bjørn H. Auestad Oppsummering våren 2010 46 / 50

Hypotesetesting Def.: Signifikansnivå til test = P(forkaste H 0 H 0 riktig) Signifikansnivået er sannsynligheten at utfallet faller i forkastningsområdet ved en tilfeldighet (og at vi konkluderer med H 1 ), når i virkeligheten H 0 er riktig. Introduksjon Standardtester µ, målemodell, 3 Teori Bjørn H. Auestad Oppsummering våren 2010 47 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Styrke, generell definisjon: Situasjon og modell fastlagt; test ang. parameteren θ Følgende er også fastlagt: H 0 og H 1 Teststørrelse, sign.nivå og forkastningsområde / kritisk verdi Def.: Styrkefunksjonen, γ, er definert ved: γ(θ) = P(forkaste H 0 θ). For en bestemt verdi θ 1 (slik at H 1 er riktig), kalles sannsynligheten γ(θ 1 ) for styrken i alternativet θ 1. Styrke (ev. tilnærmet styrke) kan finnes for alle testene vi har sett på til nå, på tilsvarende måte som i de to foregående eksemplene. Se eksempler i forelesningsnotatene Bjørn H. Auestad Oppsummering våren 2010 48 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori p-verdi, generelt: Dersom p-verdien er lavere enn fastlagt signifikansnivå, forkastes H 0. (Da har teststørrelsen verdi i forkastningsområdet.) Generell definisjon av p-verdi: Def.: p-verdien til et resultat er sannsynligheten beregnet under H 0 for å få det observerte resultatet eller et som i enda sterkere grad peker i retning av at H 1 er riktig. Se eksempler i forelesningsnotatene Bjørn H. Auestad Oppsummering våren 2010 49 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Konfidensintervall vs. test, generelt: La (L,U) være et (ev. tilnærmet) 100(1 α)% konfidensintervall for parameteren θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L,U). Testen har signifikansnivå α (ev. tilnærmet). Veldig god måte å gjennomføre (tosidige) tester på! Obs.: dersom dette blir brukt for ensidig test får vi en annen sammenheng mellom intervallets konfidensgrad og sign.nivået til testen. Se eksempler i forelesningsnotatene Bjørn H. Auestad Oppsummering våren 2010 50 / 50