ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

ÅMA110 Sasylighetsregig med statistikk, våre 2007 Oppsummerig Bjør H. Auestad Istitutt for matematikk og aturviteskap Uiversitetet i Stavager 19. april Bjør H. Auestad Oppsummerig våre 2006 1 / 37 Oversikt over delee i Bjør H. Auestad Oppsummerig våre 2006 2 / 37 Oversikt over delee i Kp. 1: Kp. 2, 3, 4: Sasylighetsregig () Kp. 5: kofidesitervall Kp. 6: Bjør H. Auestad Oppsummerig våre 2006 3 / 37

Beskrivede statistikk Bjør H. Auestad Oppsummerig våre 2006 4 / 37 Beskrivede statistikk Vi studerer data og er valigvis iteressert i: setrum/belilggehet til dataee spredig til dataee Grafiske metoder: Histogram, relativfrekveshistogram...ikkegjørdette(ekle)feil! Prikkdiagram (boksdiagram) Bjør H. Auestad Oppsummerig våre 2006 5 / 37 Beskrivede statistikk Numeriske mål (data: x 1,...,x ): (relativ)frekvesfordelig (i tabell, f.eks.) klasse (itervall) 1 2 g frekves 1 2 g rel.frekv. 1 2 g Gjeomsitt, empirisk media, empirisk prosetil empirisk varias (s 2 = 1 1 i=1 (x i x) 2 )og 1 emp. stadardavvik (s = 1 i=1 (x i x) 2 ), variasjosbredde, kvartilbredde Summasjo a i = a m + a m+1 + + a i=m Bjør H. Auestad Oppsummerig våre 2006 6 / 37

2) (kotiuerlige) Bjør H. Auestad Oppsummerig våre 2006 7 / 37 Gruleggede 2) 2) (kotiuerlige) Gruleggede defiisjoer (stokastisk forsøk, (ekelt)utfall, utfallsrom: Ω, sasyligheter, relativfrekveser, begiveheter) Sasylighetsmodell: Ω={u 1,u 2,...}; P (u i )=p i, i =1, 2,... Uiform sasylighetsmodell: Ω={u 1,u 2,...,u k }; P (u i )=p i = 1 k, Gyldig modell? realistisk modell?? i =1, 2,...,k Bjør H. Auestad Oppsummerig våre 2006 8 / 37 Gruleggede 2) 2) (kotiuerlige) Operasjoer med begiveheter: Vediagram; Uio, sitt, komplemet; disjukte begiveheter Operasjo Skrivemåte Itreffer Uioe mellom A og B A B A eller B itreffer Sittet mellom A og B A B, AB A og B itreffer Komplemetet til A A C, A A ikke itreffer Vi sier at A og B er disjukte dersom A B = φ (ige felles utfall). Regeregler for sasyligheter: komplemetsetige (P (A) =1 P (A)), addisjossetige (P (A B) =P (A)+P (B) P (A B)) Bjør H. Auestad Oppsummerig våre 2006 9 / 37

Gruleggede 2) 2) (kotiuerlige) Kombiatorikk: Opptelligsregler: Produktregele: m 1 m 2, permutasjosregele: (N) s, (N) N = N! ( ) N utvalgsregele: = (N)s s s! ; ikke-ordede utvalg, tilfeldig utvalg Bjør H. Auestad Oppsummerig våre 2006 10 / 37 Gruleggede 2) 2) (kotiuerlige) Betiget sasylighet: P (A B) = P (A B) P (B) Multiplikasjossetige for sasyligheter: P (A B) =P (A B)P (B) Statistisk uavhegighet; P (A B) =P (A) Setig om total sasylighet (foreklet): P (A) =P (A B)P (B)+P (A B)P (B) Bjør H. Auestad Oppsummerig våre 2006 11 / 37 Gruleggede 2) (kotiuerlige) Tilfeldig variabel, sasylighetsfordelig (diskret, kotiuerlig) Tilfeldig variabel: abstrakt størrelse Tilf.var. utfall av tilf.var. (eks. terigkast; viktig for forståelse av statistisk modellerig) Forvetig; Varias/stadardavvik Regeregler... E(a 1 X 1 + + a X )=a 1 E(X 1 )+ + a E(X ) Var(a 1 X 1 + + a X )=a 2 1 Var(X 1)+ + a 2 Var(X ), år X i ee er ukorrelerte. Bjør H. Auestad Oppsummerig våre 2006 12 / 37

Gruleggede 2) (kotiuerlige) Geerelt: Var(X + Y )=Var(X)+Var(Y )+2Cov(X, Y ) { (X )( ) } Kovarias: Cov(X, Y )=E μx Y μy Korrelasjo: Uavhegige tilfeldige variable; uavhegighet og korrelasjo Corr(X, Y )= Cov(X, Y ) SD(X)SD(Y ) Bjør H. Auestad Oppsummerig våre 2006 13 / 37 Viktige (diskrete) 2) (kotiuerlige) 1. Biomisk modell: (Biomisk forsøksrekke, utledig av biomiske sasyligheter, beregiger, bruk av tabell; Utledig av forvetig og varias) 2. Hypergeometrisk modell: (Defiisjo, forvetig og varias, berege sasyligheter, biomisk tilærmig) 3. Geometrisk modell: (defiisjo, forvetig og varias, berege sasyligheter) 4. Poissomodell: (defiisjo, forvetig og varias, berege sasyligheter, tabellbruk) Bjør H. Auestad Oppsummerig våre 2006 14 / 37 Viktige (kotiuerlige) 2) (kotiuerlige) Kotiuerlige geerelt: Sasylighetstetthet Sasyliget: areal uder tetthetskurve: Dersom X har tetthete f(x), så P (a <X<b)= Def. av forvetig og varias b a f(x)dx Bjør H. Auestad Oppsummerig våre 2006 15 / 37

Viktige (kotiuerlige) 2) (kotiuerlige) 1. Ekspoesialfordelige: (Defiisjo, forvetig og varias, spesielle egeskaper, berege sasyligheter) 2. Normalfordelige: (Defiisjo, forvetig og varias, spesielle egeskaper, berege sasyligheter) avedelser, berege sasyligheter (stadardiserig og bruk av N (0, 1)-tabell) to setiger; 1) a + bx, 2) X 1 + X 2 Normaltilærmig til biomisk fordelig Setralgresesetige 3. (Studets) t-fordelig: (avedelser, bruk av tabell) Bjør H. Auestad Oppsummerig våre 2006 16 / 37 Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Bjør H. Auestad Oppsummerig våre 2006 17 / 37 Estimerig. Målemodelle. Kofidesitervall Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall (Pukt)estimerig Målemodelle (Pukt)estimerig i målemodelle (Itervallestimerig) Kofidesitervall estimerig og kofidesitervall i ulike situasjoer (modeller); jf. oversikt... Bjør H. Auestad Oppsummerig våre 2006 18 / 37

Estimerig. Målemodelle. Kofidesitervall Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Begrep: estimator (tilfeldig variabel, θ) estimat (utfall (verdi) av θ) fortolkig av statistisk usikkerhet (jf.: fordelig til estimator) stadardfeil: SD( θ); forvetigsretthet: E( θ) =θ best estimator Bjør H. Auestad Oppsummerig våre 2006 19 / 37 Estimerig i biomisk modell Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Modell: Y B(, p); (ukjet) parameter: p Estimator: p = Y Stadardfeil: SD( p) = p(1 p) Estimator av stadardfeil: ŜD( p) = p(1 p) Bjør H. Auestad Oppsummerig våre 2006 20 / 37 Estimerig i målemodelle Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Modell: X 1,...,X er uif. tilf.var. med E(X i )=μ og Var(X i )=σ 2. (ukjete) parametere: μ, σ 2 Estimator for μ: μ = X Stadardfeil: SD( μ) = σ 2 Estimator av stadardfeil: ŜD( μ) = S 2 Estimator av σ 2 : σ 2 = S 2 = 1 1 i=1 (X i X) 2 Bjør H. Auestad Oppsummerig våre 2006 21 / 37

Estimerig i Poissomodelle Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Modell: Y Poisso(λt); (ukjet) parameter: λ Estimator: λ = Y t ( λt = Y er estimator for λt.) Stadardfeil: SD( λ) = λ t Estimator av stadardfeil: ŜD( λ) = λ t Bjør H. Auestad Oppsummerig våre 2006 22 / 37 Kofidesitervall Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Geerell defiisjo av kofidesitervall: Situasjo: Data x 1,...,x ;utfallav:x 1,...,X ; u.i.f. tilfeldige variable Ukjet parameter (i fordelige til X i ee): θ Dersom L og U (L <U) er to fuksjoer av X 1,...,X,som er slik at: ( ) 1 α = P L θ U, sier vi at det utregete itervallet (l, u) er et (1 α) 100% kofidesitervall for θ. Typisk: L = θ z α/2 SD( θ), U = θ + z α/2 SD( θ) Bjør H. Auestad Oppsummerig våre 2006 23 / 37 Kofidesitervall Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Obs. 1: (1 α): kofidesgrad Obs. 2: Det utregete itervallet (l, u): Framkommer år vi setter dataverdiee x 1,...,x i i fuksjoee L og U. Obs. 3: a) Evetuelt tilærmede itervall; b) Bytt z α/2 med t 1,α/2 for t-itervall Obs. 4, fortolkig Stregt tatt: Itervallet (l, u) er kofidesitervallet; Vi ka ikke si: ( ) P l θ u =1 α Bjør H. Auestad Oppsummerig våre 2006 24 / 37

Kofidesitervall Estimerig. Målemodelle. Kofidesitervall biomisk modell målemodelle Poissomodelle Kofidesitervall Målemodell 1; (1 α) 100% kofidesitervall for μ er ) σ (X z 2 α/2, X + z σ 2 α/2 Målemodell 2; til. (1 α) 100% kofidesitervall for μ er ) S (X z 2 α/2, X + z S 2 α/2 Biomisk modell; til. (1 α) 100% kofidesitervall for p er ( ) p(1 p) p(1 p) p z α/2, p + z α/2 Målemodell 3; (1 α) 100% kofidesitervall for μ er S (X t 2 α/2, 1, X + t α/2, 1 S 2 ) Bjør H. Auestad Oppsummerig våre 2006 25 / 37 Bjør H. Auestad Oppsummerig våre 2006 26 / 37 Hypotesetestig : Trekke koklusjoer på bakgru av data med statistisk usikkerhet. : Hypotesetestig Kp. 6 i ull- og alterativhypotese (esidig / tosidig) teststørrelse (testobservator), ullfordelig kritisk verdi, forkastigsområde sigifiaksivå styrke, styrkefuksjo p-verdi hypotesetest vs. kofidesitervall Bjør H. Auestad Oppsummerig våre 2006 27 / 37

Hypotesetestig Eksempel på problemstillig: 10 ph-måliger: 6.00, 5.59, 5.74, 3.43, 5.30, 6.48, 5.15, 4.28, 4.52, 6.20; 3 4 5 6 7 8 9 Gjeomsitt: 5.27 ph-data Målemodell: måligee oppfattes som utfall av 10 u.i.f. tilfeldigevariable X 1,...,X 10. E(X i )=μ: virkelig ph, ukjet størrelse 5.27 er et estimat av μ med statistisk usikkerhet! Ka vi hevde at μ<6.0?? Bjør H. Auestad Oppsummerig våre 2006 28 / 37 Hypotesetestig Vi betrakter våre data som utfall av tilfeldige variable (X 1,...,X 10). Forvetige, μ, kjeer vi ikke. (Var(X i)=σ 2 =1atas å være riktig, kjet.) Tyder dataee (klart) på at μ<6? 3 4 5 6 7 8 9 Ka datee med rimelighet sees på som utfall av N (6, 1)-tetthete (heltrukket lije)? Eller må vi bruke μ<6 for å få det til å virke rimelig? (Jf. f.eks. tetthet med prikket lije.) Bjør H. Auestad Oppsummerig våre 2006 29 / 37 Hypotesetestig Spørsmålet besvares ved å teste H 0 : μ =6mot H 1 : μ<6 Vi baserer oss på gjeomsittsresultatet 5.27 Omfaget av statistisk usikkerhet i estimatet 5.27, gjespeiles av variase eller fordelige til gjeomsittet av X 1,...,X 10, X. Nullfordelig til X: N (6, 0.1) (Var(X) = σ2 = 1 ) 10 (Normalatakelse og kjet σ 2 =1.) Er 5.27 et rimelig utfall av X dersom μ =6? 4 5 6 7 8 N (6, 0.1) tetthet Bjør H. Auestad Oppsummerig våre 2006 30 / 37

Hypotesetestig Test (sig.ivå α) for: H 0 : μ = μ 0 mot H 1 : μ<μ 0 Forkast H 0 dersom X μ 0 σ 2 z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N (0, 1)-fordelig og forkastigsområde. Hypotesetestig i ulike situasjoer (med ulike modeller). Bjør H. Auestad Oppsummerig våre 2006 31 / 37 Hypotesetestig Begrepee ull- og alterativhypotese (esidig/tosidig) teststørrelse (testobservator), ullfordelig kritisk verdi, forkastigsområde sigifiaksivå styrke, styrkefuksjo p-verdi hypotesetest vs. kofidesitervall Bjør H. Auestad Oppsummerig våre 2006 32 / 37 Hypotesetestig Def.: Sigifikasivå til test = P (forkaste H 0 H 0 riktig) Sigifikasivået er sasylighete at utfallet faller i forkastigsområdet ved e tilfeldighet (og at vi kokluderer med H 1 ), år i virkelghete H 0 er riktig. Bjør H. Auestad Oppsummerig våre 2006 33 / 37

Hypotesetestig Styrke, geerell defiisjo: Situasjo og modell fastlagt; test ag. parametere θ Følgede er også fastlagt: H 0 og H 1 Teststørrelse, sig.ivå og forkastigsområde / kritisk verdi Def.: Styrkefuksjoe, γ, er defiert ved: γ(θ) =P (forkaste H 0 θ). For e bestemt verdi θ 1 (slik at H 1 er riktig), kalles sasylighete γ(θ 1 ) for styrke i alterativet θ 1. Styrke (ev. tilærmet styrke) ka fies for alle testee vi har sett på til å, på tilsvarede måte som i de to foregåede eksemplee. Bjør H. Auestad Oppsummerig våre 2006 34 / 37 Hypotesetestig p-verdi, geerelt: Dersom p-verdie er lavere e fastlagt sigifikasivå, forkastes H 0. (Da har teststørrelse verdi i forkastigsområdet.) Geerell defiisjo av p-verdi: Def.: p-verdie til et resultat er sasylighete bereget uder H 0 for å få det observerte resultatet eller et som i eda sterkere grad peker i retig av at H 1 er riktig. Bjør H. Auestad Oppsummerig våre 2006 35 / 37 Hypotesetestig Kofidesitervall vs. test, geerelt: La (L, U) være et (ev. tilærmet) 100(1 α)% kofidesitervall for parametere θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L, U). Teste har sigifikasivå α (ev. tilærmet). Veldig god måte å gjeomføre (tosidige) tester på! Obs.: dersom dette blir brukt for esidig test får vi e ae sammeheg mellom itervallets kofidesgrad og sig.ivået til teste. Bjør H. Auestad Oppsummerig våre 2006 36 / 37

Hypotesetestig Eksame: tirsdag 29. mai. Orakeltjeeste Iformasjo kommer på It s: leareig Husk å øve jevlig! Bjør H. Auestad Oppsummerig våre 2006 37 / 37