ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren 2006 1 / 38 Oversikt over delene i Bjørn H. Auestad Oppsummering våren 2006 2 / 38

Oversikt over delene i Kp. 1: Kp. 2, 3, 4: Sannsynlighetsregning () Kp. 5: konfidensintervall Kp. 6: Bjørn H. Auestad Oppsummering våren 2006 3 / 38 Beskrivende statistikk Bjørn H. Auestad Oppsummering våren 2006 4 / 38

Beskrivende statistikk Vi studerer data og er vanligvis interessert i: sentrum/belilggenhet til dataene spredning til dataene Grafiske metoder: Histogram, relativfrekvenshistogram...ikkegjørdette(enkle)feil! Prikkdiagram (boksdiagram) Bjørn H. Auestad Oppsummering våren 2006 5 / 38 Beskrivende statistikk Numeriske mål (data: x 1,...,x n ): (relativ)frekvensfordeling (i tabell, f.eks.) klasse (intervall) 1 2 g frekvens n 1 n 2 n g n rel.frekv. 1 n 2 n n n g n Gjennomsnitt, empirisk median, empirisk prosentil empirisk varians (s 2 = 1 n n 1 i=1 (x i x) 2 )og 1 emp. standardavvik (s = n n 1 i=1 (x i x) 2 ), variasjonsbredde, kvartilbredde Summasjon n a i = a m + a m+1 + + a n i=m Bjørn H. Auestad Oppsummering våren 2006 6 / 38

(kontinuerlige) 4) Bjørn H. Auestad Oppsummering våren 2006 7 / 38 Grunnleggende (kontinuerlige) 4) Grunnleggende definisjoner (stokastisk forsøk, (enkelt)utfall, utfallsrom: Ω, sannsynligheter, relativfrekvenser, begivenheter) Sannsynlighetsmodell: Ω={u 1,u 2,...}; P (u i )=p i, i =1, 2,... Uniform sannsynlighetsmodell: Ω={u 1,u 2,...,u k }; P (u i )=p i = 1 k, i =1, 2,...,k Gyldig modell? realistisk modell?? Bjørn H. Auestad Oppsummering våren 2006 8 / 38

Grunnleggende (kontinuerlige) 4) Operasjoner med begivenheter: Venndiagram; Union, snitt, komplement; disjunkte begivenheter Operasjon Skrivemåte Inntreffer Unionen mellom A og B A B A eller B inntreffer Snittet mellom A og B A B, AB A og B inntreffer Komplementet til A A C, A A ikke inntreffer Vi sier at A og B er disjunkte dersom A B = φ (ingen felles utfall). Regneregler for sannsynligheter: komplementsetningen (P (A) =1 P (A)), addisjonssetningen (P (A B) =P (A)+P (B) P (A B)) Bjørn H. Auestad Oppsummering våren 2006 9 / 38 Grunnleggende (kontinuerlige) 4) Kombinatorikk: Opptellingsregler: Produktregelen: m 1 m 2, permutasjonsregelen: (N) s, (N) N = N! ( ) N utvalgsregelen: = (N) s s s! ; ikke-ordnede utvalg, tilfeldig utvalg Bjørn H. Auestad Oppsummering våren 2006 10 / 38

Grunnleggende (kontinuerlige) 4) Betinget sannsynlighet: P (A B) = P (A B) P (B) Multiplikasjonssetningen for sannsynligheter: P (A B) =P (A B)P (B) Statistisk uavhengighet; P (A B) =P (A) Setning om total sannsynlighet (forenklet): P (A) =P (A B)P (B)+P (A B)P (B) Bjørn H. Auestad Oppsummering våren 2006 11 / 38 Grunnleggende (kontinuerlige) 4) Tilfeldig variabel, sannsynlighetsfordeling (diskret, kontinuerlig) Tilfeldig variabel: abstrakt størrelse Tilf.var. utfall av tilf.var. (eks. terningkast; viktig for forståelse av statistisk modellering) Forventning; Varians/standardavvik Regneregler... E(a 1 X 1 + + a n X n )=a 1 E(X 1 )+ + a n E(X n ) Var(a 1 X 1 + + a n X n )=a 2 1 Var(X 1)+ + a 2 nvar(x n ), når X i ene er ukorrelerte. Bjørn H. Auestad Oppsummering våren 2006 12 / 38

Grunnleggende (kontinuerlige) 4) Generelt: Var(X + Y )=Var(X)+Var(Y )+2Cov(X, Y ) { (X )( ) } Kovarians: Cov(X, Y )=E μx Y μy Korrelasjon: Uavhengige tilfeldige variable; uavhengighet og korrelasjon Corr(X, Y )= Cov(X, Y ) SD(X)SD(Y ) Bjørn H. Auestad Oppsummering våren 2006 13 / 38 Viktige (diskrete) (kontinuerlige) 4) 1. Binomisk modell: (Binomisk forsøksrekke, utledning av binomiske sannsynligheter, beregninger, bruk av tabell; Utledning av forventning og varians) 2. Hypergeometrisk modell: (Definisjon, forventning og varians, beregne sannsynligheter, binomisk tilnærming) 3. Geometrisk modell: (definisjon, forventning og varians, beregne sannsynligheter) 4. Poissonmodell: (definisjon, forventning og varians, beregne sannsynligheter, tabellbruk) Bjørn H. Auestad Oppsummering våren 2006 14 / 38

Viktige (kontinuerlige) 4) Kontinuerlige generelt: (kontinuerlige) 4) Sannsynlighetstetthet Sannsynliget: areal under tetthetskurve: Dersom X har tettheten f(x), så P (a <X<b)= Def. av forventning og varians b a f(x)dx Bjørn H. Auestad Oppsummering våren 2006 15 / 38 Viktige (kontinuerlige) 4) (kontinuerlige) 4) 1. Eksponesialfordelingen: (Definisjon, forventning og varians, spesielle egenskaper, beregne sannsynligheter) 2. Normalfordelingen: (Definisjon, forventning og varians, spesielle egenskaper, beregne sannsynligheter) anvendelser, beregne sannsynligheter (standardisering og bruk av N (0, 1)-tabell) to setninger; 1) a + bx, 2) X 1 + X 2 Normaltilnærming til binomisk fordeling Sentralgrensesetningen 3. (Students) t-fordeling: (anvendelser, bruk av tabell) Bjørn H. Auestad Oppsummering våren 2006 16 / 38

Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Bjørn H. Auestad Oppsummering våren 2006 17 / 38 Estimering. Målemodellen. Konfidensintervall Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall (Punkt)estimering Målemodellen (Punkt)estimering i målemodellen (Intervallestimering) Konfidensintervall estimering og konfidensintervall i ulike situasjoner (modeller); jf. oversikt... Bjørn H. Auestad Oppsummering våren 2006 18 / 38

Estimering. Målemodellen. Konfidensintervall Begrep: estimator (tilfeldig variabel, θ) estimat (utfall (verdi) av θ) Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall fortolkning av statistisk usikkerhet (jf.: fordeling til estimator) standardfeil: SD( θ); forventningsretthet: E( θ) =θ best estimator Bjørn H. Auestad Oppsummering våren 2006 19 / 38 Estimering i binomisk modell Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Modell: Y B(n, p); (ukjent) parameter: p Estimator: p = Y n Standardfeil: SD( p) = p(1 p) n Estimator av standardfeil: ŜD( p) = p(1 p) n Bjørn H. Auestad Oppsummering våren 2006 20 / 38

Estimering i målemodellen Modell: X 1,...,X n er n uif. tilf.var. med E(X i )=μ og Var(X i )=σ 2. (ukjente) parametere: μ, σ 2 Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Estimator for μ: μ = X Standardfeil: SD( μ) = σ 2 n Estimator av standardfeil: ŜD( μ) = S 2 n Estimator av σ 2 : σ 2 = S 2 = 1 n n 1 i=1 (X i X) 2 Bjørn H. Auestad Oppsummering våren 2006 21 / 38 Estimering i Poissonmodellen Modell: Y Poisson(λt); (ukjent) parameter: λ Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Estimator: λ = Y t ( λt = Y er estimator for λt.) Standardfeil: SD( λ) = λ t Estimator av standardfeil: ŜD( λ) = λ t Bjørn H. Auestad Oppsummering våren 2006 22 / 38

Konfidensintervall Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Generell definisjon av konfidensintervall: Situasjon: Data x 1,...,x n ;utfallav:x 1,...,X n ; n u.i.f. tilfeldige variable Ukjent parameter (i fordelingen til X i ene): θ Dersom L og U (L <U) er to funksjoner av X 1,...,X n,som er slik at: ( ) 1 α = P L θ U, sier vi at det utregnete intervallet (l, u) er et (1 α) 100% konfidensintervall for θ. Typisk: L = θ z α/2 SD( θ), U = θ + z α/2 SD( θ) Bjørn H. Auestad Oppsummering våren 2006 23 / 38 Konfidensintervall Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Obs. 1: (1 α): konfidensgrad Obs. 2: Det utregnete intervallet (l, u): Framkommer når vi setter dataverdiene x 1,...,x n inn i funksjonene L og U. Obs. 3: a) Eventuelt tilnærmede intervall; b) Bytt z α/2 med t n 1,α/2 for t-intervall Obs. 4, fortolkning Strengt tatt: Intervallet (l, u) er konfidensintervallet; Vi kan ikke si: ( ) P l θ u =1 α Bjørn H. Auestad Oppsummering våren 2006 24 / 38

Konfidensintervall Estimering. Målemodellen. Konfidensintervall binomisk modell målemodellen Poissonmodellen Konfidensintervall Målemodell 1; (1 α) 100% konfidensintervall for μ er ) σ (X z 2 α/2 n, X + z σ 2 α/2 n Målemodell 2; tiln. (1 α) 100% konfidensintervall for μ er ) S (X z 2 α/2 n, X + z S 2 α/2 n Binomisk modell; tiln. (1 α) 100% konfidensintervall for p er ( ) p(1 p) p(1 p) p z α/2 n, p + z α/2 n Målemodell 3; (1 α) 100% konfidensintervall for μ er S (X t 2 α/2,n 1 n, X + t α/2,n 1 S 2 n ) Bjørn H. Auestad Oppsummering våren 2006 25 / 38 Bjørn H. Auestad Oppsummering våren 2006 26 / 38

: Trekke konklusjoner på bakgrunn av data med statistisk usikkerhet. : Kp. 6 i null- og alternativhypotese (ensidig / tosidig) teststørrelse (testobservator), nullfordeling kritisk verdi, forkastningsområde signifiaknsnivå styrke, styrkefunksjon p-verdi hypotesetest vs. konfidensintervall Bjørn H. Auestad Oppsummering våren 2006 27 / 38 Eksempel på problemstilling: 10 ph-målinger: 6.00, 5.59, 5.74, 3.43, 5.30, 6.48, 5.15, 4.28, 4.52, 6.20; 3 4 5 6 7 8 9 Gjennomsnitt: 5.27 ph-data Målemodell: målingene oppfattes som utfall av 10 u.i.f. tilfeldigevariable X 1,...,X 10. E(X i )=μ: virkelig ph, ukjent størrelse 5.27 er et estimat av μ med statistisk usikkerhet! Kan vi hevde at μ<6.0?? Bjørn H. Auestad Oppsummering våren 2006 28 / 38

Grunnleggende om tenkingen/statistisk modellering: Dersom den tilfeldige variable X 1 er normalfordelt med forventning 6 og varians 1, har den tettheten: 3 4 5 6 7 8 9 N (6, 1)-tetthet X 1 er en abstrakt størrelse Utfall av X 1 er (konkrete!) tall Bjørn H. Auestad Oppsummering våren 2006 29 / 38 Vi betrakter våre data som utfall av tilfeldige variable (X 1,...,X 10 ). Forventningen, μ, kjenner vi ikke. (Var(X i )=σ 2 =1antas å være riktig, kjent.) Tyder dataene (klart) på at μ<6? 3 4 5 6 7 8 9 Kan datene med rimelighet sees på som utfall av N (6, 1)-tettheten (heltrukket linje)? Eller må vi bruke μ<6 for å få det til å virke rimelig? (Jf. f.eks. tetthet med prikket linje.) Bjørn H. Auestad Oppsummering våren 2006 30 / 38

Spørsmålet besvares ved å teste H 0 : μ =6mot H 1 : μ<6 Vi baserer oss på gjennomsnittsresultatet 5.27 Omfanget av statistisk usikkerhet i estimatet 5.27, gjenspeiles av variansen eller fordelingen til gjennomsnittet av X 1,...,X 10, X. Nullfordeling til X: N (6, 0.1) (Var(X) = σ2 n = 1 10 ) (Normalantakelse og kjent σ 2 =1.) Er 5.27 et rimelig utfall av X dersom μ =6? 4 5 6 7 8 N (6, 0.1) tetthet Bjørn H. Auestad Oppsummering våren 2006 31 / 38 Test (på standardisert form) (m/sign.nivå α) for: H 0 : μ =6 mot H 1 : μ<6 Forkast H 0 dersom X 6 1 10 z α 0 Skisse av N (0, 1)-fordeling og forkastningsområde. i ulike situasjoner (med ulike modeller). Bjørn H. Auestad Oppsummering våren 2006 32 / 38

Begrepene null- og alternativhypotese (ensidig/tosidig) teststørrelse (testobservator), nullfordeling kritisk verdi, forkastningsområde signifiaknsnivå styrke, styrkefunksjon p-verdi hypotesetest vs. konfidensintervall Bjørn H. Auestad Oppsummering våren 2006 33 / 38 Def.: Signifikansnivå til test = P (forkaste H 0 H 0 riktig) Signifikansnivået er sannsynligheten at utfallet faller i forkastningsområdet ved en tilfeldighet (og at vi konkluderer med H 1 ), når i virkelgheten H 0 er riktig. Bjørn H. Auestad Oppsummering våren 2006 34 / 38

Styrke, generell definisjon: Situasjon og modell fastlagt; test ang. parameteren θ Følgende er også fastlagt: H 0 og H 1 Teststørrelse, sign.nivå og forkastningsområde / kritisk verdi Def.: Styrkefunksjonen, γ, er definert ved: γ(θ) =P (forkaste H 0 θ). For en bestemt verdi θ 1 (slik at H 1 er riktig), kalles sannsynligheten γ(θ 1 ) for styrken i alternativet θ 1. Styrke (ev. tilnærmet styrke) kan finnes for alle testene vi har sett på til nå, på tilsvarende måte som i de to foregående eksemplene. Bjørn H. Auestad Oppsummering våren 2006 35 / 38 p-verdi, generelt: Dersom p-verdien er lavere enn fastlagt signifikansnivå, forkastes H 0. (Da har teststørrelsen verdi i forkastningsområdet.) Generell definisjon av p-verdi: Def.: p-verdien til et resultat er sannsynligheten beregnet under H 0 for å få det observerte resultatet eller et som i enda sterkere grad peker i retning av at H 1 er riktig. Bjørn H. Auestad Oppsummering våren 2006 36 / 38

Konfidensintervall vs. test, generelt: La (L, U) være et (ev. tilnærmet) 100(1 α)% konfidensintervall for parameteren θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L, U). Testen har signifikansnivå α (ev. tilnærmet). Veldig god måte å gjennomføre (tosidige) tester på! Obs.: dersom dette blir brukt for ensidig test får vi en annen sammenheng mellom intervallets konfidensgrad og sign.nivået til testen. Bjørn H. Auestad Oppsummering våren 2006 37 / 38 Eksamen fredag 26. mai. Orakeltjeneste Husk å øve jevnlig! Bjørn H. Auestad Oppsummering våren 2006 38 / 38