ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Like dokumenter
ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

STK Oppsummering

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

statistikk, våren 2011

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

DEL 1 GRUNNLEGGENDE STATISTIKK

Fasit for tilleggsoppgaver

Kp. 9.8 Forskjell mellom to forventninger

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Statistikk og dataanalyse

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

TMA4245 Statistikk Eksamen desember 2016

Kapittel 2: Hendelser

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ST0202 Statistikk for samfunnsvitere

FORMELSAMLING TIL STK1100 OG STK1110

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

HØGSKOLEN I STAVANGER

TMA4240 Statistikk H2010 (20)

Betinget sannsynlighet

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

ÅMA110 Sannsynlighetsregning med statistikk, våren Grunnbegrep. Grunnbegrep, sannsynligheten for et utfall

TMA4240 Statistikk Høst 2015

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Oppfriskning av blokk 1 i TMA4240

Formelsamling i medisinsk statistikk

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk Høst 2009

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

TMA4240 Statistikk Høst 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Løsningsforslag statistikkeksamen desember 2014

ÅMA110 Sannsynlighetsregning med statistikk (5sp), våren 2012 BMF100 Sannsynlighetsregning og statistikk 1 (10sp), våren 2012

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Kapittel 3: Studieopplegg

TMA4240 Statistikk Høst 2007

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

Løsning eksamen desember 2016

Kapittel 4.4: Forventning og varians til stokastiske variable

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

TMA4240 Statistikk H2010

Kap. 6, Kontinuerlege Sannsynsfordelingar

Innhold. Innledning. Del I

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Løsning eksamen desember 2017

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

TMA4240 Statistikk H2010 (22)

STK Oppsummering

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

Hypotesetest: generell fremgangsmåte

Høgskoleni østfold EKSAMEN

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Kap. 6, Kontinuerlege Sannsynsfordelingar

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

Om eksamen. Never, never, never give up!

Kapittel 10: Hypotesetesting

Innhold. Innledning. Del I

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Econ 2130 uke 16 (HG)

Kap. 6, Kontinuerlege Sannsynsfordelingar

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Løsningsforslag til oppgaver brukt i STA100

ST0202 Statistikk for samfunnsvitere

STK1100 våren 2019 Mere om konfidensintevaller

Bernoulli forsøksrekke og binomisk fordeling

TMA4240 Statistikk Eksamen desember 2015

Transkript:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren 2010 1 / 50

Oversikt over delene i Bjørn H. Auestad Oppsummering våren 2010 2 / 50

Oversikt over delene i Kp. 1: Kp. 2, 3, 4: Sannsynlighetsregning (sannsynlighetsteori) Kp. 5: konfidensintervall Kp. 6: Bjørn H. Auestad Oppsummering våren 2010 3 / 50

Beskrivende statistikk Bjørn H. Auestad Oppsummering våren 2010 4 / 50

Beskrivende statistikk Vi studerer data og er vanligvis interessert i: sentrum/belilggenhet til dataene spredning til dataene Grafiske metoder: Histogram, relativfrekvenshistogram...... ikke gjør dette (enkle) feil! Prikkdiagram (boksdiagram) Bjørn H. Auestad Oppsummering våren 2010 5 / 50

Beskrivende statistikk Numeriske mål (data: x 1,...,x n ): (relativ)frekvensfordeling (i tabell, f.eks.) klasse (intervall) 1 2 g frekvens n 1 n 2 n g n rel.frekv. 1 n 2 n n n g n Gjennomsnitt, empirisk median, empirisk prosentil empirisk varians (s 2 = 1 n n 1 i=1 (x i x) 2 ) og 1 emp. standardavvik (s = n n 1 i=1 (x i x) 2 ), variasjonsbredde, kvartilbredde Summasjon n a i = a m +a m+1 + +a n i=m Bjørn H. Auestad Oppsummering våren 2010 6 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Bjørn H. Auestad Oppsummering våren 2010 7 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Grunnleggende definisjoner (stokastisk forsøk, (enkelt)utfall, utfallsrom: Ω, sannsynligheter, relativfrekvenser, begivenheter) Sannsynlighetsmodell: Ω = {u 1,u 2,...}; P(u i ) = p i, i = 1,2,... Uniform sannsynlighetsmodell: Ω = {u 1,u 2,...,u k }; P(u i ) = p i = 1 k, i = 1,2,...,k Gyldig modell? realistisk modell?? Bjørn H. Auestad Oppsummering våren 2010 8 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Operasjoner med begivenheter: Venndiagram; Union, snitt, komplement; disjunkte begivenheter Operasjon Skrivemåte Inntreffer Unionen mellom A og B A B A eller B inntreffer Snittet mellom A og B A B, AB A og B inntreffer Komplementet til A A C, A A ikke inntreffer Vi sier at A og B er disjunkte dersom A B = φ (ingen felles utfall). Regneregler for sannsynligheter: komplementsetningen (P(A) = 1 P(A)), addisjonssetningen (P(A B) = P(A)+P(B) P(A B)) Bjørn H. Auestad Oppsummering våren 2010 9 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Kombinatorikk: Opptellingsregler: Produktregelen: m 1 m 2, permutasjonsregelen: (N) s,(n) N = N! ( ) N utvalgsregelen: = (N) s s s! ; ikke-ordnede utvalg uten tilbakelegging (det er kun denne situasjonen vi ser på), tilfeldig utvalg Bjørn H. Auestad Oppsummering våren 2010 10 / 50

Grunnleggende sannsynlighetsteori (kp. 2) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Betinget sannsynlighet: P(A B) = P(A B) P(B) Multiplikasjonssetningen for sannsynligheter: P(A B) = P(A B)P(B) Statistisk uavhengighet; P(A B) = P(A) (Ekvivalent med: P(A B) = P(A)P(B)) Setning om total sannsynlighet (forenklet): P(A) = P(A B)P(B)+P(A B)P(B) Bjørn H. Auestad Oppsummering våren 2010 11 / 50

Grunnleggende sannsynlighetsteori (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Tilfeldig variabel, sannsynlighetsfordeling (diskret, kontinuerlig) Tilfeldig variabel: abstrakt størrelse Tilf.var. og data betraktet som utfall av tilf.var. (eks. terningkast; viktig for forståelse av statistisk modellering) Forventning; Varians/standardavvik Regneregler... E(a 1 X 1 + +a n X n ) = a 1 E(X 1 )+ +a n E(X n ) Var(a 1 X 1 + +a n X n ) = a 2 1 Var(X 1)+ +a 2 nvar(x n ), når X i ene er ukorrelerte (alle parvise kovarianser er null). Bjørn H. Auestad Oppsummering våren 2010 12 / 50

Grunnleggende sannsynlighetsteori (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Generelt: Var(X +Y) = Var(X)+Var(Y)+2Cov(X,Y) { (X )( ) } Kovarians: Cov(X,Y) = E µx Y µy Korrelasjon: Corr(X,Y) = Cov(X,Y) SD(X)SD(Y) Uavhengige tilfeldige variable; uavhengighet og korrelasjon Bjørn H. Auestad Oppsummering våren 2010 13 / 50

Viktige (diskrete) sannsynlighetsfordelinger (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Binomisk modell: (Binomisk forsøksrekke, utledning av binomiske sannsynligheter, beregninger, bruk av tabell; Utledning av forventning og varians) Hypergeometrisk modell: (Definisjon, forventning og varians, beregne sannsynligheter, binomisk tilnærming) Geometrisk modell: (definisjon, forventning og varians, beregne sannsynligheter) Poissonmodell: (definisjon, forventning og varians, beregne sannsynligheter, tabellbruk) Bjørn H. Auestad Oppsummering våren 2010 14 / 50

Viktige (diskrete) sannsynlighetsfordelinger (kp. 3) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Det er viktig å kunne gjenkjenne hvilken situasjon som passer til hvilken modell. Binomisk modell: X = antall sukesser i n delforsøk (i en binomisk forsøksrekke). Hypergeometrisk modell: X = antall defekte i et utvalg fra en populasjon av defekte og ikkedefekte. Geometrisk modell: X = antall forsøk til første suksess (forsøk som i en binomisk forsøksrekke). Poissonmodell: X = antall ganger en bestemt begivenhet inntreffer i et tidsrom, på et areal eller i et volum. Bjørn H. Auestad Oppsummering våren 2010 15 / 50

Viktige (kontinuerlige) sannsynlighetsfordelinger (kp. 4) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) Kontinuerlige sannsynlighetsfordelinger generelt: Sannsynlighetstetthet Sannsynliget: areal under tetthetskurve: Dersom X har tettheten f(x), så P(a < X < b) = b a f(x)dx Definisjon av forventning og varians Bjørn H. Auestad Oppsummering våren 2010 16 / 50

Viktige (kontinuerlige) sannsynlighetsfordelinger (kp. 4) Grunnleggende sannsynlighetsteori (kp. 2) Viktige sannsynlighetsfordelinger (kp. 3) 1. Eksponesialfordelingen: (Definisjon, forventning og varians, spesielle egenskaper, beregne sannsynligheter) 2. Normalfordelingen: (Definisjon, forventning og varians, spesielle egenskaper, beregne sannsynligheter) anvendelser, beregne sannsynligheter (standardisering og bruk av N(0,1)-tabell) to setninger; 1) a+bx, 2) X 1 +X 2 Normaltilnærming til binomisk fordeling Sentralgrensesetningen 3. (Students) t-fordeling: (anvendelser, bruk av tabell) Bjørn H. Auestad Oppsummering våren 2010 17 / 50

Estimering Konfidensintervall Bjørn H. Auestad Oppsummering våren 2010 18 / 50

Estimering. Målemodellen. Konfidensintervall (kp. Estimering Konfidensintervall Oversikt: (Punkt)estimering Målemodellen (Punkt)estimering i målemodellen (Intervallestimering) Konfidensintervall estimering og konfidensintervall i ulike situasjoner (modeller); jf. oversikt... Bjørn H. Auestad Oppsummering våren 2010 19 / 50

Estimering. Målemodellen. Konfidensintervall (kp. Estimering Konfidensintervall Begrep: estimator (tilfeldig variabel, θ) estimat (utfall (verdi) av θ) fortolkning av statistisk usikkerhet (jf.: fordeling til estimator) standardfeil: SD( θ); forventningsretthet: E( θ) = θ best estimator Bjørn H. Auestad Oppsummering våren 2010 20 / 50

Estimering i binomisk modell Estimering Konfidensintervall Modell: Y B(n, p); (ukjent) parameter: p Estimator: p = Y n Standardfeil: SD( p) = p(1 p) n Estimator av standardfeil: ŜD( p) = p(1 p) n Bjørn H. Auestad Oppsummering våren 2010 21 / 50

Estimering i målemodellen Estimering Konfidensintervall Modell: X 1,...,X n er n uif. tilf.var. med E(X i ) = µ og Var(X i ) = σ 2. (ukjente) parametere: µ, σ 2 Estimator for µ: µ = X Standardfeil: SD( µ) = σ 2 n Estimator av standardfeil: ŜD( µ) = S 2 n Estimator av σ 2 : σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Oppsummering våren 2010 22 / 50

Estimering i Poissonmodellen Modell: Y Poisson(λt); (ukjent) parameter: λ Estimering Konfidensintervall Estimator: λ = Y t ( λt = Y er estimator for λt.) Standardfeil: SD( λ) = λ t Estimator av standardfeil: ŜD( λ) = λ t Bjørn H. Auestad Oppsummering våren 2010 23 / 50

Konfidensintervall Estimering Konfidensintervall Generell definisjon av konfidensintervall: Situasjon: Data x 1,...,x n ; utfall av : X 1,...,X n ; n u.i.f. tilfeldige variable Ukjent parameter (i fordelingen til X i ene): θ Dersom L og U (L < U) er to funksjoner av X 1,...,X n, som er slik at: ( ) 1 α = P L θ U, sier vi at det utregnete intervallet (l, u) er et (1 α) 100% konfidensintervall for θ. Typisk: L = θ z α/2 SD( θ), U = θ +z α/2 SD( θ) Bjørn H. Auestad Oppsummering våren 2010 24 / 50

Konfidensintervall Estimering Konfidensintervall Obs. 1: (1 α): konfidensgrad Obs. 2: Det utregnete intervallet (l, u): Framkommer når vi setter dataverdiene x 1,...,x n inn i funksjonene L og U. Obs. 3: a) Eventuelt tilnærmede intervall (for p i binomisk modell og for µ i målemodellen med n stor og uten normalantakelse); b) Bytt z α/2 med t n 1,α/2 for t-intervall (for µ i målemodellen med normalantakelse, ukjent varians) Obs. 4, fortolkning Strengt tatt: Intervallet (l, u) er konfidensintervallet; ( ) Vi kan ikke si: P l θ u = 1 α Bjørn H. Auestad Oppsummering våren 2010 25 / 50

Konfidensintervall Estimering Konfidensintervall Målemodell 1; (1 α) 100% konfidensintervall for µ er ) σ (X z 2 α/2, X +z σ 2 n α/2 n Målemodell 2; tiln. (1 α) 100% konfidensintervall for µ er ) S (X z 2 α/2, X +z S 2 n α/2 n Binomisk modell; tiln. (1 α) 100% konfidensintervall for p er ( ) p(1 p) p(1 p) p z α/2, p+z n α/2 n Målemodell 3; (1 α) 100% konfidensintervall for µ er S (X t 2 α/2,n 1, X +t n α/2,n 1 S 2 n ) Bjørn H. Auestad Oppsummering våren 2010 26 / 50

Introduksjon Standardtester µ, målemodell, 3 Teori Bjørn H. Auestad Oppsummering våren 2010 27 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori : Trekke konklusjoner på bakgrunn av data med statistisk usikkerhet. Hypotesetesting, Kp. 6 i Begrep: null- og alternativhypotese (ensidig / tosidig) teststørrelse (testobservator), nullfordeling kritisk verdi, forkastningsområde signifiaknsnivå styrke, styrkefunksjon p-verdi hypotesetest vs. konfidensintervall Bjørn H. Auestad Oppsummering våren 2010 28 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Eksempel på problemstilling: 10 ph-målinger: 6.00, 5.59, 5.74, 3.43, 5.30, 6.48, 5.15, 4.28, 4.52, 6.20; Gjennomsnitt: 5.27 3 4 5 6 7 8 9 ph-data Målemodell: målingene oppfattes som utfall av 10 u.i.f. tilfeldigevariable X 1,...,X 10. E(X i ) = µ: virkelig ph, ukjent størrelse 5.27 er et estimat av µ med statistisk usikkerhet! Kan vi hevde at µ < 6.0?? Bjørn H. Auestad Oppsummering våren 2010 29 / 50

Hypotesetesting Vi betrakter våre data som utfall av tilfeldige variable (X 1,...,X 10 ). Forventningen, µ, kjenner vi ikke. (Var(X i ) = σ 2 = 1 antas å være riktig, kjent.) Introduksjon Standardtester µ, målemodell, 3 Teori Tyder dataene (klart) på at µ < 6? 3 4 5 6 7 8 9 Kan datene med rimelighet sees på som utfall av N(6, 1)-tettheten (heltrukket linje)? Eller må vi bruke µ < 6 for å få det til å virke rimelig? (Jf. f.eks. tetthet med prikket linje.) Bjørn H. Auestad Oppsummering våren 2010 30 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Spørsmålet besvares ved å teste H 0 : µ = 6 mot H 1 : µ < 6 Vi baserer oss på gjennomsnittsresultatet 5.27 Omfanget av statistisk usikkerhet i estimatet 5.27, gjenspeiles av variansen eller fordelingen til gjennomsnittet av X 1,...,X 10, X. Nullfordeling til X: N(6, 0.1) (Var(X) = σ2 n = 1 10 ) (Normalantakelse og kjent σ 2 = 1.) Er 5.27 et rimelig utfall av X dersom µ = 6? 4 5 6 7 8 N (6, 0.1) tetthet Bjørn H. Auestad Oppsummering våren 2010 31 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 σ 2 n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 32 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Begrepene null- og alternativhypotese (ensidig/tosidig) teststørrelse (testobservator), nullfordeling kritisk verdi, forkastningsområde signifiaknsnivå styrke, styrkefunksjon p-verdi hypotesetest vs. konfidensintervall Bjørn H. Auestad Oppsummering våren 2010 33 / 50

µ, målemodell, normalantakelse, kjent varians Målemodellen m/normalantakelse og kjent σ 2 : n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n Introduksjon Standardtester µ, målemodell, 3 Teori X i normalfordelt og σ 2 kjent. Bjørn H. Auestad Oppsummering våren 2010 34 / 50

µ, målemodell, normalantakelse, kjent varians Introduksjon Standardtester µ, målemodell, 3 Teori Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 σ 2 n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom 0.5 0.4 X µ 0 σ 2 n Fork.omr.: (z α, ) z α 0.3 0.2 0.1 )( α 0-3 -2-1 0 1 2 3 Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 35 / 50

µ, målemodell, normalantakelse, kjent varians Introduksjon Standardtester µ, målemodell, 3 Teori Tosidig: Vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Teststørrelse: Z = X µ 0 σ 2 n Test (m/sign.nivå α): Forkast H 0 dersom Z z α/2 eller Z z α/2, Nullfordeling: N(0, 1) 0.5 0.4 0.3 Fork.område: 0 (, z α/2 ) (z α/2, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 N(0, 1) tetthet. )( Bjørn H. Auestad Oppsummering våren 2010 36 / 50

µ, målemodell, n stor og tilnærmet normalfordeling Introduksjon Standardtester µ, målemodell, 3 Teori Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n. σ 2 (og µ ) ukjent; (ingen forutsetning om fordeling til X i ene eller om kjent varians) Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Oppsummering våren 2010 37 / 50

µ, målemodell, n stor og tilnærmet normalfordeling Introduksjon Standardtester µ, målemodell, 3 Teori Test (tiln. sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Test (tiln. sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom 0.5 0.4 X µ 0 S 2 n Fork.omr.: (z α, ) z α 0.3 0.2 0.1 )( α 0-3 -2-1 0 1 2 3 Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 38 / 50

µ, målemodell, n stor og tilnærmet normalfordeling Introduksjon Standardtester µ, målemodell, 3 Teori Tosidig: Vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Teststørrelse: Z = X µ 0 S 2 n Test (m/tiln. sign.nivå α): Forkast H 0 dersom Z z α/2 eller Z z α/2, Nullfordeling: N(0, 1), tiln. 0.5 0.4 0.3 Fork.område: 0 (, z α/2 ) (z α/2, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 N(0, 1) tetthet. )( Bjørn H. Auestad Oppsummering våren 2010 39 / 50

p, i binomisk modell; n stor og normaltilnærming Introduksjon Standardtester µ, målemodell, 3 Teori Generelt Situasjon: Binomisk modell (ev. som tilnærming til hypergeom.) Data: antall suksesser av n mulige er registrert. Resultatet betraktes som utfall av den tilfeldige variable Y der Y B(n,p) n og p er slik at fordelingen til Y kan tilnærmes med normalfordelingen. La p = Y n (estimator for p). Bjørn H. Auestad Oppsummering våren 2010 40 / 50

p, i binomisk modell; n stor og normaltilnærming Introduksjon Standardtester µ, målemodell, 3 Teori Test (tiln. sign.nivå α) for: H 0 : p = p 0 mot H 1 : p < p 0 Forkast H 0 dersom p p 0 p 0 (1 p 0 ) n z α Fork.omr.: (, z α ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av N(0, 1)-fordeling og forkastningsområde. Test (tiln. sign.nivå α) for: H 0 : p = p 0 mot H 1 : p > p 0 Forkast H 0 dersom 0.5 0.4 p p 0 p 0 (1 p 0 ) n Fork.omr.: (z α, ) z α 0.3 0.2 0.1 )( α 0-3 -2-1 0 1 2 3 Skisse av N(0, 1)-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 41 / 50

p, i binomisk modell; n stor og normaltilnærming Introduksjon Standardtester µ, målemodell, 3 Teori Tosidig test: Vil teste: H 0 : p = p 0 mot H 1 : p p 0 Teststørrelse: Z = p p 0 p 0 (1 p 0 ) n Test (m/tiln. sign.nivå α): Forkast H 0 dersom Z z α/2 eller Z z α/2, Nullfordeling: N(0, 1), tiln. 0.5 0.4 0.3 Fork.område: 0 (, z α/2 ) (z α/2, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 N(0, 1) tetthet. )( Bjørn H. Auestad Oppsummering våren 2010 42 / 50

Binomisk og Poisson uten normaltilnærming Tester kan også gjennomføres i binomisk- og Poissonmodell uten bruk av normaltilnærming. Se eksempler i forelesningsnotatene Introduksjon Standardtester µ, målemodell, 3 Teori Bjørn H. Auestad Oppsummering våren 2010 43 / 50

µ, målemodell, normalantakelse, ukjent varians, n liten Generelt, t-tester Introduksjon Standardtester µ, målemodell, 3 Teori Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Målemodell 3 Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Oppsummering våren 2010 44 / 50

µ, målemodell, normalantakelse, ukjent varians, n liten. t-test, ensidig. Introduksjon Standardtester µ, målemodell, 3 Teori Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n t α,n 1 Fork.omr.: (, t α,n 1 ) 0.5 0.4 0.3 0.2 0.1 α 0-3 -2-1 0 1 2 3 ) ( Skisse av t-fordeling og forkastningsområde. Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom 0.5 0.4 X µ 0 S 2 n t α,n 1 Fork.omr.: (t α,n 1, ) 0.3 0.2 0.1 0 ) ( α Skisse av t-fordeling og forkastningsområde. Bjørn H. Auestad Oppsummering våren 2010 45 / 50

µ, målemodell, normalantakelse, ukjent varians, n liten. t-test, tosidig. Introduksjon Standardtester µ, målemodell, 3 Teori Generelt; tosidig t-test: Vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Teststørrelse: T = X µ 0 S 2 n Test (m/sign.nivå α): Forkast H 0 dersom T t α/2,n 1 eller T t α/2,n 1, Nullfordeling: t(n 1) 0.5 0.4 0.3 Fork.område: 0 (, t α/2,n 1 ) (t α/2,n 1, ) ) ( 0.2 0.1 α/2 α/2-3 -2-1 0 1 2 3 t tetthet og forkastningsområde. )( Bjørn H. Auestad Oppsummering våren 2010 46 / 50

Hypotesetesting Def.: Signifikansnivå til test = P(forkaste H 0 H 0 riktig) Signifikansnivået er sannsynligheten at utfallet faller i forkastningsområdet ved en tilfeldighet (og at vi konkluderer med H 1 ), når i virkeligheten H 0 er riktig. Introduksjon Standardtester µ, målemodell, 3 Teori Bjørn H. Auestad Oppsummering våren 2010 47 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Styrke, generell definisjon: Situasjon og modell fastlagt; test ang. parameteren θ Følgende er også fastlagt: H 0 og H 1 Teststørrelse, sign.nivå og forkastningsområde / kritisk verdi Def.: Styrkefunksjonen, γ, er definert ved: γ(θ) = P(forkaste H 0 θ). For en bestemt verdi θ 1 (slik at H 1 er riktig), kalles sannsynligheten γ(θ 1 ) for styrken i alternativet θ 1. Styrke (ev. tilnærmet styrke) kan finnes for alle testene vi har sett på til nå, på tilsvarende måte som i de to foregående eksemplene. Se eksempler i forelesningsnotatene Bjørn H. Auestad Oppsummering våren 2010 48 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori p-verdi, generelt: Dersom p-verdien er lavere enn fastlagt signifikansnivå, forkastes H 0. (Da har teststørrelsen verdi i forkastningsområdet.) Generell definisjon av p-verdi: Def.: p-verdien til et resultat er sannsynligheten beregnet under H 0 for å få det observerte resultatet eller et som i enda sterkere grad peker i retning av at H 1 er riktig. Se eksempler i forelesningsnotatene Bjørn H. Auestad Oppsummering våren 2010 49 / 50

Hypotesetesting Introduksjon Standardtester µ, målemodell, 3 Teori Konfidensintervall vs. test, generelt: La (L,U) være et (ev. tilnærmet) 100(1 α)% konfidensintervall for parameteren θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L,U). Testen har signifikansnivå α (ev. tilnærmet). Veldig god måte å gjennomføre (tosidige) tester på! Obs.: dersom dette blir brukt for ensidig test får vi en annen sammenheng mellom intervallets konfidensgrad og sign.nivået til testen. Se eksempler i forelesningsnotatene Bjørn H. Auestad Oppsummering våren 2010 50 / 50