Om eksamen. Never, never, never give up!

Like dokumenter
Om eksamen. Never, never, never give up!

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Kap. 8: Utvalsfordelingar og databeskrivelse

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Forslag til endringar

Kapittel 2: Hendelser

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

TMA4245 Statistikk Eksamen desember 2016

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i TMA4240 Statistikk

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Oppfriskning av blokk 1 i TMA4240

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4245 Statistikk Eksamen august 2014

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Kapittel 10: Hypotesetesting

Eksamensoppgåve i TMA4245 Statistikk

TMA4240 Statistikk Eksamen desember 2015

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

HØGSKOLEN I STAVANGER

Løsningsforslag eksamen 27. februar 2004

STK Oppsummering

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

STK Oppsummering

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i TMA4240 Statistikk

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2015

DEL 1 GRUNNLEGGENDE STATISTIKK

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

TMA4240 Statistikk Høst 2007

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Stokastisk variabel. Eksempel augefarge

TMA4240 Statistikk Eksamen desember 2015

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

ÅMA110 Sannsynlighetsregning med statistikk, våren

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Eksamen august 2014

Bernoulli forsøksrekke og binomisk fordeling

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Kapittel 9 og 10: Hypotesetesting

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

UNIVERSITETET I OSLO

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

FORMELSAMLING TIL STK1100 OG STK1110

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2015

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Norske hoppdommere og Janne Ahonen

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Statistikk og dataanalyse

TMA4240 Statistikk 2014

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Høst 2009

Løsningsforslag eksamen 25. november 2003

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

UNIVERSITETET I OSLO

LØSNINGSFORSLAG ) = Dvs

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2016

Utvalgsfordelinger (Kapittel 5)

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kort overblikk over kurset sålangt

TMA4240 Statistikk Høst 2016

i x i

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

ST0202 Statistikk for samfunnsvitere

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Transkript:

Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME)

Om eksamen (Truleg) 10 punkt. Alle punkt tel like mykje. VIKTIG å få til dei lette rett. Gult A5 ark. Lov å skrive på begge sider. Formalsamlinga. Her står det mykje, bli kjent med! Hjelpetimar, endringar i pensum m.m. sjå wikien på Før/Under/Etter Eksamen. Never, never, never give up!

Kap. 11 Enkel lineær regresjon og korrelasjon Enkel lineær regresjon Y i = α + βx i + ɛ i med ɛ i u.i.f. N(0, σ 2 ɛ ) Finne estimatorer / estimere α, β og σ 2 ɛ Hypotesetest / KI for α, β eller σ 2 ɛ Hypotesetest / KI for µ Y0 = E(Y x = x 0 ) Prediksjonsintervall for µ Y0 = E(Y x = x 0 ) I dag: Kor god er modellen? Forklarer forklaringsvariabelen ein stor del av variasjonen? (Tilpassingskoeffisienten R 2 ) Er modellantakelsane rette? (evaluerer v.h.a. plott)

Enkel lineær regresjon Antar ɛ i u.i.f. N(0, σ 2 ) Estimat: a = 30.7, b = 0.84 Y i = α + βx i + ɛ i Y i N(α + βx i, σ 2 )

Enkel lineær regresjon Antar ɛ i u.i.f. N(0, σ 2 ) Y i = α + βx i + ɛ i Y i N(α + βx i, σ 2 ) Estimat: a = 30.7, b = 0.84, R 2 = 0.37

Sigarett - hjertestans Estimat: a = 11.41 og b = 0.0616, R 2 = 0.45

Hogde foreldre-barn: Passar modellen? Plottar residual

TMA4245 Kort versjonen Kurset har tre delar: Deskriptiv statistikk (Kap 1 + litt i Kap 8) Sannsynsteori (Kap 1-7 + notat) Statistikk (Kap 8-11) PS: Dette er ei oppsummering av dei viktigaste begrepa og metodane. Ikkje ein lovnad om kva som kjem og ikkje kjem på eksamen.

Sannsynsfordeling Diskret Paret (x, f (x)) blir kalla sannsynsfordelinga til den diskret stok. var. X dersom 0 f (x) x f (x) = 1 (summen over alle mogelege x) f (x) = P(X = x) Kontinuerleg Funksjonen f (x) definert for alle reelle tal x R blir kalla sannsynsfordelinga til den kontinuerlege stok. var. X dersom 0 f (x) f (x)dx = 1 P(a X b) = b a f (x)dx

Kummulativ sannsynsfordeling Definisjon Den kummulative fordelinlgsfunksjonen F (x) for ein stok. var. X er: F (x) = P(X x) Diskret: F (x) = t x f (t) Kontinuerleg F (x) = x f (t)dt For diskret stokastiske variable er det viktig med < eller, for kontinuerlege stokastiske variable er det likegyldig.

Kap 4. Matematisk forventning Forventningsverdi E(X ) Varians Var(X ) og standardavvik Std(X ) = Var(X ) Vit at kovarians og korrelesjon måler lineær avhengighet Forventning og varians av lineærkombinasjonar

Forventningsverdi Definisjon 4.1 La X vere ein stok.var. med sannsynsfordeling f (x). Forventningsverdien til X er då µ = E(X ) = x xf (x) dersom X er diskret, og µ = E(X ) = dersom X er kontinuerleg. Tolkning: xf (x)dx Gjennomsnitt av uendeleg mange data trukke frå f (x) Massesenteret til fordelinga.

Varians Definisjon 4.3 La X vere ein stok. var. med forventning µ. Variansen til X er då: For diskret X : Var(X ) = E((X µ) 2 ) = x (x µ) 2 f (x) For kontinuerleg X : Var(X ) = E((X µ) 2 ) = (x µ) 2 f (x)dx Tolkning Spredning, Std(X ) = Var(X ) same skala som X. Eigenskap Må vere positiv (eller 0).

Forventning og varians av lineærkombinasjon Teorem, VIKTIG Dersom a 0, a 1,..., a n er konstantar og X 1, X 2,... X n stok. var., så er n n E(a 0 + a i X i ) = a 0 + a i E(X i ) og i=1 i=1 n Var(a 0 + a i X i ) = i=1 n n i 1 ai 2 Var(X i ) + 2 a i a j Cov(X i, X j ) i=1 i=1 j=1 for uavhengige X 1,..., X n er n Var(a 0 + a i X i ) = i=1 n ai 2 Var(X i ) i=1

Kap 5 Diskret sannsynsfordelingar Binomisk fordeling og Bernoulli prosess Hypergeometrisk Geometrisk Poisson fordeling og poissonprosess

Bernoulli prosess og binomisk fordeling Bernoulli prosess 1 n uavhengige forsøk 2 Kvart forsøk resulterer i suksess, I i = 1 eller ikkje-suksess I i = 0. 3 Suksess-sannsynet p = P(I i = 1) er konstant. Binomisk fordeling Ser på antall suksess i ein Bernoulli prosess, X = n i=1 I i. X er då binomisk fordelt; ( ) n P(X = x) = p x (1 p) n x x

Kontinuerlege sannsynsfordelingar Normal fordeling X N(µ, σ 2 ) Kunne rekne i normal fordeling, dvs standardisere (Z = X µ σ Z N(0, 1)) og slå opp i tabell.(eksamen mai 2014, oppgåve 2) Lineær kombinasjon av normal fordelte stok.var. er normal fordelt. Eksponensial fordeling Tid til første hending i Possion prosess er eksponensial fordelt. t-fordeling Kji-kvadrat fordeling.

Kap 7. Funksjonar av stokastiske variable Ein funksjon av stok.var. er sjølv ein stok.var. Transformasjon av ein stok.var. Moment og momentgenererande funksjonar (for den spesielt interesserte/ambisiøse). Lineær kombinasjon av normalfordelte stok.var. er normalfordelt. Lineær kombinasjon av kji-kvadrat er kji-kvadrat.

Notat: Ordningsvariable Skal kunne finne sannsynsfordelinga til minimum (minste av n stokastiske variable) maximum (største av n stokastiske variable) (Eksamen mai 2014, oppgåve 2c)

Statistikk Kap.8: Utvalsfordelingar Kap.9: Estimering og konfidensintervall (KI) Kap.10: Hypotesetesting Kap.11: Enkel lineær regresjon

Utvalsfordelingar Tilfeldig utval Utvalsfordelingar. Utvalsfordelinga til gjennomsnittet X Sentralgrenseteoremet (SGT) Utvalsfordeling for varians normalfordeling, χ 2 n 1 Utvalfordeling for gjennomsnitt normalfordeling og ukjent varians, T n 1

Utvalgsfordelinga til X Algoritme For m = 1 : M Trekk n=216 datapunkt frå N(179.8, 6.5 2 ) m = 1,..., M gongar x m1, x m2,..., x mn. Finn gjennomsnittet x m = 1/n n i=1 x mi Plott histogram for x 1, x 2,..., x M

Dersom X i er normalfordelt, og kjent varians X i N(µ, σ 2 ), for i = 1, 2,... n. Dvs eit utvalg på n. Då er X N(µ, σ 2 /n)

Sentralgrenseteoremet. Fordelinga til gjennomsnittet, X. Sentralgrenseteoremet, teorem 8.2 La X i, i = 1, 2,..., n vere uavhengige identisk fordelte (u.i.f.) stokastiske vaiable med E(X i ) = µ og Var(X i ) = σ 2 < (endeleg varians). La X = 1 n n i=1 X i og Z = X µ. Då σ 2 /n når n. Dette tilsvarer Z N(0, 1) når n. X N(µ, σ2 n ) PS: Gjeld uansett fordeling for X i. PSS: Z = X µ er og ein observator σ 2 /n

Viktige observatorar u.i.f. Dersom X i N(µ, σ 2 ), kjent σ 2 eller pga SGT Z = X µ σ/ n N(0, 1) u.i.f. Dersom X i N(µ, σ 2 ) og S 2 = 1 n n 1 i=1 (X i X ) 2 T = X µ S/ n T n 1 Student-t fordelt med ν = n 1 fridomsgrader. u.i.f. Dersom X i N(µ, σ 2 ) og S 2 = 1 n n 1 i=1 (X i X ) 2 X 2 (n 1)S 2 = χ 2 n 1 Kji-kvadrat fordelt med ν = n 1 fridomsgrader. σ 2

Kap. 9: Estimering Antar fordeling frå kjennskap til fenomenet; X i f (x; θ). Har data x 1, x 2,..., x n Estimerer/ berekner θ frå data v.h.a. ein estimator ˆθ. Kva er ein god estimator (forventningsrett og minst mogeleg varians). Korleis finne ein estimator (SME eller for lineær regresjon MKM) Korleis kvantifisere usikkerheita i estimat (Konfidensintervall) Konfidensintervall: Dersom forsøket blir repetert, vil sann parameter vere i KI i 1 α del av forsøk.

Sannsynsmaksimeringsestimator, SME Finn den verdien for parameteren θ (påske-eksempel θ = p) som gjev høgast sannsyn for å observere dei dataene vi har observert. Korleis 1 Finn likelihoodfunksjonen L(θ; x 1, x 2,..., x n ) = f (x 1, x 2,..., x n ; θ) Sannsynet /sanns.tettheten for våre data. 2 Finn toppunkt av likelihoodfunksjonen: argmaxl(θ; x 1,..., x n ) θ August 2012 oppgåve 3b

Sannsynsmaksimeringsestimator, SME Finn den verdien for parameteren θ (juleferie eksempel θ = p) som gjev høgast sannsyn for å observere dei dataene vi har observert. OPPSKRIFT 1 Finn likelihoodfunksjonen L(θ; x 1, x 2,..., x n ) = f (x 1, x 2,..., x n ; θ) uavh = n i=1 f (x i; θ) 2 Finn toppunkt av likelihoodfunksjonen: Tar ln av L; l(θ; x 1, x 2,..., x n ) = ln(l(θ; x 1, x 2,..., x n )). Reknetriks som nesten alltid blir brukt. L og l har same toppunkt. Deriverer og set lik 0; θ l(θ; x 1, x 2,..., x n ) = 0 Løyser ut for θ = h(x 1, x 2,..., x n ). 3 Estimator: ˆθ = h(x 1, X 2,..., X n ) (stok.var.) Estimat: θ = h(x 1, x 2,..., x n ) (talverdi)

Konfidensintervall Har eit nivå av trygghet for at sann parameter ligg i intervallet. 1 Finn estimator for parameteren vi ønsker å finne KI for. 2 Finn observator der parameter av interesse og estimator inngår: Z = X µ σ/ N(0, 1), n u.i.f. når SGT eller X i N(µ, σ 2 ) T = X µ S/ n t n 1, u.i.f. når X i N(µ, σ 2 ) og S 2 = 1 n n 1 i=1 (X i X ) 2 X 2 = (n 1)S2 σ χ 2 2 n 1, u.i.f. når X i N(µ, σ 2 ) og S 2 = 1 n i=1 (X i X ) 2 n 1 3 Har at (f.eks) P( z α/2 < Z < z α/2 ) = 1 α. 4 Løyser ut for parameter, (f.eks. µ); P( ˆµ L < µ < µ ˆ U ) = 1 α. 5 Konfidensintervall; sett inn for data: [µ L, µ U ]

Hypotesetesting H 0 : Null hypotese. Konservativ. (f.eks. µ = µ 1 H 1 : Alternativ hypotese. Endring. (f.eks. µ < µ 1 ) Moglege beslutningar Forkastar H 0, og aksepterer H 1. Påstand H 1 bevist ved data. Forkaster ikkje H 0. Data underbygger ikkje påstand H 1. Beslutningsfeil Type-I-feil: Forkastar H 0 når H 0 er sann. Testnivå: P(Type-I-feil) = α. Type-II-feil: Forkastar ikkje H 0 når H 1 er sann. Teststyrke: 1 - P(Type-II-feil µ = µ 1 ) = 1 β(µ 1 )

Hypotesetesting Metode p-verdi 1 Antar H 0 er sann. 2 Finn p-verdi: P(vårt estimat eller meir ekstremt H 0 er sann) 3 Forkastar H 0 dersom liten p-verdi (< α). Metode forkastninsområde 1 Antar H 0 er sann. 2 Finn testobservator og område for testobservasjon (evt. estimat) som fører til forkasting. 3 Forkastar H 0 dersom testobservasjon /estimat i forkastningsområdet.

Kap. 11 Enkel lineær regresjon og korrelasjon Enkel lineær regresjon Y i = α + βx i + ɛ i med ɛ i u.i.f. N(0, σ 2 ɛ ) Finne estimatorer / estimere α, β og σ 2 ɛ (for α og β SME eller MKM, for σ 2 SME) Hypotesetest / KI for α, β eller σ 2 ɛ Hypotesetest / KI for µ Y0 x 0 = E(Y x = x 0 ) Prediksjonsintervall for Y 0 x 0 Eksamen Mai 2014 2 c), d) og e)

Estimatorar linær regresjon A = Ȳ B x og A N(α, σ 2 A ) n der σa 2 = i=1 x i 2 n n i=1 (x i x) 2 σ2 ɛ B N(β, σb 2 ) der σb 2 = Var(B) = σɛ 2 n i=1 (x i x) = σ2 ɛ 2 S xx n Sɛ 2 i=1 = (Y i Ŷ i ) 2 n 2 der Ŷ i = A + Bx i og (n 2)S2 σ 2 ɛ χ 2 n 2