TMA4240 Statistikk H2010

Like dokumenter
Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk H2017 [15]

TMA4240 Statistikk H2010

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

TMA4240 Statistikk H2010

Foreleses onsdag 13.oktober, 2010

Kapittel 2: Hendelser

(utarbeidet av Mette Langaas), TMA4245 V2007

TMA4240 Statistikk Høst 2015

Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9

TMA4245 Statistikk Eksamen desember 2016

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

STK Oppsummering

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk H2010

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Eksamen desember 2015

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

TMA4240 Statistikk H2010 (22)

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

TMA4240 Statistikk H2010 (19)

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4240 Statistikk H2010

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk Høst 2016

Kapittel 4.4: Forventning og varians til stokastiske variable

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen august 2014

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

STK Oppsummering

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2018

Om eksamen. Never, never, never give up!

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i TMA4295 Statistisk inferens

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Løsningsforslag oblig 1 STK1110 høsten 2014

Foreleses onsdag 8. september 2010

Om eksamen. Never, never, never give up!

TMA4240 Statistikk 2014

Fasit for tilleggsoppgaver

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

Kap. 6.1: Fordelingen til en observator og stok. simulering

TMA4240 Statistikk Høst 2016

ST0202 Statistikk for samfunnsvitere

i x i

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

TMA4240 Statistikk Høst 2009

Bernoulli forsøksrekke og binomisk fordeling

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk H2015

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Utvalgsfordelinger (Kapittel 5)

Eksamensoppgåve i TMA4240 Statistikk

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Statistikk og dataanalyse

Eksamensoppgave i TMA4245 Statistikk

UNIVERSITETET I OSLO Matematisk Institutt

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kapittel 9 og 10: Hypotesetesting

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Hypotesetest: generell fremgangsmåte

Transkript:

TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010

2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må oppfylle/etterleve visse kvalitetskrav. Bedriften har i en kort periode fått endel retur av defekte komponenter, flere enn tidligere, og er bekymret for at noe kan ha skjedd (dårligere kvalitet av råvarer, endringer i produksjonsprosesen). Bedriften har ikke mulighet til å kvalitetssjekke alle komponenter som produseres (destruktiv testing?). Hva vil du råde bedriften til å gjøre?

3 Statistisk inferens Vi ønsker å si noe generelt om en populasjon basert på et innsamlet tilfeldig utvalg fra populasjonen. Fra innsamling, bearbeiding, analyse og fortolkning av numeriske data og målinger: trekke slutninger utover det man har observert. Bakgrunn: vår kunnskap i sannsynlighetsregning.

4 Tilfeldig utvalg [8.1] DEF 8.1: En populasjon er mengden av observasjoner som vi ønsker å studere, dvs. alle observasjoner det er mulig å gjøre. (Dersom elementene i populasjonen har fordeling f (x), kaller boka det en f (x)-populasjon.) DEF 8.2: En utvalg er en delmengde av en populasjon. Representativt utvalg: elementene som velges ut må ikke bare representere en delmengde av populasjonen som alle har en spesiell egenskap, de må kunne være representanter for hele populasjonen. Uendelig populasjon: vi skal jobbe som om populasjonen vår er uendelig stor!

5 U.i.f DEF 8.3: La X 1, X 2,..., X n være n uavhengige stokastiske variable, hver med den samme sannsynlighetsfordeling f (x). Vi definerer at X 1, X 2,..., X n er et tilfeldig utvalg av størrelse n fra f (x)-populasjonen og skriver den simultane sannsynlighetsfordelingen som f (x 1, x 2,..., x n ) = f (x 1 )f (x 2 ) f (x n ) U.i.f: et tilfeldig utvalg (som over) blir da et sett med uavhengige identisk fordelte (u.i.f.) observasjoner.

6 Estimering og hypotesetesting Fenomen Defekte produkter i industriell prosess Mengden melk i melkekartong Hva vil vi vite? ESTIMERING: Hva er andelen defekte? HYPOTESETESTING: Er det 1 liter melk i en 1 liters melkekartong? Populasjon Alle produkter i prosessen. Alle melkekartonger levert. Utføre eksperiment Samler inn data uavhengig, representativt? Stokastisk variabel med fordeling Vi får: Undersøke produkt, er det defekt eller ikke? Sjekker n artikler og lar X være antall defekte. Vi finner x defekte. X er binomisk fordelt med n forsøk og ukjent sannsynlighet for defekt p. Finne beste anslag for p og et intervall der vi har stor tillit til at p ligger (konfidensintervall). Undersøke melkekartong, hvor mye melk inneholder den? Sjekker n melkekartonger, måler for hver melkekartong X= mengden melk. X er normalfordelt med ukjent forventning µ og ukjent varians σ 2. Finne beste anslag av µ og σ 2, og bruke anslagene (med grad av tillit) til å si hvor sikre vi er på at det er 1 liter melk i melkekartongen.

7 Estimering Mål: finne sannheten om et fenomen i en populasjon. Sannheten knytter vi til en ukjent parameter, θ, i en valgt fordeling. Vi trekker et tilfeldig utvalg fra populasjonen; X 1, X 2,..., X n (u.i.f.). En estimator gir et anslag for den ukjente parameteren og er en funksjon av stokastiske variabler, ˆθ = ˆθ(X 1, X 2,..., X n ). Hvilke egenskaper bør en god estimator ha? Estimatoren bør være forventningsrett, dvs. E(ˆθ) = θ. Estimatoren bør ha minst mulig varians, Var(ˆθ), og variansen bør avta når antall observasjoner, n, øker. Hvordan kan vi finne estimatorer? ved intuisjon, ved matematisk metode. Sannsynlighetsmaksimeringsestimatoren (SME) finner det anslaget som gjør at de observasjonene vi har gjort (utvalget) har maksimal rimelighet!

8 Forventingsrett estimator DEF 9.1: En observator θ er en forventningsrett estimator for parameteren θ hvis E( θ) = θ.

9 E(S 2 ) (se også læreboka) (X i X) 2 = = = = (X i µ + µ X) 2 = [(X i µ) ( X µ)] 2 (X i µ) 2 2( X µ) (X i µ) + n( X µ) 2 (X i µ) 2 2( X µ)n( X µ) + n( X µ) 2 (X i µ) 2 n( X µ) 2 E(S 2 ) = 1 E[ (X i X) 2 ] = 1 n 1 n 1 {E[ (X i µ) 2 ] E[n( X µ) 2 ]} = 1 n 1 [ Var(X i ) nvar( X)] = 1 n 1 [ σ 2 n σ2 n ] = 1 n 1 (nσ2 σ 2 ) = σ 2

10 Mest effektive estimator DEF 9.2: Hvis vi ser på alle mulige forventningsrette estimatorene for en parameter θ, kaller vi den med minst varians for den mest effektive estimatoren til θ.

11 Eksamen, juni 2004, 1c Et av spørsmålene som regnes å være av delvis sensitiv natur er hvor gammel er du?. En gruppe på n personer ble stilt dette spørsmålet, deretter ble svarene registrert og sammenlignet med informasjon i offentlige registre. La X være en stokastisk variabel som angir antall personer som lyver blant n personer, og la p være sannsynligheten for at en person lyver. Under hvilke antagelser vil X være binomisk fordelt? Vi antar nå at p er ukjent. For å estimere p er det foreslått to estimatorer, ˆp = X og p = X n n 1. Finn forventningsverdi og varians til hver av estimatorene ˆp og p. Hvilke to egenskaper kjennetegner en god estimator? Hvilken av estimatorene ˆp og p vil du foretrekke? Begrunn svaret.

12 SME [9.15] DEF 9.6: Gitt uavhengige observasjoner x 1, x 2,..., x n fra en sannsynlighetstetthet (i det kontinuerlige tilfellet) eller en punktsannsynlighet (i det diskrete tilfellet) f (x; θ). Da er sannsynlighetsmaksimeringsestimatoren (SME) for θ verdien som maksimerer rimelighetsfunksjonen L(x 1, x 2,..., x n, θ) = f (x 1 ; θ) f (x 2 ; θ) f (x n ; θ).