STK1100 våren 2017 Estimering

Like dokumenter
STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

Mer om utvalgsundersøkelser

Estimering 1 -Punktestimering

Estimering 1 -Punktestimering

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Kapittel 8: Estimering

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Statistikk og økonomi, våren 2017

TMA4240 Statistikk Høst 2015

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

MOT310 Statistiske metoder 1, høsten 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Estimering 2. -Konfidensintervall

Oppgaver fra boka: X 2 X n 1

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

MOT310 Statistiske metoder 1, høsten 2012

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

TMA4240 Statistikk Eksamen desember 2015

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

TMA4240 Statistikk Høst 2016

Hypotesetesting, del 4

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Løsningsforslag ST2301 øving 3

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

ECON240 Statistikk og økonometri

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

TMA4245 Statistikk Eksamen august 2015

Løsningsforslag til eksamen i STK desember 2010

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

STK1100 våren 2019 Mere om konfidensintevaller

Kap. 9: Inferens om én populasjon

Kap. 9: Inferens om én populasjon

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Vår 2015

Oversikt over konfidensintervall i Econ 2130

Oversikt over konfidensintervall i Econ 2130

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen 9. desember 2013

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

TMA4240 Statistikk H2010

ST1201 Statistiske metoder

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Populasjon, utvalg og estimering

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

STK1100 våren Konfidensintevaller

Econ 2130 Forelesning uke 11 (HG)

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240 Statistikk 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Kapittel 7: Noen viktige sannsynlighetsfordelinger

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Oversikt over konfidensintervall i Econ 2130

Påliteligheten til en stikkprøve

Løsningsforslag Oppgave 1

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen mai 2017

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

UNIVERSITETET I OSLO

Eksempeloppgave REA3028 Matematikk S2 Eksempel på eksamen våren 2015 etter ny ordning. Ny eksamensordning. Del 1: 3 timer (uten hjelpemidler)

Eksamen S2, Høsten 2013

Transkript:

STK1100 våre 017 Estimerig Svarer til sidee 331-339 i læreboka Ørulf Borga Matematisk istitutt Uiversitetet i Oslo 1

Politisk meigsmålig Spør et tilfeldig utvalg på 1000 persoer hva de ville ha stemt hvis det hadde vært valg 305 ville ha stemt Ap Ap's oppslutig er 305 1000 = 0.305 Hvor sikkert er dette aslaget?

Målig av lugefuksjo Et mål på lugefuksjo er FEV1 (forced expiratory volume i 1 secod). I e studie i Hordalad på 1990-tallet ble FEV1 målt for 164 ikke-røykede, friske me i alder 30-34 år Hvorda ka vi bruke iformasjoe til å fastlegge et «ormalområde» for FEV1 for me i alder 30-34 år? (I praksis vil e også ta hesy til høyde og BMI, me det ser vi bort fra her) 3

The Germa tak problem Uder adre verdeskrig brukte de allierte (blat aet) serieumree for tyske taks til å aslå hvor mage taks tyskeree hadde og hvor stor produksjoe var for ulike måeder. Hvorda ka serieumree gi dee iformasjoe? 4

Statistiske modeller Felles for de tre situasjoee er at vi har data x1, x,..., x for eheter: For meigsmålige er x i =1 hvis perso ummer i ville ha stemt Ap, = 0 ellers For måligee av lugefuksjo er x i FEV1 målige for perso ummer i For taksee er x i serieummeret for de i-te takse de allierte fikk iformasjo om x i 5

På grulag av utvalget, dvs. de observerte x i -ee, øsker vi å få kuskap om de populasjoe observasjoee kommer fra Vi må da ha e modell som agir hvorda de observerte -ee framkommer fra populasjoe x i Vi vil ata at x1, x,..., x er observerte verdier av stokastiske variable X1, X,..., X og at vi kjeer fordelige til de stokastiske variablee (med utak av e eller flere parametere) 6

For meigsmålige vil vi ata at X1, X,..., X er uavhegige og Beroulli-fordelte, dvs P( X = 1) = p og P( X = 0) = 1 p i For måligee av lugefuksjo vil vi ata at X1, X,..., X er uavhegige og N( µσ, ) - fordelte For taksee vil vi ata at X1, X,..., X er et tilfeldig utvalg (ute tilbakeleggig) blat tallee 1,,..., N I alle de tre tilfellee øsker vi å aslå verdie av e eller flere ukjete parametere, dvs p, µ, σ og N i 7

Geerelt vil vi ata at x1, x,..., x er observerte verdier av stokastiske variable X1, X,..., X og at X i -ee har e fordelig som avheger av e parameter θ (det ka være flere parametere, me vi vil fokusere på e om gage) Vi vil aslå verdie til θ (eller estimere verdie som det heter på «statistikerspråket») på grulag av observasjoee våre Til det bruker vi e estimator θ ˆ θ ˆ(,,..., ) = X1 X X På grulag av de observerte x i -ee, får vi estimatet θ ˆ θ ˆ( x, x,..., x ) = 1 8

Beroulli variabler og Biomisk fordelig Ata at X1, X,..., X er uavhegige og Beroullifordelte, dvs P( X = 1) = p og P( X = 0) = 1 i i p Da er = i i= 1 Y X biomisk(, p) E aturlig estimator for p er ˆ= Y p For meigsmålige har vi =1000 og vi observerte y= 305 Vi får dermed estimatet 305 ˆ = y p = 0.305 1000 = 9

E ae estimator for p er * = Y+ p + 4 For meigsmålige gir dee estimatet y+ 307 p* = = = 0.306 + 4 1004 Det er lite forskjell på ˆp og p* her. Forskjelle er større år er midre og y er ær 0 eller Hvorda ka vi avgjøre hvilke estimator som er best? 10

Mea square error (MSE) Vi ser på de geerelle situasjoe der X1, X,..., X har e fordelig som avheger av e parameter θ Vi øsker at estimatore θ ˆ = θ ˆ( X,,..., ) 1 X X skal være ær θ Kokret øsker vi at MSE( θˆ ) = E[( θˆ θ ) ] skal være så lite som mulig Merk at (detaljer på forelesige) MSE( θˆ ) = V ( θˆ ) + [ E( θˆ ) θ] = varias + (skjevhet) 11

Se på situasjoe der Vi har estimatoree Y ˆ= Y p biomisk(, p) og Her er (detaljer på forelesige) MSE( pˆ ) (1 ) = p p * = Y+ p + 4 p(1 p) / 4 p / MSE( p*) = + + 8 + 16 / 1+ 4 / 1

MSE for ˆp («usual») og p* («alterative») = 10 = 100 13

Forvetigsrette estimatorer Vi ser på de geerelle situasjoe med e estimator θ ˆ θ ˆ( X, X,..., X ) for θ = 1 Hvis E( θˆ ) = θ for alle mulige verdier av θ, sier vi at ˆθ er forvetigsrett (egelsk: ubiased) For e forvetigsrett estimator er skjevhete E( θˆ ) θ lik 0, og det følger at MSE( θˆ ) =V ( θˆ ) For de biomiske situasjoe er pˆ= Y e forvetigsrett estimator for p 14

Uavhegige og idetisk fordelte variabler Ata at X1, X,..., X er uavhegige og idetisk fordelte (u.i.f.) med forvetig µ og varias σ Da er ˆµ 1 = X= X i i= 1 e forvetigsrett estimator for µ og V ( µ ˆ) = V ( X ) = σ 15

Videre er (detaljer på forelesige) 1 ( ) S = X 1 i X i = 1 e forvetigsrett estimator for Disse estimatoree er spesielt aktuelle for ormalfordelte data (for adre fordelige ka det være at adre estimatorer er bedre) For FEV1-måligee var x = 4.48 og s = s = 0.60 FEV1-måliger for 30-34 år gamle ikke-røykede, frikse me er (ca.) ormalfordelt med forvetigsverdi 4.48 liter og stadardavvik 0.60 liter 16

Uiform diskret fordelig Ata at X1, X,..., X er et tilfeldig utvalg ute tilbakeleggig blat tallee 1,,..., N, der N er ukjet (jf. «the Germa tak problem») Vi vil fie e forvetigsrett estimator for N La X ( ) = max X i være det største tallet vi observerer Da er (detaljer på forelesige) ( N+ 1) E X ( ) = + 1 og e forvetigsrett estimator for N er ˆ + 1 N= X 1 ( ) 17

Ved å bruke dee formele (samme med diverse ae iformasjo) kue de allierte aslå størrelse av de tyske produksjoe av taks i ulike måeder (og på ulike steder): Ruggles & Brodie (1947). A Empirical Approach to Ecoomic Itelligece i World War II. Joural of the America Statistical Associatio, Vol. 4, pp.7-91 18