n 2 +1) hvis n er et partall.



Like dokumenter
TMA4245 Statistikk Eksamen 9. desember 2013

TMA4245 Statistikk Vår 2015

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen 9. desember 2013

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

Mer om utvalgsundersøkelser

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Kapittel 8: Estimering

TMA4240 Statistikk Høst 2009

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Estimering 1 -Punktestimering

TMA4245 Statistikk. Øving nummer b5. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Estimering 1 -Punktestimering

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

TMA4245 Statistikk Eksamen mai 2017

Løsningsforslag ST2301 øving 3

TMA4240 Statistikk Høst 2016

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

11,7 12,4 12,8 12,9 13,3.

ECON240 Statistikk og økonometri

MOT310 Statistiske metoder 1, høsten 2011

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

TMA4240 Statistikk Eksamen desember 2015

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Løsningsforslag til eksamen i STK desember 2010

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Oppgaver fra boka: X 2 X n 1

TMA4240 Statistikk Høst 2015

Statistikk og økonomi, våren 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Løsningsforslag Oppgave 1

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Eksamen REA3028 S2, Våren 2011

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

TMA4240 Statistikk Høst 2016

Hypotesetesting, del 4

TMA4240 Statistikk 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ST1201 Statistiske metoder

UNIVERSITETET I OSLO

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Estimering 2. -Konfidensintervall

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

TMA4240 Statistikk Høst 2015

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Ukeoppgaver i BtG207 Statistikk, uke 4 : Binomisk fordeling. 1

TMA4245 Statistikk. Øving nummer 12, blokk II Løsningsskisse. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Kapittel 7: Noen viktige sannsynlighetsfordelinger

TMA4240/4245 Statistikk 11. august 2012

Eksempeloppgave REA3028 Matematikk S2 Eksempel på eksamen våren 2015 etter ny ordning. Ny eksamensordning. Del 1: 3 timer (uten hjelpemidler)

LØSNING: Eksamen 28. mai 2015

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

TMA4245 Statistikk Eksamen august 2015

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

STK1100 våren 2017 Estimering

Kap. 9: Inferens om én populasjon

2T kapittel 3 Modellering og bevis Utvalgte løsninger oppgavesamlingen

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Lineær regresjonsanalyse (13.4)

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Transkript:

TMA445 Statistikk Vår 04 Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Øvig ummer, blokk II Oppgave Mediae til et datasett, X, er de midterste verdie. Hvis vi har stokastiske (tilfeldige) variabler X, X,..., X og order dem etter størrelse slik at X () < X () <... < X (), så er mediae defiert som X = { X( + ) hvis er et oddetall, ( ) X ( ) + X ( +) hvis er et partall. Når de stokastiske variablee våre er uavhegige og ormalfordelte med forvetigsverdi µ og varias σ, altså X i N(µ, σ ), og vi har at atallet variabler,, er stort, ka vi ata at variase til mediae er Var( X) = 4 ( f(µ) ), der f(x) er sasylighetstetthete til ormalfordelige. a) For dette tilfellet, vis at der gjeomsittet X = i= X i. Var( X) = π Var( X), X er e forvetigsrett estimator for forvetigsverdie µ. Hvorfor foretrekker vi valigvis X framfor X som estimator for µ? Statistisk setralbyrå har data for høydee til malige orske rekrutter til hære hvert år tilbake til 878. I dee oppgave ka du ata at du vet med sikkerhet at høydee til rekruttee i et hvilket som helst år er ormalfordelte. På Terigmoe leir har løytat Muthe fuet et skjema med høydee på 30 rekrutter som ha meer må være fra 84. Papiret er gulet og blekket har falmet e del, me løytate får e av sie åværede rekrutter til å skrive dataee i i et regeark etter beste eve. Figur viser et histogram av disse dataee. b) For dette datasettet, vil mediae X være større e, midre e eller omtret like stor som gjeomsittet X? Ville du ha brukt mediae eller gjeomsittet til å estimere forvetigsverdie µ her? Begru svaret. ov-oppg-b 9. mars 04 Side

7 6 5 Atall 4 3 0 50 60 70 80 90 00 0 0 30 40 50 Høyde (cm) Figur : Høydee til 30 rekrutter, kaskje fra 84. Oppgave I medisi er det yttig å studere vekte til yfødte som fuksjo av deres termialder (gestatioal age eller tid side ufagelse). Data er her termialder x i (uker) og vekt y i (gram) for i =,..., babyer, og = 4. For dette datasettet har vi i= x iy i = 75 667, i= x i = 35 77, i= x i = 95 og i= y i = 7 94. Ata e lieær regresjosmodell: Y i = β 0 + β x i + ɛ i, i =,...,, der ɛ,..., ɛ atas uavhegige og ormalfordelte med forvetig 0 og varias σ. a) Bruk oppsummerige av tallmateriale gitt over til å rege ut estimatee for skjærigspukt og stigigstallet for regresjosmodelle: ˆβ 0 og ˆβ. Vi reger ut et estimat for σ ved s = i= (y i ˆβ 0 ˆβ x i ) = 94. Reg ut et 95 proset kofidesitervall for stigigstallet. b) Bruk data til å fie et 90 proset prediksjositervall for vekte til e yfødt i termiuke 40. Hvor bredt er 90 proset prediksjositervallet for termiuke 4 sammeliget med det vi fat for uke 40? Figur viser et kryssplott av termiuke og vekt. I dette plottet er data delt i i to grupper: gutter og jeter. Det er b = gutter (ummerert til b ) og jeter (ummerert i = b + til ).

3400 300 Weight 3000 800 600 400 Boys Girls 35 36 37 38 39 40 4 4 Gestatioal age Figur : Kryssplott av termiuke og fødselsvekt for gutter og jeter. Vi foreslår følgede modell for data Y i = β b + β x i + ɛ i, i =,..., b. Y i = β g + β x i + ɛ i, i = b +,...,. der vi fortsatt atar at ɛ,..., ɛ er uavhegige og ormalfordelte med forvetig 0 og varias σ. c) Bruk plottet til å forklare hvorfor dee modelle ka være hesiktsmessig. Forklar videre hvilke elemeter av modelle som ka være uøsket. Reg ut miste kvadratsums estimater (eller maximum likelihood estimater) for parametree i modelle, her beevt ved ˆβ b, ˆβg og ˆβ. I tillegg til summee gitt tidligere i oppgave har vi at b i= y i = 36 58, b i= x i = 460, i= b + y i = 34 936 og i= b + x i = 465. Oppgave 3 Teodor jobber i iskioske ved campige dee sommere. Ha udrer seg over fordelige til itekte i kioske, og hvorda de varierer med temperatur. La x i være temperature kl 4 dag i. Vi ser på dee temperature og itekte Y i for i =,..., ulike dager.

Ata e regresjosmodell Y i = β 0 + β x i + ɛ i, for i =,...,, der ɛ,..., ɛ er uavhegige ormalfordelte støyledd med forvetig 0 og varias τ. Det ka vises at e forvetigsrett estimator for β er gitt ved ˆβ = a) Vis at variase til ˆβ er τ i= (x i x). i= Y i(x i x) i= (x i x). La videre ˆβ 0 være e estimator for β 0. Forklar kort hvorfor s = yttig estimator for τ. Hvorfor deler vi her på? i= (Y i ˆβ 0 ˆβ x i ) er e Itekte ka splittes i salg av fløteiskrem og saftis. Vi defierer disse heholdsvis y f i og yi s. Teodor teker at itekte ka variere ulikt som e fuksjo av temperatur og foreslår følgede modell: Y f i = β f 0 + βf x i + ɛ f i, Y s i = β s 0 + β s x i + ɛ s i i =,...,. Her er ɛ f,..., ɛf, ɛ s,..., ɛs uavhegige ormaldelte støyledd med forvetig 0 og varias σ. b) Utled et 90% kofidesitervall for differase i stigigstall β f βs. Reg ut itervallet år Teodor har = 4 dager med data. Det oppgis her at ˆβ f = 70 og ˆβ s = 44. Videre er i= (x i x) = 60.4, 4 i= (Y f i ˆβ f 0 ˆβ f x i) = 7046 og 4 i= (Y i s ˆβ 0 s ˆβ sx i) = 7300. Merk: Totalt er det 4 parametre som estimeres i regresjoslijee. Figur 3 viser residualee etter tilpasig av regressjoslijer for salg av fløteis og saftis de 4 dagee. c) Bruk plottet i figur 3 til å drøfte atakelsee gjort om feilleddee i modelle i pukt b). Fasit. b) mediae er midre e gjeomsittet. a) -465, 5, [69,6] b) [789,348], 690, 73 c) -587, -747, 0. 3. b) [ 3, 588]

4000 3000 cream limoade 000 000 Residuals 0 000 000 3000 4000 0 4 6 8 0 4 Days Figur 3: Estimerte residualer etter tilpasig av regresjoslijer for salg av fløteis og saftis de 4 dagee.