EKSAMEN I EMNE ST1201/ST6201 STATISTISKE METODER Onsdag 5. desember 2007 Tid: 09:00 13:00

Like dokumenter
TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVE I SØK 1002 INNFØRING I MIKROØKONOMISK ANALYSE

Eksamensoppgave i TMA4245 Statistikk

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER STATISTICS FOR ECONOMISTS

EKSAMENSOPPGAVE I SØK3001 ØKONOMETRI I ECONOMETRICS I

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i TMA4240 Statistikk

UNIVERSITETET I OSLO

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i ST0103 Brukerkurs i statistikk

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Slope-Intercept Formula

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE I SØK3001 ØKONOMETRI I ECONOMETRICS I

UNIVERSITETET I OSLO

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamen PSY1010 / PSYC1100 Forskningsmetode I

UNIVERSITETET I OSLO Matematisk Institutt

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE I FAG TKP 4105

Forelesning 8 STK3100/4100

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Eksamensoppgave i GEOG1004 Geografi i praksis Tall, kart og bilder

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i FIN3006 / FIN8606 Anvendt tidsserieøkonometri

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE I BI2034 Samfunnsøkologi EXAMINATION IN: BI Community ecology

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2013

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

UNIVERSITETET I OSLO

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Examination paper for BI2034 Community Ecology and Ecosystems

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMEN I FAG TMA4240 STATISTIKK

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Eksamen i TFY4230 STATISTISK FYSIKK Onsdag 21. desember, :00 19:00

UNIVERSITETET I OSLO

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

EKSAMENSOPPGAVER/ EXAM QUESTIONS: BI3010 Populasjonsgenetikk / Population Genetics

EKSAMEN I TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Oppgave 2. Benytt informasjonen i vedlagte Tabell 1 og 2 (Appendix) og besvar følgende:

EKSAMENSOPPGAVE STA-1001.

TMA4240 Statistikk Høst 2016

HØGSKOLEN I STAVANGER

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Eksamensoppgaver til SOSANT1101. Regional etnografi: jordens folk og kulturelt mangfold. Utsatt skoleeksamen 12. desember 2013 kl.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Besvar tre 3 av følgende fire 4 oppgaver.

UNIVERSITETET I OSLO

Eksamensoppgave i SØK1001 Matematikk for økonomer

Siste seminar: Foreslåtte oppgaver basert på ønsker.

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

HØGSKOLEN I NARVIK - SIVILINGENIØRUTDANNINGEN

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2018

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMEN I TMA4240 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO

i x i

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 Bokmål Faglig kontakt under eksamen: Gunnar Taraldsen 73 59 2641 EKSAMEN I EMNE ST1201/ST6201 STATISTISKE METODER Onsdag 5. desember 2007 Tid: 09:00 13:00 Hjelpemidler: Alle trykte og håndskrevne hjelpemidler tillatt. Alle kalkulatorer tillatt. Sensur er ferdig: 21. desember 2007. Oppgaven består av 28 delpunkter som teller likt i sensuren. Oppgave 1 bør gjøres før Oppgave 2. Oppgave 1 La U 1,..., U n være et tilfeldig utvalg fra en sannsynlighetsfordeling som antas kjent og hvor E U i = 0, Var U i = 1. Anta at observasjonene i et eksperiment er modellert av X 1,..., X n hvor X i = µ + σu i og n > 1. La X og S 2 være empirisk middel og forventningsrett empirisk varians til observasjonene a) Vis at E X i = µ. b) Vis at Var X i = σ 2. c) Fordelingen til W = n(x µ)/s avhenger ikke av modell parametrene (µ, σ 2 ). La w α være slik at P( W > w α ) = α. Utled et konfidensintervall for µ. d) La H 0 : µ = µ 0. Utled en hypotesetest som har eksakt nivå α. e) La U Uniform( 3, 3). Vis at E U = 0 og at Var U = 1. f) Vis at X = µ + σu Uniform(a, b) med a = µ 3σ og b = µ + 3σ.

ST1201/ST6201 Statistiske metoder Side 2 av 3 Oppgave 2 La X 1,..., X n være et tilfeldig utvalg fra den uniforme fordelingen Uniform(a, b) med n > 1. Statistikken T = (T 1, T 2 ) = (X (1), X (n) ) gitt ved minste og største observerte verdi er en komplett og tilstrekkelig statistikk. a) Bevis at T er tilstrekkelig ved faktorisering av rimelighetsfunksjonen L. b) Vis at T er rimelighetsestimatoren for (a, b). c) Vis at estimatorene ˆµ = (T 1 + T 2 )/2 og ˆσ = (T 2 T 1 )/(2 3) er rimelighetsestimatorene for E X 1 og Var X 1. Hint: Oppgave 1 f). d) Det kan vises at ˆµ er forventningsrett og at Var ˆµ = (b a) 2 /[2(n + 1)(n + 2)]. Vis at Var ˆµ Var X ved å beregne Var X. e) Gi et generelt argument for at Var ˆµ Var X uten å beregne variansene som inngår. f) Vis at fordelingen til V = n(ˆµ µ)/ˆσ ikke avhenger av modell parametrene (a, b). g) La v α være slik at P( V > v α ) = α. Finn formler for standard og utvidet feil når ˆµ brukes som estimator for µ. Et eksperiment gir (n, x, s, x (1), x (n) ) = (100, 3.444, 2.498, 1.456, 7.756). h) Estimer µ og beregn standard og utvidet feil ved metodene i Oppgave 1 og 2. Utvidet feil skal beregnes med utgangspunkt i v 5% = 0.53, w 5% = 1.98. i) Diskuter kort fordeler og ulemper med metodene for estimering av µ gitt i Oppgave 1-2. Oppgave 3 Storbonden Otte driver med poteter, og vil undersøke om de tre gjødselproduktene New wave (1), Potato in the sky (2), og Natural earth (3) er likeverdige. Ved å ta stikkprøver ved innhøstingen finnes verdien til en stokastisk variabel X i,j hvor j = 1, 2, 3 er produktnummer og i er nummeret til stikkprøven for det gitte gjødselproduktet. Variabelen selv tilsvarer netto gevinst per kvadratmeter, og har dermed enhet kroner/m 2. a) Formuler en statistisk modell for å undersøke om forskjellen på gjødselproduktene er statistisk signifikant. Ta utgangspunkt i normalfordeling og randomisert blokk design. b) Hva er null hypotesen H 0? c) Gi en beskrivelse av en prosedyre for å utføre en test av hypotesen over.

ST1201/ST6201 Statistiske metoder Side 3 av 3 d) Gi en begrunnelse for at randomisert blokk design er et naturlig valg for storbonden Otte. e) Antagelsen om normalfordeling kan være vanskelig å begrunne. Formuler en alternativ ikke-parametrisk modell. f) Gi en beskrivelse av en prosedyre for å utføre en test av hypotesen over for den alternative modellen. Oppgave 4 Den kvinnelige befolkningen i Norge i årene 1900, 1930, 1960, 2007 var på 1143156, 1435860, 1789949, 2355346 personer (www.ssb.no). Ved bruk av 1900 som nullpunkt og avrunding til millioner finnes i x iy i = 403.12, i x i = 197, i y i = 6.73, i x2 i = 15949. Dette kan brukes i tallarbeidet under. a) Bruk minste kvadrats metode til å finne en rett linje som modell for disse befolkningstallene. b) Tegn grafen til linjen sammen med datapunktene. c) Formuler en statistisk modell som begrunner bruk av minste kvadrats metode. Den mannlige befolkningen i Norge i årene 1900, 1930, 1960, 2007 var på 1074815, 1363853, 1777758, 2325788 personer (www.ssb.no). Dette gir i x iy i = 396.91, i x i = 197, i y i = 6.54, i x2 i = 15949. d) Bruk minste kvadrats metode på disse datapunktene også. e) Tegn linjen og datapunktene i samme figur som for de kvinnelige befolkningstallene. Stigningstallene til de to linjene er ikke like. f) Formuler en null hypotese H 0 som kan brukes til å avgjøre om forskjellen er signifikant. g) Formuler en prosedyre som kan brukes til å utføre en hypotesetest tilsvarende H 0 med et signifikansnivå α = 5%. Det er ikke meningen at du skal utføre denne hypotesetesten nå.

Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 3 Nynorsk Fagleg kontakt under eksamen: Gunnar Taraldsen 73 59 26 41 EKSAMEN I EMNE ST1201/ST6201 STATISTISKE METODER Onsdag 5. desember 2007 Tid: 09:00 13:00 Hjelpemidler: Alle trykte og handskrivne hjelpemiddel tillatne. Alle kalkulatorar tillatne. Sensur er ferdig seinast 21. desember 2007. Oppgåva består av 28 punkt som teller likt i sensuren. Gjer Oppgåve 1 føre Oppgåve 2. Oppgåve 1 La U 1,..., U n vere eit tilfeldig utval frå ein kjent sannsynsfordeling med E U i = 0, Var U i = 1. Anta at observasjonane i et eksperiment er modellert av X 1,..., X n hvor X i = µ + σu i og n > 1. La X og S 2 vere empirisk middel og forventningsrett empirisk varians til observasjonane a) Vis at E X i = µ. b) Vis at Var X i = σ 2. c) Fordelinga til W = n(x µ)/s avhenger ikkje av modell parametrane (µ, σ 2 ). La w α være slik at P( W > w α ) = α. Utlei et konfidensintervall for µ. d) La H 0 : µ = µ 0. Utlei ein hypotesetest som har eksakt nivå α. e) La U Uniform( 3, 3). Vis at E U = 0 og at Var U = 1. f) Vis at X = µ + σu Uniform(a, b) med a = µ 3σ og b = µ + 3σ.

ST1201/ST6201 Statistiske metoder Side 2 av 3 Oppgåve 2 La X 1,..., X n være et tilfeldig utval frå den uniforme fordelinga Uniform(a, b) med n > 1. Statistikken T = (T 1, T 2 ) = (X (1), X (n) ) gitt ved minste og største observerte verdi er ein komplett og tilstrekkelig statistikk. a) Bevis at T er tilstrekkelig ved faktorisering av rimeleghetsfunksjonen L. b) Vis at T er rimeleghetsestimatoren for (a, b). c) Vis at estimatorene ˆµ = (T 1 + T 2 )/2 og ˆσ = (T 2 T 1 )/(2 3) er rimeleghetsestimatorene for E X 1 og Var X 1. Hint: Oppgåve 1 f). d) Det kan vises at ˆµ er forventningsrett og at Var ˆµ = (b a) 2 /[2(n + 1)(n + 2)]. Vis at Var ˆµ Var X ved å berekne Var X. e) Gi et generelt argument for at Var ˆµ Var X utan å berekne variansane som inngår. f) Vis at fordelinga til V = n(ˆµ µ)/ˆσ ikkje avhenger av modell parametrane (a, b). g) La v α være slik at P( V > v α ) = α. Finn formlar for standard og utvida feil når ˆµ brukast som estimator for µ. Et eksperiment gir (n, x, s, x (1), x (n) ) = (100, 3.444, 2.498, 1.456, 7.756). h) Estimer µ og berekn standard og utvida feil ved metodane i Oppgåve 1 og 2. Utvida feil skal bereknas med utgangspunkt i v 5% = 0.53, w 5% = 1.98. i) Diskuter kort fordeler og ulemper med metodane for estimering av µ gitt i Oppgåve 1-2. Oppgåve 3 Storbonden Otte driver med poteter, og vil undersøke om de tre gjødselprodukta New wave (1), Potato in the sky (2), og Natural earth (3) er likeverdige. Ved å ta stikkprøver ved innhøstinga finnes verdien til ein stokastisk variabel X i,j der j = 1, 2, 3 er produktnummer og i er nummeret til stikkprøven for det gitte gjødselproduktet. Variabelen sjølv tilsvarer netto gevinst per kvadratmeter, og har dermed eining kroner/m 2. a) Formuler ein statistisk modell for å undersøke om forskjellen på gjødselprodukta er statistisk signifikant. Ta utgangspunkt i normalfordeling og randomisert blokk design. b) Hva er null hypotesen H 0? c) Gi ein skildring av ein prosedyre for å utføre ein test av hypotesen over.

ST1201/ST6201 Statistiske metoder Side 3 av 3 d) Gi ein grunn for at randomisert blokk design er et naturlig val for storbonden Otte. e) Trua om normalfordeling kan være vanskelig å grunngje. Formuler ein alternativ ikkjeparametrisk modell. f) Gi ein beskriving av ein prosedyre for å utføre ein test av hypotesen over for den alternative modellen. Oppgåve 4 Den kvinnelige befolkninga i Noreg i årene 1900, 1930, 1960, 2007 var på 1143156, 1435860, 1789949, 2355346 personar (www.ssb.no). Ved bruk av 1900 som nullpunkt og avrunding til millionar finnes i x iy i = 403.12, i x i = 197, i y i = 6.73, i x2 i = 15949. Dette kan brukast i tall arbeidet under. a) Bruk minste kvadrats metode til å finne ein rett linje som modell for disse befolkningstala. b) Teikn grafen til linja saman med data punkta. c) Formuler ein statistisk modell som grunngje bruk av minste kvadrats metode. Den mannlige befolkninga i Noreg i årene 1900, 1930, 1960, 2007 var på 1074815, 1363853, 1777758, 2325788 personar (www.ssb.no). Dette gir i x iy i = 396.91, i x i = 197, i y i = 6.54, i x2 i = 15949. d) Bruk minste kvadrats metode på disse data punkta også. e) Teikn linja og data punkta i same figur som for de kvinnelige befolkningstala. Stigningstala til de to linjene er ikkje like. f) Formuler ein null hypotese H 0 som kan brukast til å avgjøre om forskjellen er signifikant. g) Formuler ein prosedyre som kan brukast til å utføre ein hypotesetest tilsvarande H 0 med et signifikansnivå α = 5%. Det er ikkje meiningen at du skal utføre denne hypotesetesten nå.

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 English Contact during exam: Gunnar Taraldsen 73 59 26 41 EXAM IN ST1201/ST6201 STATISTICAL METHODS Wednesday December 5th 2007 Time: 09:00 13:00 Aids: All kinds of typed material and hand written notes are allowed. All calculators allowed. Grading finished: December 21th 2007. The exam has 28 parts which have equal weight in the grading. Oppgave 1 should be done before Oppgave 2. Oppgave 1 Let U 1,..., U n be a random sample from a probability distribution which is assumed known and where E U i = 0, Var U i = 1, and n > 1. Let X 1,..., X n represent the observations in an experiment, where X i = µ + σu i. As usual X and S 2 denote the empirical mean and unbiased empirical variance of the observations. a) Show that E X i = µ. b) Show that Var X i = σ 2. c) The distribution of W = n(x µ)/s do not depend on µ and σ 2. Let w α be such that P( W > w α ) = α. Derive a formula for a confidence interval for µ. d) Let H 0 : µ = µ 0. Derive a test with exact level α. e) Let U Uniform( 3, 3). Show that E U = 0 and Var U = 1. f) Show that X = µ + σu Uniform(a, b) with a = µ 3σ and b = µ + 3σ.

ST1201/ST6201 Statistical methods Side 2 av 3 Oppgave 2 Let X 1,..., X n be a random sample from the uniform distribution Uniform(a, b) with n > 1. The statistic T = (T 1, T 2 ) = (X (1), X (n) ) given by the smallest and the largest observation is complete and sufficient. a) Prove that T is sufficient by factorization of the likelihood L. b) Show that T is the maximum likelihood estimator for (a, b). c) Prove that the estimators ˆµ = (T 1 + T 2 )/2 and ˆσ = (T 2 T 1 )/(2 3) are the maximum likelihood estimators for E X 1 and Var X 1. Hint: Oppgave 1 f). d) It can be proven that ˆµ is unbiased and that Var ˆµ = (b a) 2 /[2(n + 1)(n + 2)]. Show that Var ˆµ Var X by calculation of Var X. e) Give a general argument which proves Var ˆµ Var X without actual calculation. f) Show that the distribution of V = n(ˆµ µ)/ˆσ is not depending on the parameters a, b. g) Let v α be such that P( V > v α ) = α. Find formulas for the standard error and the expanded error which can be used when ˆµ is used as an estimator for µ. An experiment gives (n, x, s, x (1), x (n) ) = (100, 3.444, 2.498, 1.456, 7.756). h) Estimate µ and calculate the standard error and the expanded error corresponding to the methods in Oppgave 1 and 2 using v 5% = 0.53, w 5% = 1.98. i) Discuss briefly the advantages and disadvantages with the methods given by Oppgave 1 and 2 for the estimation of µ. Oppgave 3 The farmer Otte has a potato field, and wishes to compare the three fertilizer products New wave (1), Potato in the sky (2), and Natural earth (3). Values of the random variable X i,j are obtained by taking random samples during the harvesting. The variable X i,j represents the profit per square meter (kroner/m 2 ), j = 1, 2, 3 indicates the product number, and the index i gives the sample number for the given product. a) Formulate a statistical model which can be used to determine if there are significant differences between the products. Use a randomized block design based on the normal distribution.

ST1201/ST6201 Statistical methods Side 3 av 3 b) Specify and describe the H 0 hypothesis. c) Specify a statistical procedure which can be used to test H 0. d) Give arguments which support the choice of using a randomized block design in this case. e) It can be difficult to justify the assumption which involves the normal distribution. Formulate an alternative non-parametric model. f) Specify a statistical procedure which can be used to test H 0 for the alternative model. Oppgave 4 The female population in Norway for the years 1900, 1930, 1960, 2007 consisted of 1143156, 1435860, 1789949, 2355346 persons (www.ssb.no). The calculations below can be simplified by choosing 1900 as year 0 and by rounding to millions, which give i x iy i = 403.12, i x i = 197, i y i = 6.73, i x2 i = 15949. a) Use the method of least squares to determine a line which models the above population data. b) Plot the graph of the line together with the data points. c) Formulate a statistical model which leads to the use of the method of least squares. The male population in Norway for the years 1900, 1930, 1960, 2007 consisted of 1074815, 1363853, 1777758, 2325788 persons (www.ssb.no). This gives i x iy i = 396.91, i x i = 197, i y i = 6.54, i x2 i = 15949. d) Use the method of least squares on this data set also. e) Plot the graph of the line together with the data points in the figure which contains the female model. The slopes of the two lines are not equal. f) Formulate a hypothesis H 0 which can be used to decide whether the difference between the slopes are significant. g) Specify a statistical procedure which can be used to test H 0 with a level α = 5%. You are not supposed to actually do the test.