OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6. a b

Like dokumenter
OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Et lite notat om og rundt normalfordelingen.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Et lite notat om og rundt normalfordelingen.

Kapittel 3: Studieopplegg

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Utvalgsfordelinger (Kapittel 5)

Matematisk induksjon

Binomisk sannsynlighetsfunksjon

ST0202 Statistikk for samfunnsvitere

Fra første forelesning:

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

TMA4240 Statistikk Høst 2016

GeoGebra finner nullpunktene til en innlagt polynomfunksjon f. GeoGebra finner nullpunktene til en innlagt funksjon f i intervallet [1, 8].

UNIVERSITETET I OSLO

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

FØRSTE OBLIGATORISKE OPPGAVE STK1000 HØSTEN 2009

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

MA1102 Grunnkurs i analyse II Vår 2014

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2008

UNIVERSITETET I OSLO

Utvalgsfordelinger (Kapittel 5)

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Lineære likningssystemer og matriser

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Kapittel 9 og 10: Hypotesetesting

Løsningsforslag statistikkeksamen desember 2014

Løsningsforslag til obligatorisk oppgave i ECON 2130

Statistikk og dataanalyse

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO

Gammafordelingen og χ 2 -fordelingen

Løsningsforslag Eksamen S2, høsten 2015 Laget av Tommy O. Sist oppdatert: 25. mai 2017

i x i

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

Seksjon 1.3 Tetthetskurver og normalfordelingen

Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017

ST0202 Statistikk for samfunnsvitere

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Hypotesetesting. mot. mot. mot. ˆ x

Transformasjoner av stokastiske variabler

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252

TMA4240 Statistikk 2014

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

ST0202 Statistikk for samfunnsvitere

Løsning eksamen desember 2016

ST0202 Statistikk for samfunnsvitere

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2015

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Forelesning 3. april, 2017

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

UNIVERSITETET I OSLO

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

STK Oppsummering

TMA4240 Statistikk Høst 2015

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Kap. 5.2: Utvalgsfordelinger for antall og andeler

4 Matriser TMA4110 høsten 2018

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

LØSNINGSFORSLAG ) = Dvs

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Kan micro:biten vår brukes som en terning? Ja, det er faktisk ganske enkelt!

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Emnekode: LGU Emnenavn: Matematikk 2 (5 10), emne 2. Semester: VÅR År: 2016 Eksamenstype: Skriftlig

Avdeling for lærerutdanning. Lineær algebra. for allmennlærerutdanningen. Inger Christin Borge

Hypotesetesting av λ og p. p verdi.

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Medisinsk statistikk Del I høsten 2009:

ECON2130 Kommentarer til oblig

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Oppfriskning av blokk 1 i TMA4240

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

OPPGAVEHEFTE FOR STK1000 KAPITTEL Oppgaver fra Kapittel 1

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Løsningsforslag Eksamen S2, våren 2014 Laget av Tommy O. Sist oppdatert: 1. september 2018 Antall sider: 11

Transkript:

OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6 1. Regneoppgaver til kapittel 5 6 Oppgave 1. Mange som kommer til STK1000 med dårlige erfaringer fra tidligere mattefag er livredd ulikheter, selv om man har syns matte har vært greit, er det mange som ikke husker hvordan regning med ulikheter fungerer. Ulikheter er kjempeviktig å ha god peiling på nå som vi skal jobbe med kondensintervaller, det er derfor viktig at alle klarer denne oppgaven. i. Vi skal se hvorfor man må snu ulikhetstegnet i ulikheter når man ganger med 1 på begge sider. Altså ønsker vi å vise at er det samme som a b a b. Husk at det er lov til å plusse på eller trekke fra samme tall på begge sider av en ulikhet hvorfor er dette sant?. Ved å bare bruke dette vis at a b virkelig er det samme som a b. ii. En annen måte å tenke på forrige punkt er at man kan tegne opp et hvert tall på tallinjen. Når man ganger et tall med 1, speiler man plasseringen til tallet om null. Tegn først opp tallinjen, marker av et tall, dens minus overbevis deg selv om at dette stemmer. Hvorfor viser så dette at a b er det samme som a b? Hint: Tegn opp a, b a, b! Hint: Hvis først hva som skjer hvis a b begge er positive eller begge er negative, så ta hensyn til hva som skjer hvis de er på forskjellig side av null på tallinjen. iii. De to siste punktene viser at a b er det samme som a b. Anta vi så vet at et tall c er slik at b c er det samme som b c. Altså er P a b c. Siden vi fra a b vet at a b, fra b c vet at b c må altså så a b c. En annen måte å skrive dette på er at c b a. På forelesningen gav jeg et 95% usikkerhetsanslag for µ med utgangspunkt i 68, 95, 99.7-prosentsreglen. Da vi regnet oss frem til dette, hadde vi overgangen X n σ µ X n + σ = P X n σ µ X n + σ 1 Gå igjennom denne utregningen en gang til ved hjelp av forklaringen over, overbevis deg selv om at dette virkelig stemmer ved å bruke så mange skritt at du syns hvert skritt er enkelt. Date: 13. november 009. 1

OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6 iv. La oss så repetere skrittene i utregningen som ledet til 95% P X n σ µ X n + σ Dette sier altså at det er ca 95% sannsynlig at tallet µ som er et tall man ikke kjenner, men som er fastsatt, f.eks kan det være tallet 1.5 er i intervallet [ X n σ, X n + σ ] Her er altså grensene på intervallet tilfeldig siden de er beregnet fra observasjonene X 1, X,..., X n som er tilfeldige variable, mens µ er ikke tilfeldig er bare et tall. Vi startet med at vi hadde observasjoner X 1, X,..., X n som alle er uavhengige har samme fordeling. Alle X'ene har samme forventning la oss kalle den µ standardavvik la oss kalle den σ, siden disse er denert ut i fra fordelingen til X'ene. Vi vet så enteøyaktig, hvis observasjonene er normalfordelt eller tilnærmingsvis ellers at X n Nµ, σ n Da sier 68, 95, 99.7-prosentsreglen at det er rundt 95% sannsynlig at X n mellom to standardavvik dvs σ/ n av sin forventning dvs µ. Altså 95% P µ σ X n µ + σ er Vi skal så regne oss frem til konklusjonen vår, nemlig at P µ σ X n µ + σ = P X n σ µ X n + σ Altså har vi fått vekk X n fra midten ryddet den bort til siden heller fått µ alene i midten. Gå frem via følgende skritt: a. Rydd vekk X n fra midten ved å trekke fra X n i alle tre ulikheter. b. Trekk fra µ i alle tre ulikhetene, end opp med venstresiden av likning 1. Tilleggsspørsmål: Hvorfor trekker vi fra ikke plusser? c. Bruk deloppgave iii til å konkludere med at likheten i likning 1 stemmer. Gratulerer, du forstår nå alle delene av utregningen som leder til likheten i likning! v. OBS: følgende punkt er ikke like viktig at alle får til, men passer inn naturlig i oppgaven. Generaliser punkt iii til at hvis man vet at a 1 a a 3 a n, så kan man gange med 1 overalt, få at så a n a n 1 a a 1. Oppgave. På onsdagsforelesningen kk dere oppgitt at hvis er uavhengige, er både X Nµ X, σ X Y Nµ Y, σ Y Z = ax + by

OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6 3 W = cx + d normalfordelte hvis ikke både a b er null hvis ikke c er null. Vi skal i denne oppgaven se hvilkeormalfordeling de har, de som er litt ekstra tøe kan så se på noen interessante konsekvenser av dette resultatet i de to siste punktene til oppgaven. i. Vis at Konkluder med at µ Z = aµ X + bµ Y, µ W = cµ X + d. σ Z = a σ X + b σ Y, σ W = cσ X. Z N aµ X + bµ Y, a σ X + b σ Y W Ncµ X + d, cσ X. ii. Finn a, b, c d-verdier som gjør at både Z W er standard normale uttrykt ved hjelp av µ X, µ Y σ X, σ Y. Obs: det er uendelig mange av dem det holder å nne ett sett verdier, men klarer du å beskrive alle? iii. De to siste punktene av oppgaven er frivillig, telles ikke som eksamenspensum. Anta X 1, X,..., X n alle er Nµ, σ-fordelt er uavhengige. Som vi så i forelesningen, har X n = 1 n Xi fordelingen Nµ, σ/ n. Anta at vi så har en X 0, som så er Nµ, σ-fordelt, så uavhengig av de andre X i 'ene. Vis at fordelingen til n i 1 Q n = X i er N µ 1 i=0 n+1 1, σ 1 3 n+1 1 4 Hint: Husk at n i=0 1 i er en geometrisk sum som det nnes en formel for. iv. Tenk deg nå at n får lov til å vokse vokse, at den går mot uendelig. Hvorfor tyder forrige punkt på at der Z N0, 1? lim PQ n x = P n Z 3 x µ, σ. Minitaboppgave til Kapittel 5 Oppgave 3. Det nnes folk som tror at alt tilfeldig er normalfordelt, det er selvfølgelig feil. Men under visse antagelser, som ofte er tilnærmet oppfylt i virkeligheten, vil summer av observasjoner som kan sees på som tilfeldige være normalfordelt. Dette er kjent som Sentralgrenseteoremet 1. 1 Sentralgrenseteoremet er ofte formulert som at gjennomsnittet 1 n Xi er tilnærmet normalfordelt. Men det er det samme som at summer av variable er normalfordelt, siden 1 n inn i summetegnet. kan ganges

4 OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6 Det er stort sett dette matematiske resultatet vi lener oss på når vi gjør statistiske tester på datasett som faktisk ikke er normalfordelt ; ofte vil betingelsene til Sentralgrenseteoremet være oppfylt, man kan så vise at testene er tilnærmet riktige allikevel! Selv om vi altså ikke kjenner fordelingen til datasettet. Dette er overraskende, slett ikke opplagt; hvorfor skulle summer oppføre seg så annerledes enn hvert av leddene? Man kan, ved hjelp av en del matematikk, vise dette resultatet. Vi, derimot, skal i denne oppgaven se at dette faktisk fungerer ved hjelp av et simuleringsforsøk. Planen for denne oppgaven er som følger. Gjør først følgende to skritt. i. Få Minitab til å generere N = 500 binomiske variable. Hver binomiske variabel er antall suksesser i et forsøk som repeteres n = 0 ganger, hver gang har p = 1/ i sannsynlighet for å resultere i en suksess. F.eks kan vi tenke oss 0 myntkast, at maoterer ned antall kron, f.eks. Altså får vi en tabell med 500 tall mellom 0 0. ii. Ta summen av disse 500 forsøkene, kall denne summen S 1. Repeter så disse to skrittene, la oss si M = 00 ganger, men hvor summen kalles S når man gjør dette andre gang, S 3 når man gjør det tredje gang, osv opp til S 00. Sentralgrenseteoremet sier at S 1, S,..., S 00 er tilnærmet normalfordelt! Når vi har lagd disse S'ene, vil vi altså sjekke Sentralgrenseteoremets noe modige påstand. I uke 13 lærte vi om kvantilplott side 80 i boken, som ser om et datasett avviker fra Normalfordelingen. Derfor setter vi Sentralgrenseteoremet på prøve ved å se på kvantilplottet til S 1, S,..., S 00. Hvis kvantilplottene ser greie ut har vi altså ikke grunn til å tvile på Sentralgrenseteoremets utsagn. Men vi har heller ikke påvist at Sentralgrenseteoremet gjelder i dette tilfellet: vi har bare påvist at vi ikke har motbevist sentralgrenseteoremet. Obs: Denne likken kommer igjen i seksjon 6., som vi har om i neste forelesning, i form av statistiske hypotesetester, det kan derfor være greit å skjønne denne likken først som sist. Minitab kan gjøre dette via de følgende skrittene. i. Gå på Calc Random Data Binomial. Vi har lyst til å lagre hver serie av 500 forsøk kolonnevis, å lage 00 slike kolonner. Dermed vil vi ha Number of rows of data to generate satt til 500, at vi skal lagre dette i 00 kolonner. Videre er Event probability tilsvarende suksesssannsynlighet p Number of trials er n antall myntkast i eksemplet over. Fyll derfor inn 500 for Number of rows of data to generate, 0 for Number of trials 0, 5 for Event probability. Skriv videre inn C1-C00 altså kolonne 1 til 00 i Store in columns. ii. I neste skritt skal vi bruke en kommando som trenger datasettet formatert på en litt annen måte. Dette er litt uheldig, men det ser ut til at de minitabkommandoen vi vil bruke i neste skritt krever at vi må transponere datasettet, som vil si å bytte om rad kolonne-markeringen. Gjør dette via Data Transpose Columns, Sett inn C1-C00 på Transpose the following columns, velg Iew worksheet for Store transpose.

OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6 5 iii. Under det graske brukergrensesnittet, har Minitab så kraftige kommandomuligheter. Vi får nå bruk for å skrive direkte inn en enkel kommando på denne måten. Finn vinduet som heter Sessions, det vil si der hvor f.eks resultatet for summary statistics kommer opp, klikk på det. Gå så på Editor Enable Commands for å skru på disse kommandoverktøyene. Finn så tilbake til Sessions-vinduet. Den forrige kommandoen gjør at vi kan skrive inn mer avanserte kommandoer til Minitab. Skriv deretter rsum c-c501 c50 som betyr at Minitab skal ta radsummen Row sum rsum for hver av kolonnene C, C3,..., C501. Den skal så plassere resultatet i C50, den 50'e kolonnen på regnearket. Den 50'e kolonnen er nå en realisering av S 1, S,..., S 00. Består sentralgrenseteoremet testen? Sjekk dette ved å lage et kvantilplott histram av C50. Lag så et nytt worksheet eksperimenter så med andre verdier av N antall simuleringer, n antall forsøk på det binomiske forsøket p suksessansynligheten for hvert av de n forsøkene. Sentralgrenseteoremet trenger stor N hvis fordelingen til det man summerer er ganske skjev. Når n er liten, p er for nær null eller en, er nettopp den binomiske fordelingen ganske skjev. Men hvor er smertegrensen til Sentralgrenseteoremet? Gjenta oppsettet over, men sett inn følgende n p-verdier: 1. Klarer den seg på n = 10 p = 0.1?. Klarer den seg på n = 5 p = 0.0001? Vi tar ikke med den første kolonnen da Minitab bruker denne til radnummerering.