A-besvarelse ECON2130- Statstkk 1 vår 2009 Oppgave 1 A) () Antall kke-ordnede utvalg: () P(Arne nummer 1) = () Når 5 er bltt trukket ut, er det tre gjen som kan blr trukket ut tl den sste plassen, altså: B)() Med hypergeometrsk sannsynlghet: P(A): N=8, M=1, X=1, n=6 N=8, M=2, X=2, n=6 () A og/eller B A og B er kke uavhengge, ettersom Dette er også logsk, ettersom sannsynlgheten for B vl endres om man vet at A allerede har nntruffet. Ettersom begge hendelsene A og B kan nntreffe samme forsøk (man regner en loddtreknng av 6 deltagere som et forsøk), er de kke dsjunkte. C)
Antall mulge rekkefølger der A er først og B sst, eller omvendt: Antall rekkefølger totalt: Dermed: Med andre ord ca 6,67% sannsynlghet. Oppgave 2 A)() ford har man først klart 5, så vl den sste følgelg være rktg også. Mao går det kke an å få akkurat 5 rktge. Antall mulge rekkefølger totalt er. Sannsynlgheten for at man får alle rett vl da være: () Forventnngsverd = Sum av (verd sannsynlghet) B) () Gjennomsnttet vl være vår beste gjetnng på forventnngsverden. Dette vl derfor være den naturlge estmatoren for µ. Den er forventnngsrett ford at hvs man øker n, så vl man etter hvert nærme seg den faktske µ. Gjennomsnttet av mange slke estmater vl nærme seg den sanne verden tl µ, etter hvert som man tar flere og flere utvalg. Kan vses matematsk: For Lkheten mellom og forutsetter uavhengg og lk fordelng. () Ettersom n er såpass stor, forutsetter jeg at fordelngen er tlnærmet normalfordelt. Jeg får sprednngsntervallet: C)
Forkast hvs Det betyr at dersom kan man forkaste. Oppgave 3 A) For at utvalget skal være representatvt må skolene som er med undersøkelsen være tlfeldg trukket ut. For eksempel vl det kunne oppstå skjevheter hvs man kun valgte skoler fra ett område av landet. Man kan kke generalsere resultatene med mndre man har et bredt tlfeldg utvalg. Et alternatv tl helt tlfeldg utvalg er stratfserng. Der deler man populasjonen nn grupper eller man tror at andelen p er forskjellg fra gruppe tl gruppe. På denne måten kan man skaffe seg er representatvt utvalg, men dette tlfellet kan man se for seg at det er vanskelg å dele nn slke grupper på forhånd. Hvs forutsetnngene er felaktge kan stratfserng g et dårlgere estmat enn om man foretok er helt tlfeldg utvalg. B) Konfdensntervall for p: Konfdensgraden 0,95 betyr at hvs v gjentok datannsamlngene 100 ganger, kunne v forvente at 95 av observasjonene vlle havne nnenfor ntervallet. NB! Jeg forutsetter at antall skoler der det har vært mobbng, er tlnærmet normalfordelt, ettersom: C) () Sgnfkansnvå: 0,01. Alt.1: Forkast hvs Altså kan man med sgnfkansnvå 0,01 s at mobbngen har økt. () P-verden er mndre enn 0,01. Det stemmer godt overens med de resultatene jeg fant forrge punkt, ettersom p-verden representerer det mnste valget av α-verd som vl lede tl forkastnng av på bakgrunn av de observerte data. Man måtte altså hatt et mye lavere α-nvå for å kunne nærme seg en konklusjon der man beholdt.
() Her kommer man nn på et vanlg problem nnenfor statstkk, nemlg operasjonalserngen av begreper. Her kan man tenke seg at tlstandene skolen egentlg kke har bltt så mye verre, men at flere lkevel rapporterer økt mobbng. Dette kan ha flere forklarnger. Begrepet mobbng har kommet på dagsorden flere steder og er mulgens et ord som flere velger å bruke dag enn for noen år sden. Økt bevsstgjørng rundt mobbng skolen kan ha ført tl at flere rapporterer om mobbng. Spørsmålet blr altså om det tdlgere fantes større mørketall, tall som kke ble regstrert, og at det derfor blr fel å s at det faktsk har bltt mer mobbng. Kanskje kalte man det bare noe annet før? Kommentar tl en A-besvarelse ECON2130, 2009 vår Harald Goldsten 23. aprl 2010 Jeg bruker å basere mtt karakterforslag basert delvs på en prosentevaluerng av hvert delpunktene kombnert med et generelt nntrykk av forståelsesnvået. På oppgave 1 var det ngentng å trekke (100%). Oppg. 2A var bra besvart (100%) I oppgave 2B() går kanddaten helt vannet. For det første er det uheldg at kand. bruker små x -er sn defnsjon av X (burde brukt store X -er). Kurset legger stor vekt på den vktge forskjellen mellom stokastske varable (vanlgvs store bokstaver med unntak av estmatorer) og observerte verder av dem. Det er og for seg kke galt å bruke en lten x for en stokastsk varabel, men da må det presseres eksplstt besvarelsen sden det bryter mot den etablerte symbolbruken kurset. 1 For det andre ser kand. at X ne( x) som nneholder flere alvorlge fel. Den første lkheten n er menngsløs sden x kke er defnert verken oppgaveteksten eller besvarelsen. Den andre lkheten er en skkkelg brøler. Å s at det stokastske gjennomsnttet, X, er lk sn forventnng er helt fel, og, om det hadde vært tlfelle, vlle hele problemstllngen oppgave 2 kollapse og bl tom. Et rktg svar vlle være å forklare forventnngsrettheten av ˆ X smpelthen ved å vse tl regel 4.12 boka som resultatet E( ˆ ) følger drekte fra. Besvarelsen av 2B() er ok. Et lte mnus er at kand. nnfører S for standardavvket tl X uten eksplstt å s (defnere) det besvarelsen. Ltt uheldg symbolbruk sden S ofte brukes for emprske standardavvk - som er noe annet enn populasjonsstandardavvket, 1, som det er snakk om her og som følger av fordelngen tl X (kke data). Som helhet, pga 2B(), vlle jeg gtt en skåre 1/3 (33%) for oppg. 2B. Oppg. 2C ble tlstrekkelg bra besvart (100%).
Oppg. 3A: Første avsntt vrker fornuftg, men ltt vagt og treffer kke poenget helt. Uttrykket bredt tlfeldg utvalg er uklart. Poenget med et representatvt utvalg er deelt sett at det er et rent tlfeldg utvalg betydnngen at alle mulge utvalg populasjonen har samme sjanse for å bl trukket ut. Om prakss dette kke helt er oppfylt, men man lkevel kan argumentere for at utvalget er trukket som om det var rent tlfeldg ved at det vanskelg kan tenkes kjennetegn ved enhetene utvalget som er korrelert med varablene som observeres, kalles også utvalget for representatvt. I det andre avsnttet er kand. nne på stratfserng som kke behandles dette kurset. Poenget med stratfserng kommer uansett kke klart fram avsnttet. Jeg vlle derfor gnorere andre avsntt evaluerngen. Totalt vlle jeg gtt en skåre 3/4 (75%) for 3A. Oppg. 3B: Konfdensntervallet det er spurt om er tlstrekkelg bra besvart og beregnet, men forklarngen av konfdensgraden er tvlsom. Hvs kanddaten, stedenfor, kunne v forvente at 95 av observasjonene vlle havne nnenfor ntervallet, hadde svart noe retnng av,., kunne v forvente at 95 av de beregnete konfdensntervallene vlle dekke den ukjente størrelsen p, så vlle jeg gtt fullt hus på oppgaven. Mn vurderng er ¾ (75%) for 3B Oppg. 3C er bra besvart (100%). Generelt: Dette er en god og moden besvarelse som etter mn vurderng lgger på grensen mellom A og B (mn prosentevaluerng gr 87%). Bortsett fra en alvorlg fel oppg. 2B(), nneholder den ngen vesentlge msforståelser mest ltt manglende pressjonsnvå når det gjelder symbolbruk særlg. Foruten 2B() vser oppgaven et nnsktsnvå klart på A-nvå, så jeg mener at en A kan forsvares sden den uansett lgger på grensen.