Påliteligheten til en stikkprøve
|
|
|
- Alf Mikalsen
- 10 år siden
- Visninger:
Transkript
1 Pålitelighete til e stikkprøve Om origiale... 1 Beskrivelse... 2 Oppgaver... 4 Løsigsforslag... 4 Didaktisk bakgru... 5 Om origiale "Zuverlässigkeit eier Stichprobe" på lærigsstøtte ble utviklet av Fraz Embacher, ved Fakultetet for aturviteskap og matematikk og Istituttet for teoretisk fysikk ved Uiversitetet i Wie, og Petra Oberhuemer i forbidelse med prosjektet "Nye medier i matematikk-utdaige" med støtte fra departemetet i Østerrike for utdaig, viteskap og kultur. Uiversitetet i Wie, mai Side er høste 2004 oversatt av Corelia Brodahl, Høgskole i Agder, og Heidi Mæsel Oftedahl, Kvadrature Skoleseter, med velig tillatelse av forfattere. De ligger på Galleri DigiVitalis uder Høgskole i Agder, Fakultet for Realfag. Side 1 av 5
2 Beskrivelse Temaet i dee aimasjoe er pålitelighete av de to statistiske parametree middelverdi og varias som e bereger på grulag av e stikkprøve. Aimasjoes målsetig er å illustrere oe gruleggede problemstilliger. I dee forbidelse forutsettes det, at begrepee middelverdi og stadardavvik allerede er kjet og at e kjeer til hva disse begrepee forteller om e observasjosmegde. Variase er kvadratet av stadardavviket. Utgagspuktet er e observasjosmegde (karakterisert ved e megde av mulige utfall, som itreffer med e kjet sasylighet), som ma vil udersøke. Så skal dee observasjosmegde (som det ofte er tilfelle i praksis) ikke være tilgjegelig til direkte statistisk aalyse (f.eks. fordi de er for stor). I slike tilfeller må ma greie seg med iformasjo fra e stikkprøve. I aimasjoe har vi e observasjosmegde der de ulike utfall og sasylighete som de opptrer med karakterisert gjeom følgede tabell: Utfallet opptrer med e sasylighet på 0,6 0,04 0,7 0,04 0,8 0,08 0,9 0,16 1,0 0,20 1,1 0,24 1,2 0,16 1,3 0,04 1,4 0,04 De viktigste statistiske parametree for dee observasjosmegde er (avrudet): Middelverdi: µ = 1,024 Stadardavvik: σ = 0,1817 Varias (kvadrat av stadardavviket): σ 2 = 0,033 Det blir tatt e stikkprøve på 10 utfall ut av vår observasjosmegde (i hehold til ovefor agitte sasyligheter) og det bereges deres middelverdi m og varias s 2. Spørsmål: Med hvilke sikkerhet ka e trekke koklusjoer for de ulike parametree til observasjosmegde? For å kue svare på dette spørsmålet, forestiller vi oss (i et takeeksperimet), at flere stikkprøver blir tatt: Tri 1-6: I dee aimasjoe blir det vist tre stikkprøver. De faller alle litt ulikt ut: Middelverdi (m) og variase (s 2 ) i hvert av de tre tilfellee, avviker oe fra hveradre. Dette forteller oe om at ma må rege med e statistisk usikkerhet. Et mål for dee usikkerhete får vi år vi udersøker, hvorda disse stikkprøvee skiller seg fra hveradre. Dette vil vi utføre i de påfølgede tri. (Ved hjelp av trekatee som står til høyre for dataee ka e studere stikkprøve og deres hyppighetstabell også uder seere tri.) Tri 7: Så bereges middelverdie til de tre stikkprøve-middelverdiee. For iformasjo om hvorda dee parametere forholder seg for et stort tall av stikkprøver, ka du bevege muse over de røde tekste "Les meg 1"! NB: Symbolet E(...) som blir brukt i tekste beteger middelverdie (gjeomsittet) av et stort atall stikkprøver (og beteges som forvetigsverdie). Tri 8: Variase til de tre stikkprøve-middelverdiee bereges også. For mer iformasjo om hvorda dee parametere forholder seg for et stort tall av stikkprøver, ka du bevege Side 2 av 5
3 muse over de blå tekste "Les meg 2 "! NB: Stadardavviket (spredig) m for stikkprøve-middelverdiee for et stort atall stikkprøver er defiert ved formele m 2 = E( (m - E(m)) 2 ) som også ka uttrykkes slik: m 2 = E(m 2 ) - E(m) 2. Tri 9: Ut av de tre stikkprøve-variasee bereges middelverdie. For iformasjo om hvorda dee parametere forholder seg for et stort tall av stikkprøver, ka du bevege muse over de grøe tekste "Les meg 3"! Aimasjoe ieholder ige utledig av formlee som preseteres i lesmeg-tekstee, me skal illustrere deres betydig. Ved hjelp av "Reset"-kappe ka du til e hver tid vede tilbake til begyelse av aimasjoe. De tre viste stikkprøvee er faste og blir brukt på ytt ved y omstart. Hva e ka lære ut av dette: Prøv ved hjelp av aimasjoe (og formlee i de tre "Les meg" -tekstee, som du helst skal otere ed) å bli bevisst på følgede sammeheg: Selv om verdiee til de statistiske parametree m og s i e stikkprøve ikke står fast i utgagspuktet, ka e agi "forvetiger" (så fremt observasjosmegde er kjet). Dette blir brukt til å udersøke det i praksis viktige tilfelle, at observasjosmegde er ukjet. Etter e har tatt e stikkprøve, ka e gjøre følgede aslag ut av kjeskapet til m og s: Det beste aslag for de (ukjete) middelverdie µ for observasjosmegde er middelverdie m av stikkprøve. De statistiske usikkerhete (spredig) m av dette aslaget ka e også agi: Spredige bereger e ut av stadardavviket s og atall stikkprøver m = σ Dee formele beteges også iblat som "rote av - regele ". Dee uttrykker de ilysede setige "Jo større stikkprøve, desto mer øyaktig ka utsagee om observasjosmegde bli som vi ka utlede av dee." Mer presist: For å halvere sikkerhete i aslaget av observasjosmegdes middelverdi, må e firedoble omfag av stikkprøve! Me legg merke til at stadardavviket σ på høyre side er e ukjet størrelse. Det beste aslaget for stadardavviket σ til observasjosmegde er de såkalte "empiriske spredig " (også kalt "midlere feil til e ekeltmålig") s 1 For store er de tilærmet lik stadardavviket. Setter ma de to resultatee samme, får e et aslag for de statistiske usikkerhete. m s 1 Parametere på de høyre side blir også beteget som "midlere feil for middelverdiee". Formele tillater å agi pålitelighete til slutige på observasjosmegde" ee og alee ut ifra utfallee i stikkprøve. For store har vi de ekle formele Side 3 av 5
4 m s Alle disse formlee er ku gyldige i sammeheger der utfallee i e stikkprøve er uavhegig av hveradre ("med tilbakeleggig"). Stikkprøve ka da ha et vilkårlig omfag, dvs. ka bli vilkårlig stor. I praksis tas stikkprøver derimot ofte "ute tilbakeleggig" ut av e gitt grumegde (f.eks. i meigsmåliger, år hver perso maksimalt blir spurt é gag). Blir sasylighete for å trekke ut et elemet av observasjosmegde flere gager så lite at e ka se bort i fra de, ka e bruke formele over også for dette tilfellet. (Dersom dette ikke er tilfellet, så er pålitelighete av aslaget på grulag av e stikkprøve til og med midre! I et gresetilfelle ka stikkprøve ibefatte hele observasjosmegde, da forsvier all statistisk usikkerhet.) Et kokret eksempel på dette blir behadlet i oppgave 5. Oppgaver 1. Hvilke av de tre stikkprøvee i aimasjoe beskriver observasjosmegde best? 2. Bereg størrelse m 2 (dvs. gjeomsittsvariase ut fra et stort atall stikkprøver, se "Les Meg 2"-tekste og Beskrivelse) og m for situasjoe som er behadlet i aimasjoe! 3. Hvilke av middelverdiee av de tre stikkprøvee ligger legre fra middelverdie til observasjosmegde e m? 4. Hvor sasylig er det at e stikkprøve har middelverdie lik 0,6? 5. E skal fie gjeomsittlig kroppshøyde til befolkige i et lad. I de forbidelse blir det tatt e stikkprøve på 100 (tilfeldig valgte) persoer. Stadardavviket til de målte kroppshøydee er 40 cm. Ut fra de 100 målte kroppshøydee blir middelverdie bereget. Hvor øyaktig agir dee midlere kroppshøyde til befolkige? Hvorda edrer de statistiske usikkerhete seg, år e i stedet tar e stikkprøve på persoer, år stadardavviket fortsatt er 40 cm? 6. Betrakt observasjosmegde som bare har to elemeter, -1 og 1, som hver opptrer med e sasylighet på 1/2! Dette tilsvarer et mytkast, der resultat myt gir poegverdi 1 og resultat kroe gir poegverdi -1. Vis at forvetigsverdie for observasjosmegde er µ = 0 og stadardavviket for observasjosmegde er σ = 1! Når du kaster myte gager og adderer poegee - hva forveter du at summe vil bli? Løsigsforslag 1. I forhold til middelverdi kommer de første stikkprøve ærmest observasjosmegde, sett i forhold til stadardavvik (eller varias) kommer de adre og tredje stikkprøve best ut. Spørsmålet har altså ige etydig løsig. 2. Avrudet er m 2 = og m = De adre og tredje. 4. Side 0,6 er de miste av alle mulige resultatverdier, får ma e stikkprøve med middelverdi 0,6 bare år e trekker dee verdie ti gager. Sasylighete til å trekke dee verdie é gag er 1/25. Sasylighete til å trekke dee verdie 10 gager er (1/25) Tips: Bruk formler som er agitt i LesMeg-tekstee (og i "Beskrivelse" til aimasjoe) med = 100 s = 40 cm. Da viser det seg at de statistiske usikkerhete kyttet til beregige av middelverdi for kroppshøyde, er ca 4 cm. (De eeste ødvedige "utregige" er 100-1/2 = 1/10). Det betyr: De virkelige gjeomsittlige kroppshøyde av befolkige ka avvike med flere cetimeter fra middelverdie som er bereget på grulag av e stikkprøve. Side 4 av 5
5 Ta ma e stikkprøve med persoer, og stadardavviket fortsatt er 40 cm, reduseres de statistiske usikkerhete til omlag 4 mm (side /2 = 1/100). 6. Formele i "Les Meg 2"-tekste reduseres da i dette tilfelle til m = -1/2. Formele beskriver det forvetede avviket mellom stikkprøves middelverdi for poegsumme og de virkelige middelverdi. Side de virkelige middelverdie er 0, kommer stikkprøvees middelpoegverdi til å ligge i størrelsesorde på (pluss eller mius) -1/2, me blir på de adre side lik summe til de kastede poegverdiee delt på. De forvetede summe ligger derfor atageligvis i e størrelsesorde på (pluss eller mius) 1/2. Hvis du altså kaster myt e millio gager (et "stort" tall), så ligger de forvetede middelverdie på (pluss eller mius) 1/1000 (et "lite" tall) og de forvetede summe ligger ved (pluss eller mius) 1000 (et "mellomstort" tall). Pålitelighete til stikkprøve ved et aslag for middelsverdie til observasjosmegde er i dette tilfellet allerede gaske godt. Summe av poegverdiee, "etto-overskudd" på (pluss eller mius) 1000, er i forhold til atall mytekast (1 millio) lite. Dette resultatet har to iteressate avedelser: o o Didaktisk bakgru I et lykkespill ka du i hver omgag tape eller vie 1 kroe med samme sasylighet. Når du begyer med e startkapital på 0 kroer og spiller omgager, vil saldoe di (ved stor ) atagelig ligge i størrelsesorde (pluss eller mius) 1/2. Det vil si at etter mage omgager har du ete tapt eller vuet mye. Hvilke av disse to situasjoee som itreffer ka e aturligvis ikke forutsi. Når det først har oppstått et tap, blir sasylighete for at du ka utlige det allerede oppståtte tapet stadig midre! De Browske molekularbevegelse eller "tilfeldige gage": Hvis du ser på e lite støvpartikkel i e vadråpe i et mikroskop, vil du se at de beveger seg hit og dit i et uregelmessig møster - det ser este ut som om de lever! Dette heter Browsk bevegelse etter mae som beskrev feomeet først. Blir e partikkel i hver tidsehet utsatt for sammestøt med molekyler og forskjøvet i e legde L til høyre eller vestre (til e hver tid med samme sasylighet), vil de etter støt ha tilbakelagt e strekig i størrelsesorde L 1/2 - om det var til vestre eller til høyre lar seg ikke forutsi. E aalyse av pålitelighete til e stikkprøve er vaskelig, framfor alt fordi her har vi e kombiasjo av to tilfeldighetsprosesser: e stikkprøve at et omfag ("med tilbakeleggig") og dette tilfeldige utvalget er ett av alle mulige stikkprøver. Allerede betegelse "midlere feil for middelverdiee" som er e viktig størrelse i statistikk gjør det språklig tydelig at de dobbelte tilfeldighetsstrukture er komplisert. Aimasjo prøver å skape forståelse for hva som er met med dette og likede begrep og hva de formlee som er brukt står for. Aimasjoe ka brukes helt uavhegig av om e skal utvikle formele algebraisk eller ikke. Det abefales å gå gjeom aimasjoe flere gager, slik at de uderliggede logikke blir klar og å skrive ed formlee som e fier i "Les Meg"-tekstee å lese tekste som ligger uder kappe "Beskrivelse" øye. At det ødvedige regearbeidet (e treger stort sett bare å trekke kvadratrote) er forholdsvis lite må ikke skjule at de situasjo som vi betrakter er kompleks. Et godt mål for oppådd forståelse er eve til ikke bare å kue utføre beregiger, me også å kue gjegi resultatee oelude språklig korrekt. Side 5 av 5
