Repeterbarhetskrav vs antall Trails

Like dokumenter
Repeterbarhetskrav vs antall Trails

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Repeterbarhetskrav vs antall Trails V/ Rune Øverland, Trainor Automation AS

Gasskromatografi og repeterbarhetskrav

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

Løsningsforslag til seminar 4 Undervisningsfri uke

ST0202 Statistikk for samfunnsvitere

Kap. 8: Utvalsfordelingar og databeskrivelse

Forelesning 9 mandag den 15. september

ST0202 Statistikk for samfunnsvitere

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Statistisk generalisering

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Utvalgsfordelinger (Kapittel 5)

Uncertainty of the Uncertainty? Del 3 av 6

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Løsningsforslag Til Statlab 5

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

TMA4240 Statistikk Høst 2009

Forslag til endringar

Kapittel 1. Potensregning

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Repetisjon: høydepunkter fra første del av MA1301-tallteori.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

er et er et heltall. For eksempel er 2, 3, 5, 7 og 11 primtall, mens 4 = 2 2, 6 = 2 3 og 15 = 3 5 er det ikke.

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Innledning. Noen relevante statistiske konsepter. Utvalg og populasjon, estimat og parameter

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Læringsmiljø Hadeland. Felles skoleutviklingsprosjekt for Gran, Lunner og Jevnaker. Vurderingsbidrag

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Høyder på elliptiske kurver og faktorisering. Kristian Gjøsteen, NTNU Oppdatert 1. november 2002

MAT1030 Forelesning 30

PRIMTALL FRA A TIL Å

Analyse av nasjonale prøver i lesing, regning og engelsk pa ungdomstrinnet 2015 for Telemark

Statistisk behandling av kalibreringsresultatene Del 2. v/ Rune Øverland, Trainor Elsikkerhet AS

Tyngdekraft og luftmotstand

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Variabler, målinger og feilkilder i Forskerspiren. Bjørn Vidnes og Kirsten Fiskum Naturfagsenteret

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Kreativ utvikling av engasjerte mennesker. Fylkesmessa 2009 Kristiansund

Utvalgsfordelinger (Kapittel 5)

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Løsningsforslag til obligatorisk oppgave i MAT 1100, H-04

Arbeidstid. Medlemsundersøkelse mai Oppdragsgiver: Utdanningsforbundet

Introduksjon til statistikk og dataanalyse

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Uttrykket 2 kaller vi en potens. Eksponenten 3 forteller hvor mange ganger vi skal multiplisere grunntallet 2 med seg selv. Dermed er ) ( 2) 2 2 4

Statistikk og dataanalyse

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Utarbeidelse av forskningsprotokoll

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

STATISTIKK FRA A TIL Å

Sannsynlighetsregning og Statistikk.

Opptelling - forelesningsnotat i Diskret matematikk Opptelling

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

På lederutviklingsprogrammene som ofte gjennomføres på NTNU benyttes dette verktøyet. Du kan bruke dette til inspirasjon.

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

Tallet 0,04 kaller vi prosentfaktoren til 4 %. Prosentfaktoren til 7 % er 0,07, og prosentfaktoren til 12,5 % er 0,125.

Mesteparten av kodingen av Donkey Kong skal du gjøre selv. Underveis vil du lære hvordan du lager et enkelt plattform-spill i Scratch.

Forelesning 22 MA0003, Mandag 5/ Invertible matriser Lay: 2.2

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Løsningsforslag til obligatorisk innlevering 3.

Når tallene varierer.

Value added-indikatoren: Et nyttig verktøy i kvalitetsvurdering av skolen?

Matematikk Øvingsoppgaver i numerikk leksjon 7 Numerisk derivasjon

Vekst av planteplankton - Skeletonema Costatum

DEL 1 Uten hjelpemidler

Fortsettelses kurs i Word

NyGIV Regning som grunnleggende ferdighet

Arbeidshefte. Er optimal selvutvikling riktig for deg? Med Trine Åldstedt juni Hvor ble det av MEG?

.ASJONALE -ATEMATIKK 1M 3KOLENR

7.2 Sammenligning av to forventinger

S1 Eksamen våren 2009 Løsning

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

Studiedag om mobbing

SJEKKLISTE FOR VURDERING AV EN KOHORTSTUDIE

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Kvikkbilde 8 x 6- transkripsjonen av samtalen

Endringer i DNB Aktiv fondene Spørsmål og svar

RAMMER FOR MUNTLIG-PRAKTISK EKSAMEN I REALFAG ELEVER OG PRIVATISTER 2016

10.1 Enkel lineær regresjon Multippel regresjon

Regler i statistikk STAT 100

Løsningsforslag F-oppgaver i boka Kapittel 2

Uendelige rekker. Konvergens og konvergenskriterier

Fasit og løsningsforslag til Julekalenderen for mellomtrinnet

PROSJEKTOPPGAVE. (våren 2009) Fag: STATISTIKK OG ØKONOMI (ITD20106) 2. klasse dataingeniører. Tidsfrister: Utdelt: onsdag 25. mars.

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Transkript:

Repeterbarhetskrav vs antall Trails v/ Rune Øverland, Trainor Automation AS Artikkelserie Dette er andre artikkel i en serie av fire om tar for seg repeterbarhetskrav og antall trials. Formålet med artikkelserien er å bestemme sammenhengen mellom antall Trials og repeterbarhetskravet som må stilles for dette antall Trials. Den første artikkelen tok for seg måleusikkerhet og sentralverdi. Artikkel ble avsluttet med å vise en spredning (variasjon) basert på en normalfordelingskurve, samt standardavvik (grenseverdi for når man kan vurdere om måleresultatet inneholder systematiske eller grove feil). Artikkel 2: Sentralgrenseteoremet vies bred omtale i denne artikkelen. Vi kommer innom primær-populasjonens fordeling, og viktigheten av gjennomsnittverdien av et antall sekundær-populasjoner. Artikkelen avsluttes med hvordan man kan beregne standard usikkerhet for en populasjon. Introduksjon til Sentralgrenseteoremet La oss tenke oss oppgaven å bestemme gjennomsnittlig høyde på alle mennesker. Vel, den aritmetiske gjennomsnittsverdien finner vi å legge sammen høyde til alle vel 7 milliarder mennesker å dele denne summen med antall mennesker vi har målt høyden på. Slik: Hvor er menneskehetens sentralverdi på høyden. Deretter kunne vi kalkulert populasjonens presisjon. Men, i praksis, en mulig oppgave å måle alle x ene. Dersom vi derimot kunne nøye oss med å måle høyden på et utvalg av for eksempel 1000 vilkårlige mennesker, kunne dette la seg gjennomføre i virkeligheten. For en populasjon kan vi skrive: For utvalget kan vi skrive: Det viktige spørsmålet er da: Vil utvalget av mennesker være representativ for populasjonen? Har de samme sentralverdi? Har de samme presisjon? Side 1

Standard usikkerhet (presisjon) Hvordan regner vi så ut standard usikkerhet (s) for utvalget? Sentralgrenseteoremet sier at standard usikkerhet er avhengig av standardavviket i populasjonsfordelingen og størrelsen på utvalget. Problemet er at vi i virkeligheten ikke vet hva standardavviket i populasjonen er, og vi får dermed problemet med å regne ut standard usikkerhet. Da må vi ta sjansen på at standard usikkerhet i utvalget er omtrent det samme som standardavviket i populasjonen. Vi får dermed en tilnærmingsformel for standard usikkerhet. Jo større utvalget (n) er, jo mindre sjanse er det for at standard usikkerhet for utvalget og populasjonens standardavvik er svært forskjellige. Sentralgrenseteoremet Forventningen (µ) og variansen ( 2 ) er parametre i populasjonens fordeling. De kalles derfor populasjonsforventningen og populasjonsvariansen henholdsvis, og begge skal estimeres (E) på grunnlag av det observerte utvalg. Anta at utvalget består av (n) uavhengige observasjoner fra en populasjon. Vi har da (n) stokastiske variabler med samme fordeling (som nødvendigvis ikke har en normalfordeling). Vi kaller observasjonene x 1, x 2, x 3,....x n. Vi kalkulerer utvalgets sentralverdi: Vi gjentar dette for flere utvalgene etter samme mønster: Medlemmer i populasjonen (fra X 11 til og med X mn ) Utvalgens sentralverdier Utvalg 1 x 11 x 12 x 13 x 1n Utvalg 2 x 21 x 22 x 23 x 2n Utvalg m x m1 x m2 x m3 x mn Tabell: Utvalg fra en populasjon. Hvert utvalg har en sentralverdi. Vi bestemmer nå en ny, felles, sentralverdi basert på utvalgenes sentralverdier. Dette fordi vi forventer at. Det kan vises at forventningen til sentralverdien for en gruppe, som består av de ulike utvalgssentralverdiene, har samme forventning som sentralverdien til populasjonen. Side 2

Et eksempel: Utvalgsfordelingen for x i Vi velger en liten, oversiktlig populasjon som består av tallene (medlemmene) 2, 3, 4, 5 og 6. Primærpopulasjonen Frekvens (f) x 1 2 1 x 2 3 1 x 3 4 1 x 4 5 1 x 5 6 1 Elementene har samme fordeling (f); én av hver, og en merker seg at populasjonens fordeling langt i fra har en normalfordeling. Vi beregner populasjonen til å ha en sentralverdi lik 4,00 og dennes standardavvik er 1,41. Fra populasjonen danner vi nye grupper, og vi trekker ut to vilkårlige medlemmer. Følgende utvalg av størrelse 2, det vil si at utvalgsstørrelsen har 2 elementer, kan trekkes ut fra populasjonen: {2 og 3} {2 og 4} {2 og 5} {2 og 6} {3 og 4} {3 og 5} {3 og 6} {4 og 5} {4 og 6} {5 og 6} Vi teller opp antall nye utvalg (antall utvalg m 10). PS: Når vi etablerer nye utvalg, skal dette selvfølgelig gjøres med tilfeldigheter; ikke nødvendigvis slik vi har gjort i dette eksemplet! Sentralverdien (aritmetisk middelverdi) i hvert av de ti utvalgene over er: 2,5 3,0 3,5 4,0 3,5 4,0 4,5 4,5 5,0 5,5 Disse sentralverdiene danner basis for et nytt utvalg med følgende frekvensfordeling: Utvalgenes sentralverdi ( ) Frekvens (f) 2,5 1 3,0 1 3,5 2 4,0 2 4,5 2 5,0 1 5,5 1 Side 3

Gruppenes sentralverdi 4,00 Gruppenes standard usikkerhet s 0,87 Vi gjør følgende observasjoner: 1. Populasjonens sentralverdi er lik utvalgfordelingenes sentralverdi (her 4,00). 2. Utvalgenes standard usikkerhet (her s 0,87) er mindre enn populasjonens standardavvik (her 1,41). 3. Utvalgfordelingens form (fordeling ) skiller seg fra populasjonens form. Utvalgfordelingens form er (fremdeles) ikke normalfordelt, men i sin form avviker den mindre fra en normalfordeling enn hva populasjonen gjør. Det viser seg erfaringsmessig at utvalgsfordelingens form ligner mer og mer på en normalfordeling når utvalgsstørrelsen (n) øker. Dette mønster danner grunnlag for sentralgrenseteoremet: Når utvalgsstørrelsen (n) øker, vil fordelingen (spredningskarakteristikken) til sentralverdien for utvalgsgjennomsnittet, praktisk talt, for en hvilken som helst populasjonfordeling, nærme seg en normalfordeling. Standard usikkerhet Variansen til utvalg m som har basis i sentralverdier fra flere utvalg n er lik variansen til populasjonen dividert på antall medlemmer (n) som er trukket ut fra populasjonen. Standard utsikkerhet for et utvalg blir da: Side 4

På engelsk heter dette Standard Error of the Mean, ofte forkortet SEM. Uttrykt med ord: Standard usikkerhet I sentralgrenseteoremet er kravet droppet om at x i skal være normalfordelt. Teoremet bygger på at fordelingen for går mot en normalfordeling når n blir stor nok i stedet for å være normalfordelt. Dette teoremet sier at vi kan bruke all teori vedrørende normalfordeling også når vi behandler data som ikke er normalfordelt, forutsatt at vi holder oss til sentralverdier med tilstrekkelig store utvalg (n). Vi kan oppsummere alt slik: For en populasjon kan vi skrive: For utvalget kan vi skrive: Artikkel 3 Når utvalget (n) er lite, blir dette en utfordring. Det kan vi ta hensyn til ved å velge en variant av normalfordelingen som varierer med utvalgsstørrelsen. Dette kalles Students t-fordeling. I artikkel tre vil vi ta for oss dette. Side 5