Repeterbarhetskrav vs antall Trails



Like dokumenter
Repeterbarhetskrav vs antall Trails

Gasskromatografi og repeterbarhetskrav

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Repeterbarhetskrav vs antall Trails V/ Rune Øverland, Trainor Automation AS

Introduksjon til statistikk og dataanalyse

Statistisk behandling av kalibreringsresultatene Del 2. v/ Rune Øverland, Trainor Elsikkerhet AS

STATISTIKK FRA A TIL Å

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Oversikt. ST0202 Statistikk for samfunnsvitere

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Tyngdekraft og luftmotstand

Analyse av nasjonale prøver i lesing, regning og engelsk pa ungdomstrinnet 2015 for Telemark

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Uncertainty of the Uncertainty? Del 3 av 6

Arbeidstid. Medlemsundersøkelse mai Oppdragsgiver: Utdanningsforbundet

Value added-indikatoren: Et nyttig verktøy i kvalitetsvurdering av skolen?

Matematikk Øvingsoppgaver i numerikk leksjon 7 Numerisk derivasjon

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Nasjonale prøver i lesing, regning og engelsk på 5. trinn 2015

Løsningsforslag Til Statlab 5

STK1000 Innføring i anvendt statistikk

Nøkkelspørsmål til eller i etterkant av introduksjonsoppgaven:

Forelesning 9 mandag den 15. september

PRIMTALL FRA A TIL Å

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse

Statistikk. Forkurs 2017

Sannsynlighetsregning og Statistikk.

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Statistikk. Forkurs 2018

Matematikk og naturfag. To eksempler fra mellomtrinn/ungdomstrinn

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

På lederutviklingsprogrammene som ofte gjennomføres på NTNU benyttes dette verktøyet. Du kan bruke dette til inspirasjon.

Variabler, målinger og feilkilder i Forskerspiren. Bjørn Vidnes og Kirsten Fiskum Naturfagsenteret

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Elev får. tilfredsstillende utbytte av undervisningen. Elev får ikke. tilfredsstillende utbytte av undervisningen

NASJONALE PRØVER En presentasjon av resultatene til 5.trinn ved Jåtten skole, skoleåret

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Videreutdanning. Medlemsundersøkelse blant lærere i grunnskolen og videregående skole juni Oppdragsgiver: Utdanningsforbundet

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Løsningsforslag til obligatorisk innlevering 3.

Legg merke til at at over de blå klossene er det flere kategorier av kommandoer i forskjellige farger, for eksempel

MAT1030 Forelesning 30

S1 Eksamen våren 2009 Løsning

Innledning. Noen relevante statistiske konsepter. Utvalg og populasjon, estimat og parameter

Vekst av planteplankton - Skeletonema Costatum

Løsningsforslag til seminar 4 Undervisningsfri uke

Utarbeidelse av forskningsprotokoll

Mer om likninger og ulikheter

Høgskolen i Gjøviks notatserie, 2001 nr 5

Medisinsk statistikk Del I høsten 2008:

Statistisk behandling av kalibreringsresultatene Del 3. v/ Rune Øverland, Trainor Elsikkerhet AS

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

Statistisk generalisering

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

ØVINGER 2017 Løsninger til oppgaver. Øving 1

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Hefte med problemløsingsoppgaver. Ukas nøtt 2008/2009. Tallev Omtveit Nordre Modum ungdomsskole

Forkurs i kvantitative metoder ILP 2019

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Seksjon 1.3 Tetthetskurver og normalfordelingen

Løsningsforslag til underveisvurdering i MAT111 vår 2005

Modul nr Statistikk og Sannsynlighet i en digital verden

ECON Statistikk 1 Forelesning 2: Innledning

Et lite notat om og rundt normalfordelingen.

ST0202 Statistikk for samfunnsvitere

Statistikk og dataanalyse

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Hilsen Jørgen Larsen Epost: Tlf: KFU Sandefjord

Fra første forelesning:

Kalibreringskurver; på jakt etter statistisk signifikante datapar

Klasseledelse, fag og danning hva med klassesamtalen i matematikk?

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Preken 14. august s i treenighet Kapellan Elisabeth Lund. Tekst: Joh. 15, 13-17

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Sentralmål og spredningsmål

Prosent. Det går likare no! Svein H. Torkildsen, NSMO

Nåverdi og pengenes tidsverdi

Nøkkelspørsmål: Hvor lang er lengden + bredden i et rektangel sammenlignet med hele omkretsen?

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Forventningsundersøkelsen 2. kvartal 2008:

Kapittel 1. Potensregning

4. kurskveld: Brøk og geometri

Beskrivende statistikk.

Årsplan i matematikk 5.klasse 2015/16

Hervé Colleuille seksjonssjef, Hydrologisk avdeling NVE

Fasit og løsningsforslag til Julekalenderen for mellomtrinnet

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Månedsevaluering fra Perlå januar 2011

TMA4240 Statistikk Høst 2012

En analyse av formuesskattens innvirkning på norske gasellebedrifter 1

SPSS Statistics-kurs 2013

Transkript:

Repeterbarhetskrav vs antall Trails v/ Rune Øverland, Trainor Automation AS Artikkelserie Dette er første artikkel i en serie av fire som tar for seg repeterbarhetskrav og antall trials. Formålet med artikkelserien er å bestemme sammenhengen mellom antall Trials og repeterbarhetskravet som må stilles for dette antall Trials. Artikkel 1: Her definerer vi måleusikkerhet og sentralverdi. Videre kommer vi innom at selv om vi gjentar en måling flere ganger vil vi som regel få forskjellige resultater. Artikkel avsluttes med å vise deg en spredning (variasjon) basert på en normalfordelingskurve. Artikkel 2: Sentralgrenseteoremet vises bred omtale i denne artikkelen. Vi kommer innom primær-populasjonens fordeling, og viktigheten av gjennomsnittverdien av et antall sekundær-populasjoner. Artikkelen avsluttes med hvordan man kan beregne standard usikkerhet for en populasjon. Artikkel 3: Her diskuterer vi påliteligheten av standardavvik, og vi introduserer begrepet utvidet usikkerhet av et gjennomsnitt. Du lærer mer om én-side og to-sidet avvik. Vi avslutter med å vise deg Student s t- faktor. Artikkel 4: Vi viser deg hvorledes vi kan estimere standardavvik når dette ikke kan beregnes. Artikkelserien avsluttes med hvorledes vi kan kalkulere kombinert usikkerhet ved et visst antall Trials oppgitt ved 95 % Confidence Level til å være 0,03 % eller bedre. Definisjon av usikkerhet Et måleresultat består både av måleverdi og et intervall rundt denne der den sanne verdien med stor sannsynlighet ligger. Estimert sann verdi = Måleverdi ± tilfeldige feil Ut fra et statistisk synspunkt, vil tilfeldige feil være like mye på den positive siden som den negative. Selv om vi har innrettet oss slik at verken systematiske, grove eller ensidige virkende feil kan få nevneverdige innvirkning på resultatet, vil vi som regel få forskjellige resultater når vi gjentar målingen flere ganger. Side 1

Måles en prøve gjentatte ganger oppnår vi derfor ikke en serie med identiske resultater, men de ligger mer eller mindre spredd innenfor et bestemt område. Denne spredningen skyldes tilfeldige feil, det vil si at tilfeldige feil påvirker presisjonen i målingen. Årsakene til at gjentatte målinger gir forskjellige resultat kan være mange. Feilverdien varierer helt tilfeldig, og vi kan ikke på forhånd si i hvilken retning (pluss/minus) den vil forskyve resultatet. For å få et bilde av størrelsen av tilfeldige feil må vi ta i bruk statistiske metoder. Sentralverdi Sentralverdi kan i dagligtale forstås som en gjennomsnittsverdi. Vi skal bestemme tyngdepunktet i gruppe med tall. I statistikk har vi ofte tre ulike definisjoner på en sentralverdi: Aritmetisk middelverdi (som oftest denne vi bruker i det daglige) Median (det tall som ligger i midten i en tallserie) Mode (det tall som forekommer hyppisk i en tallserie) La oss tenke oss tallsettet: 7 3 3 5 2 100 Her er det seks tall, så det er overkommelig å kommunisere disse tallene. Men, hadde vi hatt seks millioner tall i dette tallsettet, ville det straks vært mer uoversiktlig. Vi ønsker derfor å finne et nytt tall som representerer en sentralverdi (tyngdepunkt) for tallsettet. Aritmetisk middelverdi Her adderer vi individuelle tallverdier og deler dette med antall tall. Sentralverdi = Aritmetisk middelverdi = Hvert av de seks tallene har lik vekting på sentralverdien, det vil si 1/6 hver. Tallet 20 er dette tilfellet sentralverdien for tallsettet. Ulempen med denne metoden for å angi sentralverdien er at unormale verdier, i dette tilfellet tallet 100, raskt trekker opp sentralverdien. Median Her ordner vi først tallene i stigende rekkefølge, og finner det tallet som er i midten av tallserien. Ordnet tallserie: 2 3 3 5 7 100 I dette tilfellet har vi ikke ett tall som ligger i midten, men to. Pr definisjon tar vi derfor den aritmetiske middelverdien av disse: Side 2

Altså: Sentralverdi = Median = [1.1] Tallet 4 er i dette tilfellet sentralverdien for tallsettet. Det fine med denne metoden er at unormale tall, i dette tilfellet 100, ikke ødelegger den folkelige oppfatningen av hva som er sentralverdien for tallsettet. Mode Denne definisjonen sier at sentralverdien er det tall som forekommer hyppigst (har høyest frekvens) i tallsettet. Altså: Tall Antall (frekvens) 2 1 3 2 5 1 7 1 100 1 Tallet 3 er i dette tilfellet sentralverdien for tallsettet. Hvilken metode er best for å bestemme tyngdepunktet? Nå som vi har vært inne på tre ulike definisjoner av sentralverdier, kan vi spørre oss: Hvilken av de tre sentralverdiene i eksemplet over er best? 20, 4 eller 3? Vel, i utgangspunktet er alle like riktige. Men, det kan være nyanser i hva som er best. Basert på skjønn vil sikkert noen si at tallet 100 i vårt tallsett ødelegger dersom vi bruker definisjonen aritmetisk middelverdi. Hadde vi utelatt dette tallet fra tallsettet, ville den aritmetiske middelverdien vært: Modifisert Aritmetisk middelverdi = Dersom vi har mistanke om at et tall ikke er representativ for tallsettet, det vil si at tallet kan ha oppstått grunnet en grov feil, kaller vi dette tallet for en uteligger. Det er flere metoder for å fjerne uteliggere. Variasjon rundt sentralverdien (tyngdepunktet) La oss vurdere tre tallsett: Side 3

Tallsett Utvalg Nr. 1 2, 3, 3, 5, 7 Nr. 2 3, 4, 4, 5, 4 Nr. 3 4, 4, 4, 4, 4 For de tre tallsettene er den aritmetiske gjennomsnittsverdien (sentralverdien = ) for hvert tallsett verdien 4. Og, vi ser lett at utvalgene likevel er ganske forskjellige. Tallsett 1 har en nokså stor variasjon i enkeltverdiene rundt sentralverdien, mens tallsett 3 ikke har noen variasjon i det hele tatt. I tillegg til sentralverdien vil det ofte være ønskelig at en angir en størrelse som forteller hvordan måleresultatene er spredt i måleområdet. Metoder som kan brukes for å angi spredningen rundt sentralverdien er: Grenseverdi Midlere avvik: Varians: eller standardavvik: Jo nærmere datapunktene ligger middelverdien, jo bedre vil en si datasettet er. Nedenfor oppsummerer vi grenseverdiene for spredningen som ligger rundt tallsettets sentralverdi: Tallsett Utvalg Grenseverdi Midlere avvik Varians Standardavvik Nr. 1 2, 3, 3, 5, 7 ± 2,5 ± 1,6 ± 3,2 ± 1,79 Nr. 2 3, 4, 4, 5, 4 ± 1,0 ± 0,4 ± 0,4 ± 0,63 Nr. 3 4, 4, 4, 4, 4 ± 0,0 ± 0,0 ± 0,0 ± 0,00 Side 4

Som nevnt, har vi et tallsett som ovenfor er tallsettet oversiktlig. Og hadde vi et tallsett med mange millioner medlemmer, ville det vært en grei måte å kommunisere dette tallsettet med å oppgi dennes sentralverdi og tallsettets spredningsgrenser. Histogram I et histogram tegner vi inn stolper med en viss bredde.; for eksempel for hvert tiendedels grad Celsius, og en høyde. Diagrammet viser sammenhengen mellom måleverdi(er) i en gruppe, for eksempel temperaturer mellom 19,95 C og 20,04, og hvor ofte dette måleresultatet forekommer. Ved hjelp av dataverktøy kan man få tegnet opp en kurve som illustrerer en sammenhengen. Figur: Temperaturen er målt 100 ganger, og det er tegnet et stolpe -diagram (histogram). Programmet tegner opp en utjevnet kurve. Normalfordeling av spredning Årsaken til tilfeldig variasjon av tallverdier rundt tallsettets sentralverdi kan være mange. For de aller fleste tilfeller gjelder det at de fleste variasjoner er små, og tallverdien vil som oftest ligge nærmere sentralverdien. Desto større feil, desto sjeldnere vil denne opptre. Sannsynlighetsfordelingen er slik at vi forventer å finne flest resultater ved sentralverdien, og vi har en lavere forventning å finne tallverdier med større avvik. Sammenhengen kan beskrives slik: hvor er aritmetisk gjennomsnittsverdi. Side 5

Walter Shewhart arbeidet i 1920-årene i selskapet Bell Telephone Laboratories. Han omtales ofte som den moderne statistikkens far etter at i 1926 publiserte en av sine mange artikler om normalfordelinger. Normalfordelingskurven blir også omtalt som Bell-kurven. I figuren, venstre halvdel, har vi to kurver med samme ulike -verdier (sentralverdier; her 7 og 13). -verdi (spredningskarakteristikk) og I figuren; høyre halvdel; har vi to kurver med samme sentralverdi (her 10) og ulike (spredningskarakteristikker). -verdier Det kan vises at ut i fra en normalfordelingskurve er det cirka 68 % sannsynlighet for et en enkeltverdi i et utvalg vil ligge innenfor intervallet pluss/minus ett standardavvik (s) av sentralverdien ( ). Mange industri-normer bruker et krav på to ganger standardavvik som grenseverdier. Det vil her være cirka 95 prosent sannlighet for at en måleverdi vil ligge innenfor våre grenseverdier ( ). Og likeledes, det vil være fem prosent sannsynlighet for at en måleverdi ligger utenfor grenseverdiene. I dette tilfellet kan måleresultatet være beheftet med så store feil (men også andre feiltyper enn bare tilfeldige feil) at vi forkaster måleresultatet. I all fall bør vi undersøke hvorfor vårt måleresultat ligger såpass langt unna sentralverdien. Ulike estimater av variansen (Bessels s korreksjon) Det er to regler for beregning av variansen basert på om sentralverdien er estimert eller om den er sann. Estimert sentralverdi Sann sentralverdi brukes når s (standardavvik) baseres kun på et estimat av den sanne sentralverdien som tar utgangspunkt på en serie med enkeltverdier som innehar tilfeldige feil. Side 6

brukes dersom vi kjenner den sanne sentralverdien. Korreksjonen (n-1 i stedet for n) kalles for Bessel s korreksjon. Når man har flere målte enkelverdier i en større populasjon, bruker vi derfor. Formel for beregning av standardavvik Brukes... : når vi skal bestemme standardavvik (σ) for hele populasjon, bruker vi ( ). når vi skal bestemme standardavvik (s) for deler av en populasjon, det vil si at vi jobber med et utvalg av populasjonen, bruker vi ( ). Side 7