Statistisk behandling av kalibreringsresultatene Del 2. v/ Rune Øverland, Trainor Elsikkerhet AS

Like dokumenter
Statistisk behandling av kalibreringsresultatene Del 3. v/ Rune Øverland, Trainor Elsikkerhet AS

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Kalibreringskurver; på jakt etter statistisk signifikante datapar

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

Gasskromatografi og repeterbarhetskrav

Uncertainty of the Uncertainty? Del 3 av 6

Repeterbarhetskrav vs antall Trails

Regelverkskrav til gasskromatograf (komposisjonsanalyse) v/ Rune Øverland, Trainor Elsikkerhet AS

Repeterbarhetskrav vs antall Trails

Kort overblikk over kurset sålangt

10.1 Enkel lineær regresjon Multippel regresjon

Repeterbarhetskrav vs antall Trails V/ Rune Øverland, Trainor Automation AS

Sannsynlighetsregning og Statistikk.

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Kapittel 3: Studieopplegg

Statistikk. Forkurs 2018

Konfidensintervall for µ med ukjent σ (t intervall)

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Statistikk. Forkurs 2017

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

DEL 1. Uten hjelpemidler. Oppgave 1 (5 poeng) Oppgave 2 (3 poeng) Deriver funksjonene. x x. På figuren har vi tegnet grafen til en funksjon f gitt ved

Appendiks 5 Forutsetninger for lineær regresjonsanalyse

TMA4240 Statistikk Høst 2018

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Regresjon med GeoGebra

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Statistikk og dataanalyse

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

2.1 Regnerekkefølge. 3.4 Rette linjer med digitale verktøy 2(3 + 1) (6+ 2):4+ 42

Deskriptiv statistikk., Introduksjon til dataanalyse

Karakter 2: 10p Karakter 3: 17p Karakter 4: 23p Karakter 5: 30p Karakter 6: 36p

Deskriptiv statistikk., Introduksjon til dataanalyse

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

Lær å bruke GeoGebra 4.0

EKSAMEN. EMNEANSVARLIG: Terje Bokalrud og Hans Petter Hornæs. TILLATTE HJELPEMIDLER: Kalkulator og alle trykte og skrevne hjelpemidler.

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

HØGSKOLEN I STAVANGER

DEL 1 Uten hjelpemidler

Inferens i regresjon

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

6.2 Signifikanstester

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Lottotrekningen i Excel

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Eksamen i. MAT110 Statistikk 1

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

3.A IKKE-STASJONARITET

ST0202 Statistikk for samfunnsvitere

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

S1 kapittel 3 Lineær optimering

Øgrim Bakken Pettersen Skrindo Dypbukt Mustaparta Thorstensen Thorstensen. Digitalt verktøy for Sigma 2P. Microsoft Excel

EN LITEN INNFØRING I USIKKERHETSANALYSE

Statistikk for språk- og musikkvitere 1

TMA4245 Statistikk Eksamen desember 2016

1 10-2: Korrelasjon : Regresjon

Oppgave 578. Tilleggsspørsmål: a. (Som i original oppgave)

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Forkurs i kvantitative metoder ILP 2019

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Kan vi forutse en pendels bevegelse, før vi har satt den i sving?

Eksamen vår 2009 Løsning Del 1

Fra første forelesning:

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

GeoGebra i 1T. Grafer. Å tegne grafen til en funksjon. GeoGebra tegner grafen til f(x) = 0,5x 2 for 0 x 10.

Eksamen S2 va ren 2015 løsning

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

TMA4240 Statistikk Eksamen desember 2015

ST0202 Statistikk for samfunnsvitere

Notat 3 - ST februar 2005

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Kjennetegn på måloppnåelse TALL OG ALGEBRA. Kunne plassverdisystemet for hele- og desimaltall

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

Høgskolen i Gjøviks notatserie, 2001 nr 5

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Beskrivende statistikk.

Tabell 1: Beskrivende statistikker for dataene

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

ST0202 Statistikk for samfunnsvitere

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

ST0202 Statistikk for samfunnsvitere

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

FYS våren Linjetilpasning. Alex Read Universitetet i Oslo Fysisk institutt

LØSNING: Oppgavesett nr. 1

Manual til Excel. For ungdomstrinnet ELEKTRONISK UNDERVISNINGSFORLAG AS

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Simulering - Sannsynlighet

ECON2130 Kommentarer til oblig

Transkript:

Statistisk behandling av kalibreringsresultatene Del 2. v/ Rune Øverland, Trainor Elsikkerhet AS Denne artikkelserien handler om statistisk behandling av kalibreringsresultatene. I den første artikkelen så vi på hvordan estimere en populasjon basert på en eller flere stikkprøver (utvalg). I denne artikkelen tar vi for oss den grafiske presentasjonen av innsamlede data ved kalibrering. Du får informasjon om hvordan vi beregner sentralverdien for en måleserie, og hvorledes vi kan uttrykke spredningen (variasjonen) av måleserien. Basert på sentralverdiene tegner vi opp en graf. Den neste artikkelen har kalibreringskurve (lineær regresjon) som hovedtema. Dette er en teknikk for å estimere verdien av koeffisienter for en rett linje (Y a 1 x + a 0). Den fjerde artikkelen tar for seg tilpasning, det vil si hvor godt vår kalibreringskurve er tilpasset verdiene vi fant ved kalibreringen. Vi bestemmer en korrelasjonskoeffisient (R 2 ). Den femte, og sannsynligvis den siste artikkelen for denne gang, tar for seg et usikkerhetsintervall (Confidence interval) som vi legger rundt linjen. Den neste måleserien (kalibreringen) vil med 95 prosent sannsynlighet ligge innenfor dette usikkerhetsintervallet. Vi kommer også innom «Prediction Interval». Kalibrering Kalibrering handler om tillitt, og oftest mellom selger og kjøper. Instrumenter som har gal eller uakseptabel instrumentrespons gir feilmålinger ved salg, og produkter med feil kvalitet. Kalibrering er sammenligning av en instrumentrespons mot responsen fra en annet referanseinstrument med kjent måleusikkerhet. Kalibreringen bestemmer avviket mellom de to responsene. Figur 1: Et instrument er rekalibrert. Side 1

Vi har et scenario hvor instrumentresponsen, her representert med den svarte stiplede linjen er blitt endret. Instrumentresponsen er nå tilsvarende den svarte heltrukne linjen. Før vi foretok ny kalibrering, hadde vi relativ stor avlesningsfeil (forskjell mellom rød stiplet linje og svart heltrukken linje). Etter kalibrering fikk vi etablert en ny estimert lineær linje, her representert med grønn heltrukken linje. Avlesningsfeilen i dette er tilfelle er innenfor toleransegrensene for linearitet og måleusikkerhet. Type A: Evaluering av måleusikkerhet Type A er en statistisk evaluering av instrumentresponser basert på en serie med observasjoner. En serie består av flere, uavhengige observasjoner av instrumentresponsen med de samme målebetingelsene, slik som vist i Figur 4. Noen begreper: elementer, utvalg og populasjon Det som særmerker statistikken er at den anvendes på fenomener hvor det inngår usikkerhet, og hvor man ønsker å ta hensyn til denne ved behandling av dataene. Usikkerheten er ofte et resultat av en har et begrenset antall tilfeller av et større antall som en vet lite om på forhånd. Grunnlaget for å få større viten er å foreta observasjoner (målinger) av de egenskapene ved instrumentet vi ønsker å undersøke. Vi utfører en rekke eksperimenter eller forsøk. Generelt kan vi si; Elementene, som typisk er avlesninger av instrumentresponsene, er «byggesteinene» i statistikken. En serie med observasjoner utgjør et utvalg. Antall elementer i utvalget kalles utvalgsstørrelsen, og betegnes med symbolet n. Gjør man flere serier (har flere måleserier), utgjør utvalgene en populasjon. En populasjon kan bestå av et bestemt antall utvalg, eller generelt sett et ubestemt antall utvalg. Populasjonsstørrelsen betegnes med symbolet N. Figur 2: Vi tenker oss et en populasjon (rødt område som vi for eksempel kan navngi Y 1 ) består av N 15 elementer. I dette eksemplet har vi fordelt elementene på 5 utvalg (oransje områder hvor vi tilsvarende kunne navngitt dem Y 1a, Y 1b, Y 1c, Y 1d, og Y 1e ). Vi håper at elementene (grønne prikker) i et utvalg har en egenskap som representerer egenskapen i populasjonen. Under en slik forutsetning er Side 2

det tilstrekkelig å teste egenskapene til et utvalg, for så å relatere dette til egenskapene for populasjonen. Da sparer vi både tid og krefter. Utvalgsstørrelsen er her n 3, i stedet for 15. Målet med våre undersøkelser er å komme frem til et utsagn (ligning) eller lovmessigheter som vi med en viss statistisk sannsynlighet kan ha håp om gjelder for hele populasjonen, selv om de bare bygger på undersøkelser av et utvalg. Innhenting av elementer (datapar) Vi skal nå innhente elementer, og danne utvalg og populasjoner. Vi tenker oss en mengdemåler som tidligere har gjennomført en omfattende kalibrering. I Microsoft Excel har vi satt kalibreringsdataene inn i en tabellform. Vi har kjørt til sammen fem serier, hver med N 15 enkeltkalibreringer. Første serie hadde en påtrykt strømningsrate på X 1 100,00 m 3 /h. Den første avlesningen ga en instrumentrespons på y 1.1 99,90 m 3 /h. Den andre avlesningen ga en instrumentrespons på y 1.2 100,05 m 3 /h. Den femtende avlesningen ga oss verdien y 1.15 99,86 m 3 /h. Denne prosedyren gjentok vi for strømningsratene X 2 300, X 3 500, X 4 700 og X 5 900 m3/h. De avleste responsverdiene fra instrumentet er satt inn i tabell 1. Den siste avlesningen av responsverdien fra instrumentet var y 5.15 899,64 m 3 /h. X 1 100,00 X 2 300,00 X 3 500,00 X 4 700,00 X 5 900,00 1 99,90 300,45 500,83 700,25 899,50 2 100,05 300,07 500,22 700,33 899,33 3 100,17 300,00 500,11 698,80 900,45 4 99,99 299,66 499,45 700,55 901,30 5 99,86 299,80 499,30 700,22 899,56 6 99,94 299,90 499,70 700,11 899,32 7 100,01 299,65 499,90 699,85 900,32 8 100,12 300,25 499,99 699,81 900,98 9 100,05 300,28 500,50 700,05 899,78 10 100,01 300,01 500,11 700,09 899,23 11 99,88 299,95 501,00 699,50 900,23 12 100,12 299,73 499,26 699,25 900,00 13 100,00 300,22 499,83 700,68 900,25 14 100,04 300,13 499,72 700,45 900,11 15 99,86 299,90 500,08 700,06 899,64 Tabell 1: Kolonnevis har vi de fem måleseriene. For hver måleserie ble det gjort N 15 avlesninger av strømningsraten. Side 3

Sub-populasjoner i stedet for populasjon I vårt tilfelle har vi nå tilsammen 75 datapar; 15 stykk for strømningsraten X 1 100 m3/h, 15 stykk for strømningsraten X 2 300 m3/h og så videre. For den videre statistiske behandlinger tar vi denne globale populasjonen og deler denne inn i fem sub-populasjoner. Figur 3: Fem sub-populasjoner, én for de frem kalibreringspunktene. Og hver sub-populasjon består av 15 datapar, det vil si 15 elementer. I en senere artikkelen skal vi se på fordelen av å dele en subpopulasjon inn i flere utvalg. Her vises at hver sub-populasjon er delt inn i utvalg med 3 elementer. Bestemme sentralverdien av en måleserie Når verdien av en målestørrelse bestemmes ved å ta en serie enkeltmålinger, er beste estimat av målestørrelsen tatt for å være det aritmetiske gjennomsnittet av enkeltmålingene. Vi kaller dette for sentralverdien ( i ) for populasjonen. Dermed, hvis observasjonene (avlesning av instrumentresponsen) av målestørrelsen, Y i, er y i, 1, y i, 2, y i, 3,..., y i, j,... y i, N, er det beste estimatet av Y i : µ Yi y i,1 + y i,2 + + y i,n N N 1 N y i,j j1 [1] For hver av kalibreringsratene bruker vi Excel-funksjonen Gjennomsnitt (tall1;tall2) for enkelt å beregne sentralverdien (aritmetisk gjennomsnitt) av populasjonen. Side 4

Figur 3: Excel-funksjonen GJENNOMSNITT(B2:B16) beregner sentralverdien for verdiene i celleområdet B2 til og med B16. Funksjonen er skrevet inn i celle B17. Videre; i celle C17 beregnes sentralverdien µ 2. I vår eksempel oppsummerer vi sentralverdiene slik: Sentralverdier (µ i ) for de ulike populasjonene (fremkommer i rad 17 i regnearket) µ 1 100 m 3 /h µ 2 300 m 3 /h µ 3 500 m 3 /h µ 4 700 m 3 /h µ 5 900 m 3 /h Tabell 2: Vi har kalkulert sentralverdiene for de fem populasjonene (måleseriene). Grafisk presentasjon av populasjonen (Y i ) og sentralverdien ( i ) for sub-populasjoner Excel kan grafisk presentere dataene fra vår tabell. Vi velger celleområdet [B2:B16] og klikker på menyen SETT INN, og velger KOMBINASJONSDIAGRAM. Diagrammet har jeg konfigurert; lagt på litt tekster på aksene, samt lagt inn en linje som representerer sentralverdien for µ 1 -populasjonen. Side 5

Instrumentrespons Instrumentrespons Kalibreringsrate X 1 100 m 3 /h 100,20 100,15 100,10 100,05 100,00 99,95 99,90 99,85 99,80 99,75 99,70 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Avlesning nummer... Figur 4: Grafisk presentasjon av responsdataene Y 1 fra mengdemåleren basert på en strømningsrate lik X 1 100 m 3 /h (sub-populasjon 1). Instrumentresponsene på y-aksen har små, tilfeldige variasjoner omkring sentralverdien µ 1. Vi har to typer av klassifisering av usikkerhetsbidrag; Type A og Type B. Ved Type A gjøres en serie med observasjoner hvor måleoppsettet ikke endres. Variasjonen av enkeltmålingene av en serie observasjoner, gjort under identiske betingelser, bestemmes ved bruk av en statistisk analytisk metode. Vi får altså tak i de eksterne usikkerhetene. Vi trenger med andre ord ikke kjenne til de interne kildene til usikkerhetene. Figurene 4, 5, 6 og 7 viser de grafiske presentasjonene av måleseriene for strømningsratene X 2 300, X 3 500, X 4 700 og X 5 900 m 3 /h. 300,60 300,40 Kalibreringsrate X 2 300 m 3 /h 300,20 300,00 299,80 299,60 299,40 299,20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Avlesning nummer... Figur 5: Grafisk presentasjon av responsdataene Y 2 fra mengdemåleren basert på en strømningsrate lik X 2 300 m 3 /h (sub-populasjon 2). Side 6

Instrumentrespons Instrumentrespons Instrumentrespons Kalibreringsrate X 3 500 m 3 /h 501,50 501,00 500,50 500,00 499,50 499,00 498,50 498,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Avlesning nummer... Figur 6: Grafisk presentasjon av responsdataene Y 3 fra mengdemåleren basert på en strømningsrate lik X 3 500 m 3 /h (sub-populasjon 3). Kalibreringsrate X 4 700 m 3 /h 701,00 700,50 700,00 699,50 699,00 698,50 698,00 697,50 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Avlesning nummer... Figur 7: Grafisk presentasjon av responsdataene Y 4 fra mengdemåleren basert på en strømningsrate lik X 4 700 m 3 /h (sub-populasjon 4). Kalibreringsrate X 5 900 m 3 /h 901,50 901,00 900,50 900,00 899,50 899,00 898,50 898,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Avlesning nummer... Figur 8: Grafisk presentasjon av responsdataene Y 5 fra mengdemåleren basert på en strømningsrate lik X 5 900 m 3 /h (sub-populasjon 5). Side 7

Elementvariasjon i en sub-populasjon Det neste vi skal se på et i hvilken grad det er variasjon i våre fem sub-populasjoner. Vi la Excel beregne dette for oss med funksjonen STAAV.P. Figur 9: Excel-funksjonen STDAV.P beregner standard avvik for en populasjon. Funksjonen er skrevet inn i rad 18 i vårt eksempel. Det beregnes verdien på ett standard avvik slik beskrevet av en normalfordeling (Gauss-kurve). Når variasjonen følger normalfordelingskurven, også omtalt som Gausskurven, vil cirka 68,3 prosent av populasjonen ligge innenfor et intervall begrenset av ett standardavvik. Standard avvik for populasjonen er kvadratroten av variansen. 2 1 N N (y i,j µ Yi ) 2 j1 [2] Side 8

Figur 10: Basert på normalfordelingskurven vil ca 95 prosent av elementene i populasjonen ligge innenfor ± 2 standardavvik (± 2). LCL (Lower Confidence Limit) definerer nedre grenseverdi, mens UCL (Upper Confidence Limit) definerer øvre grenseverdi i usikkerhetsintervallet. Vi kan oppsummere dette i en tabell slik: Utvidet usikkerhetsområde (CI 95 %) for de ulike populasjonene (dekningsfaktor z 1,96 2) U Utvidet usikkerhetsområde 2 Standard avvik µ 1 100 m 3 /h µ 2 300 m 3 /h µ 3 500 m 3 /h µ 4 700 m 3 /h µ 5 900 m 3 /h 0,09 0,23 0,49 0,48 0,59 LCL y1 UCL y1 LCL y2 UCL y2 LCL y3 UCL y3 LCL y4 UCL y4 LCL y5 UCL y5 µ 1-2 µ 1 + 2 µ 2-2 µ 2 + 2 µ 3-2 µ 3 + 2 µ 4-2 µ 4 + 2 µ 5-2 µ 5 + 2 100 0,18 99,82 100 + 0,18 100,18 300 0,46 299,54 300 + 0,46 300,46 500 0,98 499,02 500 + 0,98 500,98 700 0,96 699,04 700 + 0,96 700,96 900 1,08 898,92 900 + 1,08 901,08 Tabell 2: Kalkulasjon av øvre grenseverdi for usikkerhetsintervall (UCL: Upper Confidence Limit) og nedre grenseverdi for usikkerhetsintervall (LCL: Lower Confidence Limit) for hver av de fem subpopulasjonene. I dette tilfellet er omfatter usikkerhetsintervallet 95 prosent av måleserien. Side 9

Grafisk fremstilling av utvidet usikkerhet for en sub-populasjon Figuren illustrerer plasseringen av den øvre og nedre usikkerhetslinjen for måleserien kalibrering med X i 100 m 3 /h. UCL 100,18 X 1 100 LCL 99,82 Figur 11: Grafisk presentasjon av data for sub-populasjon 1. Vi har tegnet inn en normalfordelingskurve til høyre. De grønne linjene er 2 standard avvik fra populasjonens sentralverdi (gjennomsnittsverdi). Grafisk ser vi at alle våre (15) målepunkter ligger mellom UCL og LCL. Vår distribusjon av observerte data følger ikke en perfekt normalfordelingen. Teorien for en normal-fordeling er at enkeltverdier hyppigst forekommer ved eller nærheten av sentralverdien. Hyppigheten av enkeltverdier faller desto lengre vekk fra sentralverdien vi beveger oss. Overfor UCL og nedenfor LCL representerer i dette tilfellet 5 prosent av populasjonen, i og med at 95 prosent skal ligge innenfor. Dette kan vi uttrykke slik: CL 1- [3] I vårt eksempel er 0,05. 0,05 tilsvarer som kjent 5 prosent. Vi kan derfor uttrykke det slik: CL 1- CI 0,95 [4] Side 10

Trekke en linje gjennom sentralverdiene til de ulike populasjonene Vi trekker en linje gjennom tallparene (X 1, µ 1 ), (X 2, µ 2 ), (X 3, µ 3 ), (X 4, µ 4 ) og (X 5, µ 5 ) for de 5 subpopulasjonene. I vårt tilfelle vil dette være en tenkt rett linje da vi forutsetter linearitet i området X 1 til og med X 5. Figur 12: Vi kan tegne inn en tenkt rett linje som går gjennom sentralverdiene for hver subpopulasjon. For hver av datasettene har vi tegnet inn Gausskurven (røde kurver), som vi har oppskalert. Fra tabell 2: For eksempel så hadde vi for µ1 verdiene LCL y1 99,82 m 3 /h og UCL y1 100,18. I denne generelle figuren ser det ut som UCL y1 ligger rundt 150, mens LCL y1 ligger rundt 50. Legg for øvrig merke til at usikkerheten foreløpig kun er knyttet til y-verdiene. Linjen kan beskrives med følgende likning: μ y x a 1 x + a 0 [5] Den sanne gjennomsnittlige Y for en gitt verdi av x er lik koeffisienten a 0 pluss koeffisienten a 1 multiplisert med x. Koeffisienten a 0 har verdien lik det punktet linjen skjærer Y-linjen, og koeffisienten a 1 er stigningstallet (vinkelen) for linjen. Imidlertid, i praksis kjenner vi ikke populasjonen til X 1 100, X 2 300, X 3 500, X 4 700 og X 5 900 m3/h! Da måtte vi i så fall gjøre uendelig antall kalibreringer ( ) for hvert av X 1 og så videre; ikke nøye oss med N 15. Med referanse til Figur 1: Så langt i resonnementet har jeg betraktet et utvalg som hele populasjonen, og jeg skulle ikke nøyd meg med N 15! Og, vi kan derfor heller ikke tegne opp den tenkte rette linjen heller! Egenskapene til datasettet x 1,1 til x 1,15 tilsvarer ikke helt sikkert egenskapene til datasettet x 1,1 til x 1,. Side 11

Linjen vil i praksis alltid være omgitt av Type A usikkerheter; det vil si små, tilfeldige variasjoner (målestøy). Vi kan derfor estimere en linje, og denne uttrykker vi slik: Y μ y x + ε (a 1 x + a 0 ) + ε [6] Den estimerte verdien Y er lik den sanne verdien pluss en feilstørrelse lik ε. Den nye likningen omskrives slik: Y a 1 x + a 0 [7] Terminologi Uendelig a 0 Koeffisient. Har verdien y når x 0. a 0 Estimert koeffisient. Har verdien y når x 0. a 1 Koeffisient. Har verdien på stigningstallet til en rett linje a 1 Estimert koeffisient. Har verdien på stigningstallet til en rett linje CL Confidence Interval j Teller, vanligvis i forbindelse med et summasjonstegn LCL Lower Confidence Limit n Antall elementer i et utvalg N Antall elementer i en populasjon U Utvidet usikkerhet ( 2 Standard avvik) UCL Upper Confidence Limit x Variabel (inngangsstørrelse) X 1 Verdi på inngangsstørrelsen x X 2 Verdi på inngangsstørrelsen x X 3 Verdi på inngangsstørrelsen x X 4 Verdi på inngangsstørrelsen x X 5 Verdi på inngangsstørrelsen x Y 1 Navn på populasjon 1 Y 2 Navn på populasjon 2 Y 3 Navn på populasjon 3 Y 4 Navn på populasjon 4 Y 5 Navn på populasjon 5 y 1,1 - y 1,15 15 avlesninger på instrumentresponser når instrumentet påføres X 1 Y 2,1 y 2,15 15 avlesninger på instrumentresponser når instrumentet påføres X 2 Y 3,1 y 3,15 15 avlesninger på instrumentresponser når instrumentet påføres X 3 Y 4,1 y 4,15 15 avlesninger på instrumentresponser når instrumentet påføres X 4 Y 5,1 y 5,15 15 avlesninger på instrumentresponser når instrumentet påføres X 5 Y 1a Navn på et utvalg i populasjonen Y 1 Y 1b Navn på et utvalg i populasjonen Y 1 Y 1c Navn på et utvalg i populasjonen Y 1 Y 1d Navn på et utvalg i populasjonen Y 1 Y 1e Navn på et utvalg i populasjonen Y 1 Y Variabel. Innehar forventningsverdien. Side 12

Avlest instrumentrepons z Dekningsfaktor ( 1,96 2 når konfidensnivået er 95 prosent). Koeffisient. Innehar verdien på andelen av elementet som er over UCL og under LCL. ε Feil µ 1 Sentralverdi (aritmetisk gjennomsnittsverdi) av populasjon Y 1 µ 2 Sentralverdi (aritmetisk gjennomsnittsverdi) av populasjon Y 2 µ 3 Sentralverdi (aritmetisk gjennomsnittsverdi) av populasjon Y 3 µ 4 Sentralverdi (aritmetisk gjennomsnittsverdi) av populasjon Y 4 µ 5 Sentralverdi (aritmetisk gjennomsnittsverdi) av populasjon Y 5 µ Yi Sentralverdi populasjon Y i μ y x Den sanne gjennomsnittlige Y for en gitt verdi av x Standard avvik for en populasjon 2 Varians for en populasjon Standard avvik for populasjon Y 1 Standard avvik for populasjon Y 2 Standard avvik for populasjon Y 3 Standard avvik for populasjon Y 4 Standard avvik for populasjon Y 5 Neste artikkel.... I den neste artikkelen skal vi se på lineær regresjon. Dette er en metode for å estimere verdiene for koeffisientene a 0 og a 1 slik at den rette linjen har en optimal tilpasning til vårt datasett. Vi kommer også inn på interpolasjon, det vil si hvordan vi kan estimere verdien på inngangsstørrelsen x basert på kjennskap til den kalkulerte instrumentresponsen Y. Lineær regresjon ("Best fit"-linje) og interpolasjon 1000 900 800 700 600 500 400 300 200 100 0 0,00 200,00 400,00 600,00 800,00 1000,00 Strømningsrate Figur 13: Lineær regresjon Y a 1 x + a 0. Vi estimerer verdiene på koeffisientene a 0 og a 1 slik at en rett linje oppnår «Best fit» til våre datasett. Deretter kan vi interpolere slik at vi kan bestemme x-verdien ved kjennskap til en avlest instrumentrespons. Side 13