Anslag for usikkerhet av et sammensatt resultat basert på anslått usikkerhet ( feilmarginer ) for måleverdiene.

Like dokumenter
EN LITEN INNFØRING I USIKKERHETSANALYSE

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Oppgave 1. Bestemmelse av partielle molare volum

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Kapittel 1: Data og fordelinger

Statistikk og dataanalyse

Læreplan, nivå 1. Innhold / tema. Hovedområde Kompetansemål Elevene skal kunne: Tall og algebra:

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Oversikt. ST0202 Statistikk for samfunnsvitere

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

Angivelse av usikkerhet i måleinstrumenter og beregning av total usikkerhet ved målinger.

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Uncertainty of the Uncertainty? Del 3 av 6

Kjennetegn på måloppnåelse TALL OG ALGEBRA. Kunne plassverdisystemet for hele- og desimaltall

Et lite notat om og rundt normalfordelingen.

SAMMENDRAG OG FORMLER

Statistikk. Forkurs 2018

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Et lite notat om og rundt normalfordelingen.

Seksjon 1.3 Tetthetskurver og normalfordelingen

ST0202 Statistikk for samfunnsvitere

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Fagplan i matematikk for 9. trinn 2014/15. Faglærer: Terje Tønnessen

Statistikk. Forkurs 2017

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

LOKAL LÆREPLAN Matte Trinn 5

ÅRSPLAN I MATEMATIKK 17/18

TMA4240 Statistikk H2010 (20)

Statistikk for språk- og musikkvitere 1

Matematikk 5., 6. og 7. klasse.

Årsplan i matematikk 2017/ Trinn

Årsplan i matematikk 2016/2017

Kapittel 3: Studieopplegg

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Periode Tema Kompetansemål Læringsaktiviteter Vurdering Uke 34-38

Sannsynlighetsregning og Statistikk.

Forberedelseskurs i matematikk

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2018

Reelle tall på datamaskin

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

HALVÅRSPLAN I MATEMATIKK. VÅREN 2019 TRINN: 5

Forkurs i kvantitative metoder ILP 2019

HARALDSVANG SKOLE Årsplan 8.trinn FAG: Matematikk

Målenheter for vekt: tonn, kg, hg, g. Måling med omgjøring i km, m, dm, cm, mm. Måling med volum.

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Årsplan i matematikk 6.trinn Læreverk: MULTI Uke Kompetansemål i Tema Delmål Arbeidsmåte Vurdering

Se hvordan Hovseter ungdomsskole arbeidet før, under og etter gjennomføring av prøven.

KJ2050 Analytisk kjemi, GK

Målenheter for vekt: tonn, kg, hg, g. Måling med omgjøring i km, m, dm, cm, mm. Måling med volum.

Kapittel 1 Koordinatsystemet. godt Kommentarer. Kan. ganske godt. Kan. Kan litt. Kompetanseoversikt i matematikk, 4. trinn for: Klasse/gruppe:

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Årsplan i matematikk 6.trinn Læreverk: MULTI Uke Kompetansemål Tema Delmål Arbeidsmåte Vurdering

Årsplan i matematikk 6.trinn Læreverk: MULTI Uke Kompetansemål i Tema Delmål Arbeidsmåte Vurdering

Sentralmål og spredningsmål

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

KJ1042 Termodynamikk laboratoriekurs Oppgave 1. Partielle molare volum

Måleusikkerhet, bruk av kontrollkort og deltakelse i sammenliknende laboratorieprøvinger innen kjemisk prøving

2.3 Delelighetsregler

Side 1 Versjon

Læreplan i matematikk for samfunnsfag - programfag i studiespesialiserende program

plassere negative hele tall på tallinje

Lokal læreplan Sokndal skole. Fag: Matematikk Trinn: 5.trinn Lærebok: Grunntall 5A og 5B

Årsplan i matematikk, 5. klasse : Elevene bør øve/pugge lille og store addisjonsstabellen og multiplikasjonstabellen hver uke.

Årsplan i matematikk Trinn 9 Skoleåret Haumyrheia skole

Oppgavesett med fasit

Regning med tall og bokstaver

Tall. Posisjons-tallsystemer. Representasjon av heltall. Tall positive, negative heltall, flytende tall. Tekst ASCII, UNICODE XML, CSS

RENDALEN KOMMUNE Fagertun skole. Årsplan i matematikk for 5., 6. og 7. trinn 2018/19

Eksempel på data: Karakterer i «Stat class» Introduksjon

Mal for rapportskriving i FYS2150

ST0202 Statistikk for samfunnsvitere

Beskrivende statistikk.

KJ2050 Analytisk kjemi, GK

HARALDSVANG SKOLE Årsplan 8.trinn FAG: Matematikk

Introduksjon til statistikk og dataanalyse

Hva måler nasjonal prøve i regning?

Matriser. Kapittel 4. Definisjoner og notasjon

UNIVERSITETET I OSLO

MATEMATIKK. September

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Kapittel 1. Tallregning

TRINN 1A: Tallene 0-10

Oppgave 2. Bestemmelse av partielle molare entalpier

Transkript:

KJ053/gen. / 004/013 / S. 1 av 8 Anslag for usikkerhet av et sammensatt resultat basert på anslått usikkerhet ( feilmarginer ) for måleverdiene. (Pluss, kort, litt om statistisk usikkerhet - normalfordelt og ikke-parametrisk) Innen analytisk kjemi, inkludert kromatografi, skal alltid "påliteligheten"/ usikkerheten av resultatene bestemmes og rapporteres sammen med resultatene. Så langt som mulig gjøres det ved å kontrollere - nøyaktigheten (nærheten til "den sanne verdien") v.h.a. ulike kontroll-eksperimenter og - presisjonen (omfang av tilfeldige variasjoner av måleresultatene) v.h.a. gjentatte analyser som evalueres statistisk. For eksperimenter hvor resultatene ikke kan vurderes på grunnlag av gjentatte målinger er vanlige statistiske metoder ikke anvendbare. Derfor finnes ikke et skikkelig statistisk mål for data'enes presisjon. For resultatenes "pålitelighet" / usikkerhet må man da gi et anslag som, forhåpentligvis, er realistisk - på "godt og vondt". F.eks.: lengdemåling: usikkerhet for nøyaktigheten (korrekt lengdeskala av linjalen el.lign. i forhold til definisjonen på enheten (f.eks. ur-meteren i Paris, el. bedre), og usikkerheten ved avlesning (cm-, mm- el. 0,1-mm-skala, blott øye, forstørrelsesglass, mikrometer etc.). Situasjonen blir mer komplisert når et endelig resultat (et "sammensatt resultat"), Z, må beregnes ut fra flere ulike måleresultater, som det kun er utført enkelt-målinger for (f.eks. kan hastighetsmålingers pålitelighet være avhengig av usikkerheter i både lengde- og tids-målingene). Men det finnes metoder for å beregne et anslag for usikkerheten, Z, av et "sammensatt resultat". De bestemmer gjerne et slags "verste tenkbare tilfelle" for usikkerheten. år Z = Z(A,B,C,...) beregnes ut fra de forskjellige måledataene A, B, C... kan Z beregnes ut fra anslag for usikkerhetene (A, B, C,...) for disse måledata. Det sammensatte resultatet kan da rapporteres som Z ± Z. F.eks.: volum-måling ved bruk av formelen V = l x b x h. Estimeringen kan kompliseres, når ulike måleutstyr og -prosedyre må brukes til lengdemåling av gjenstandens ulike dimensjoner. Man er altså nødt til å anslå usikkerhetene A, B, C,... av de avleste ("ikke sammensatte") måledata ut fra det man synes om nøyaktigheten av målemetodene og -utstyr. Resultatet av denne vurderingen blir f. eks. A ± A, hvor A er den avleste verdien, A + A og A - A er henholdsvis den øvre og den nedre grensen for det man får, når mulige feil og usikkerheter legges til eller trekkes fra A. I praksis brukes både - absolutte feil (absolute errors) A, B, C,... Z og - relative feil (relative errors) A, B, C,.. Z. A B C Z (år relative feil rapporteres, oppgis de ofte som prosenttall).

KJ053/gen. / 004/013 / S. av 8 "Feilforplantingen" som skjer ved at del-målingenes usikkerheter "smitter over" på det sammensatte (slutt-) resultatet kan beregnes, og den samlede usikkerheten blir som følger : Z = ± { Z. A + Z. B + Z. C +...} (1) A B C Metoden er basert på partiell derivering m.h.t. de målbare parametrene A, B, C... av formelen Z = f (A, B, C,...) som brukes til beregningen av det sammensatte resultatet Z. Som nevnt blir da Z det verste tenkbare tilfelle", hvor alle antatte feil har slått ut i samme retning i resultatet Z. Utledning av ligning (1), med tilhørende partiell derivering, kan i en del tilfeller være litt komplisert. Men i mange tilfeller, der formelen for utregning av Z bare bruker de mest vanlige matematiske operasjonene, kan man anvende noen (rel. enkle) regler for å regne ut Z. Her gis regler for : - multiplikasjon og divisjon (inkl. regning med potenser), - addisjon og subtraksjon og kombinasjonen av disse. Multiplikasjon og divisjon : For multiplikasjon og divisjon beregnes den relative feilen av det sammensatte resultatet Z ved å addere de relative feilene til de enkelte faktorene: C...} () C F.eks.: Både for Z = A B og for Z = A / B blir Den relative feilen av Z blir like stor for begge operasjonene : summen av absolutt-verdiene til de relative feilene av h.h.v A og B. For regning med enkle eksponenter kan man vurdere saken som en multiplikasjon av like faktorer (jfr.eksempelet nedenfor). Mer generelt formulert kan man si at oppskriften er : å gange den relative feilen med absolutt-verdien til eksponenten. Det holder for multiplikasjon, regning med eksponent, ulike røtter, og til og med divisjon (eksponent = -1) :

KJ053/gen. / 004/013 / S. 3 av 8 For Z = A 3 (= A A A) blir For Z = = B ½ blir ½ For eksempel : for en ligning som: g = 4 L ( = 4 p L +1 T - ) T blir den relative usikkerheten for g : g = L + T g L T (4-tallet "eier" ikke usikkerhet, og antas å være brukt med det nødvendige antall sifre, slik at dens "unøyaktighet" blir neglisjerbar.) Addisjon og subtraksjon : år summer og differanser inngår i beregningen av Z benyttes Z, som er Z' s absolutte feil. Z er summen av de (absolutte) usikkerhetene av A, B, C,... Z = I A I + I B I + I C I +... (3) Den relative feilen til Z blir da : Z = I A I + I B I + I C I +... (4) Z For eksempel for en enkel sum eller differanse, A + B eller A - B, blir de absolutte feilene: Z = I A I + I B I. De relative feilene for henholdsvis sum og differanse blir som følger : Z A+B A B og Z (A + B) (A + B) Z (A-B) AB Z (A - B) (A - B) Legg merke til at relative feil for differanser blir større enn for summer av termer med sammenlignbar størrelse og usikkerhet : Summen av de absolutte feilene, som er lik for begge operasjonene, deles med en nevner, Z, som er mindre når den er en differanse enn når den er en sum. For differanser kan feilgrensen bli større en selve resultatet av subtraksjonen. Den nedre grensen av usikkerhets-intervallet blir da negativ, noe som enkelte ganger kan gi "meningsløse" resultater.

KJ053/gen. / 004/013 / S. 4 av 8 år utregningen av Z(A,B,C,...) krever både addisjon og/eller subtraksjon og multiplikasjon og/eller divisjon så "nøstes ligningen opp" innenfra (jfr. derivering, eller computer-programmering av formler): I eksempelet som er gitt nedenfor : Z = (A + B) + C (A - B) beregnes først de absolutte feilmarginene til summen og differansen av A og B. Disse regnes om i relative feil (av henholdsvis summen P og differansen Q). De benyttes videre for å finne usikkerheten av brøken (P/Q) ved oppsummering av relative feil. For beregningen av (den absolutte) usikkerheten Z i det endelige, sammensatte resultatet, Z, som igjen er en sum, omformes de relative usikkerhetene av h.h.v. denne brøken og C -termen til absolutte usikkerheter, som summeres. Eksempel: Utgangspunkt er en ligning som inneholder både multiplikasjon/divisjon og addisjon/ subtraksjon : Z = (A + B) + C (A - B) Først beregnes de absolutte feil til henholdsvis summen og differansen i den første termen (A + B) = (A - B) = A + B deretter beregnes de relative feilene P/ P og Q/ Q for henholdsvis teller P og nevner Q: P A+B A B P (A + B) (A + B) Q (A-B) AB Q (A - B) (A- B) Usikkerheten i brøket fås nå ved å summere de relative feilene av teller og nevner : ( P / Q ) = A B + AB = P + Q ( P / Q ) (A + B) (A - B) P Q Til slutt adderes de absolutte feilene av de to summandene "P/Q" og C : Z = ( P / Q ). (P/Q) + ( C C ) ( P / Q ) C Ønskes den relative feilen, deles Z med Z.

KJ053/gen. / 004/013 / S. 5 av 8 I løpet av kromatografikurset er det flere oppgaver hvor et anslag for usikkerheten av et endelig (sammensatt) resultat kan, bør eller må finnes ved hjelp av disse reglene. De data man har målt vurderes da med hensyn til antatt nøyaktighet, og så å bestemmes/utregnes "påliteligheten" av sluttresultatet. F. eks. : - RF-verdier i tynnsjikt- og papir-kromatografi, - utbyttene i søylekromatografi, - fordelingskoeffisientene i gelfiltreringen, - retensjonstider ved kvalitative analyser (identifisering). - høyde- og/eller areal-målinger ved integrering /kvantifisering. B. : For beregning av feilforplanting av statistisk sikrede malinger benyttes "delvis lignende" formler. Der benyttes da bl.a. varians, eller standardavvik, som mål for presisjonen - jfr. f.eks. lærebøker i analytisk kjemi eller statistisk analyse / behandling av data. øyaktigheten estimeres/bestemmes (helst) eksperimentell med kontroll-eksperimenter (kvalitetskontroll / kvalitetssikring).

KJ053/gen. / 004/013 / S. 6 av 8 oen enkle betraktninger om usikkerhet ( feilmarginer ) av resultat basert på gjentatte målinger. år statistisk signifikante antall uavhengige målinger kan skaffes er dette praktisk talt alltid å foretrekke framfor usikkerhets-estimering som beskrevet ovenfor. Usikkerheten av enkeltmålingen består da av de to komponentene presisjon (repeterbarhet, reproduserbarhet) og nøyaktighet (den siste omtales ikke videre her). Reproduserbarhet 1 1. omalfordelte data Et mål for presisjonen fås fra gjentatte uavhengige målinger av samme egenskap. Som det best mulige måleresultat brukes så den aritmetiske middelverdien (gjennomsnittet) av målingene x : x i 1 x i x i = i-te (analyse-)resultat, = antall data (målinger, resultater) Ofte brukes Standardavvik og dermed forbundne begrep (relativ standardavvik, varians, konfidensintervall) for å uttrykke presisjonen (eller målingens/egenskapens statistiske usikkerhet). Bruk av aritmetisk middelverdi og standardavvik forutsetter at enkeltmålingers tilfeldige variasjon følger et mønstre som tilsvarer (statistisk) en normalfordeling. Da beregnes standardavviket som følger : s i1 1 x x x = middelverdi av dataene x i, eller (litt omformet) i 1 Kort elementær innføring : f.eks. F.J. Langmyhr Elementære statistiske metoder for kjemisk analyse, Universitetsforlaget AS, Oslo 1987. Formelen som er oppgitt for standardavviket her, gjelder for tilfeller der vi bare har et utvalg av data (eller målinger) til å regne på og må bruke det begrensede antall for å anslå hva standardavviket ville blitt om vi kunne ha regnet med (målt på) alle data som inngår i den datamengden vi ønsker å beskrive.

KJ053/gen. / 004/013 / S. 7 av 8 x x 1 og relativ standardavvik: (som oftest i %) s r s 100 x år standardavvik beregnes ut fra et begrenset antall måling, så blir også verdien av standardavviket usikker. Dette kan tas hensyn ved bruk av konfidens-intervaller (jfr. litteratur om det emnet). Alternativ minimal-løsning (obligatorisk minstekrav) er å oppgi antall data/målinger som ligger til grunn for standardavvik-beregningen. Et resultatet bør da rapporteres som : x (s, ). Det gir uttrykk for hvor (statistisk) usikker én enkel måling er/blir. Som regel er også selve middelverdien usikker 3 : fordi det også er tilfeldig hvilket utvalg av enkelt-tall en har fått i et begrenset antall målinger for å utregne middelverdien ut fra. Usikkerheten av middelverdien er lavere enn for enkeltmålingene, og den blir også mindre jo flere data vi kan bygge gjennomsnitsberegningen på. Middelverdiens standardavvik er : s s M i1 x x i 1 (Også her kan / bør konfidensgrenser/-områder være alternativer.) For diskusjon av forplanting av tilfeldige feil / presisjon i sammensatte resultater jfr. litteratur (f.eks. J.C.Miller & J..Miller, Statistics for analytical chemistry, Ellis Horwood Ltd., Chichester 1993 (3. utg.). I den, men f.eks. også i referansen i fotnote 1, diskuteres også de viktige vurderingene av feil-/usikkerhets-forplanting i forbindelse med regresjonsregning (spesielt lineær regresjon). 3 Unntaket er når middelverdien utregnes av alle (nøyaktige) tall som utgjør datamengden, og vi ikke bruker et begrenset (forhåpentligvis (men ikke sikkert) representativt) utvalg av data til å anslå middelverdien for Den store helheten.

KJ053/gen. / 004/013 / S. 8 av 8 Det finnes ofte andre enn normalfordelte data; da er en mulig metode å unngå feilaktig forhåndsinntatte analyser (d.v.s. feilaktig forutsatt normalfordelte data) ved å bruke følgende:. Ikke-parametriske analyser Som et alternativ - som ikke forutsetter et bestemt mønster i dataene (som f.eks. normalfordeling o.l.) - er bruk av såkalte ikke-parametriske uttrykk for presisjon økende, spesielt for initial data analysis (= foreløpig (?) dataanalyse ) i tall eller grafisk (og godt hjulpet av datamaskinen) ): Alternativ til gjennomsnitt : Istedenfor den aritmetiske middelverdien fra normalfordelingen brukes Medianen: Dataene ordnes etter størrelse, og medianen er verdien av den midterste målingen (for oddetalls antall data) eller gjennomsnittet av de to midterste tallene (for like-talls antall data). For dispersjon (spredning) Som erstatning for standardavviket brukes i de ikke-parametriske statistiske metodene det såkalte interkvartil-område (interquartile range): år hver halvparten av de ordnede data, som er delt opp av medianen deles igjen i to deler etter de samme reglene blir de nye delings-punktene kalt for øvre og nedre kvartiler (upper & lower quartiles) og området mellom dem interkvartil-området (interquartile range). Data blir ofte presentert som five-number summary ( fem talls -sammendrag): Laveste verdi - nedre kvartil - median - øvre kvartil - høyeste verdi. eller grafisk som Box and whisker plot : Laveste nedre - median øvre høyeste. verdi kvartil kvartil verdi Metoden er meget enkelt å bruke, den er robust mot utbryter -målinger ( outliers, som ofte kan bli et stort problem i parametriske metoder) og det er lett å oppdage om det foreligger symmetriske (normale) eller asymmetriske (f.eks. log-normale) fordelinger. (Figuren ovenfor antyder en viss asymmetri, som ikke villes vises ved normalfordelings-analyse - som forutsetter symmetrisk fordeling). En kort innføring i ikke-parametriske metoder finnes også i, bl.a., J.C.Miller & J..Miller, Statistics for Analytical Chemistry, Ellis Horwood Ltd., Chichester 1993 (3. utg.).