Validering av analysekvalitet, Del 1. Tester og riktighet



Like dokumenter
Godkjent av: Godkjent fra: Gerd Torvund. Gerd Torvund

Ordinær lineær regresjon (OLR) Deming, uvektet og vektet

VERIFISERING AV STORE ANALYSESYSTEMER

Test av riktighet med NFKK Reference Serum X utført i danske, islandske og norske laboratorier

IQC/metodevalidering: Kartlegging av impresisjon og middelverdi (target).

Databehandlingen for de ovennevnte EKV programmene blir utført på samme dataprogram, og utseendet av rapportene blir derfor tilnærmet likt.

Måleusikkerhet, bruk av kontrollkort og deltakelse i sammenliknende laboratorieprøvinger innen kjemisk prøving

CLSI Verification of Comparability of Patient Results Within One Health Care System; Approved Guideline Appendix B. NKK workshop 2013 Pål Rustad

HbA1c Kvalitetskrav. Diabetesforum 2015 Oslo, den 22. april 2015

Mer om hypotesetesting

HbA1c Kvalitetskrav og enheter - hva skjer?

NKK-Workshop. Sveinung Rørstad, Fürst Medisinsk Laboratorium

Hvordan forbedre EKV-program som har metodespesifikk fasit?

HISTORIKK UTVIKLINGEN AV FAGET

Verifisering av PCR baserte metoder

NA Dok 26C Krav til kalibrering og kontroll av volumetrisk utstyr for akkrediterte prøvingslaboratorier

Analysekvalitet på urinalbuminanalysen

Nasjonal holdbarhetsdatabase

Validering og verifisering av metoder innen kjemisk prøving. Akkrediteringsdagen 2. desember 2015

Nasjonalt prosjekt for standardisering. av holdbarhetsforsøk

Kvalitetskontroller fra Radiometer

Krav til analysekvalitet Forslag til fremgangsmåte

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

VALIDERING / VERIFISERING AV KLINISK KJEMISKE ANALYSER. Klinisk nytte praktisk egnethet analytisk kvalitet

Side 1 Versjon

Nasjonal protokoll for holdbarhetsforsøk

Krav til analysekvalitet sett i sammenheng med Ekstern Kvalitetsvurdering (EKV)

Løsningsforslag til obligatorisk innlevering 3.

EQAnord Hemolyseprosjekt

NA Dok. 26b Dokumentets tittel: Krav til kalibrering og kontroll av termometre for akkrediterte laboratorier.

6.2 Signifikanstester

ALM-MB Valideringsrapport av P-PTINR med STA- SPA 50 + analysert på STA-R Evolution

Kan vi stole på resultater fra «liten N»?

Kapittel 3: Studieopplegg

HØGSKOLEN I STAVANGER

Kort overblikk over kurset sålangt

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Fagbioingeniør Kirsti Holden

Medisinsk biokjemi, 2 nivå Utsendelse

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Akseptgrenser. De grenser et EKV-resultat bør ligge innenfor for at resultatet skal vurderes som akseptabelt. Akseptgrenser i EKV

Statistikk og dataanalyse

Rapport for Native sera 2013

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Løsningsforslag Til Statlab 5

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Analytisk ved Biologisk Total RCV Klinisk Kjemi Variasjon Konsentrasjon Variasjon Variasjon p<0,05 intraindividuell [%] [%] [%] [%]

Kan laboratoriene stole på sine kontrollmaterialer?

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Nr. 46/108 EØS-tillegget til De Europeiske Fellesskaps Tidende KOMMISJONSDIREKTIV 1999/76/EF. av 23. juli 1999

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Mona Høysæter Fenstad, overlege AIT

Analytisk ved Biologisk Total Klinisk Kjemi Variasjon Konsentrasjon Variasjon Variasjon intraindividuell [%] [%] [%]

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Kunsten å velge riktig laboratorieutstyr

Klinikk for diagnostikk Avdeling for medisinsk biokjemi Seksjon Molde

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Valideringsrapport av P-APTT med STA- PTT A 5 analysert på STA-R Evolution og STA Compact

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Løsningsforslag, eksamen statistikk, juni 2015

Kalibreringskurver; på jakt etter statistisk signifikante datapar

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Holdbarhet av pasientprøver,

Statistikk for språk- og musikkvitere 1

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

NGU Rapport Kulemøllemetoden Erfaringer fra ringanalyser for bedømmelse av kravspesifikkasjoner til metoden.

Verdens statistikk-dag.

HØGSKOLEN I STAVANGER

Utfordringer knyttet til statistisk analyse av komposittdata

Sannsynlighetsregning og Statistikk.

Formelsamling i medisinsk statistikk

1 C z I G + + = + + 2) Multiplikasjon av et tall med en parentes foregår ved å multiplisere tallet med alle leddene i parentesen, slik at

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Nasjonale prøver i lesing, regning og engelsk på 5. trinn 2015

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Hvordan analysere måledata vha statistisk prosesskontroll? Side 2

HØGSKOLEN I STAVANGER

Samkjøring av instrumenter

Sentralmål og spredningsmål

NKKS RAPPORTVEILEDER FOR DEKS-PROGRAM

Nasjonale kvalitetsindikatorer

KOMMISJONSDIREKTIV 96/46/EF. av 16. juli om endring av rådsdirektiv 91/414/EØF om markedsføring av plantefarmasøytiske produkter(*)

Flytskjema. - for behandling av avvikende EKV-resultat. Gunn B B Kristensen, NKK møte Hva skal jeg snakke om?

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

UNIVERSITETET I OSLO

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

Nytt frå NKK og EKV rapportane

Lot-lot variasjon -bakgrunn og forslag til utførelse

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Repeterbarhetskrav vs antall Trails

HbA1c. Resultater fra ekstern kvalitetskontroll/noklus. Diabetesforum Oslo,

Rapport Rapport vedrørende Kvikksølvinnhold i. brosme, blåskjell og kongesnegl fanget. ved Skjervøyskjæret ved vraket av. lasteskipet Orizaba

Transkript:

Validering av analysekvalitet, Del 1. Tester og riktighet PÅL RUSTAD Fürst Medisinsk Laboratorium, Søren Bulls vei 5, N 105l Oslo (prustad@furst.no) Denne arikkelen gir en kortfattet fremstilling av noen av de vesentligste elementene i en metodevalidering for et klinisk kjemisk laboratorium. Emnene er basert på en "Standard Prosedyre" for metodevalidering som gjelder for vårt laboratorium. Det er her brukt betegnelsen «bruksstandard» (working standard []) for det mer vanlig brukte «kalibrator». I et senere nummer av Klinisk Kjemi i Norden vil presisjon, måleområde og måleusikkerhet bli omtalt i en egen artikkel (Del ). Takk til Heidi Steensland som har kommet med nyttige innspill til utformingen av artikkelen. Validering/verifiksjon Definisjon av validering [1]: Bekreftelse ved undersøkelse og fremskaffelse av objektive bevis, på at de spesielle krav for en spesifisert, antatt bruk er tilfredsstilt. (Objektive bevis: Informasjon som kan bevises sanne, basert på fakta fremskaffet ved observasjoner, målinger, forsøk eller på andre måter). Hvis reagens/bruksstandard for påvisning av en komponent er innkjøpt, skal metodene være validert av produsent før metoden valideres i laboratoriet. Dokumentasjon skal være tilgjengelig. I laboratoriet kan det dermed være tilstrekkelig å gjennomføre en forenklet validering (verifikasjon) for å kontrollere de mange forhold, både på instrument og reagenssiden som kan bidra til at målesystemet ikke virker optimalt. For validering som er vanskelig å utføre lokalt, f.eks. av interferenser, må man stole på de opplysninger produsenten gir. Hvis det ikke finnes opplysninger som anses nødvendige, må det kreves at produsentleverandør bidrar med informasjon i slike tilfeller. Klinisk Kjemi i Norden 4, 000 T test Den eneste hensikten med å gjennomføre en statistisk test er i grunnen å forvisse seg om at man ikke trekker slutninger fra data som er utilstrekkelige. Det er viktig å skille mellom signifikant (tydelig) og viktig avvik. Man kan få en hvilken som helst reell forskjell til å bli signifikant med mange nok data, men hvor viktig forskjellen er kan bare vurderes fra kvalitetsmål og har ingenting med statistikk å gjøre. Anta at det er gjort et forsøk hvor to middelverdier M l og M er beregnet basert på. hhv. n 1 og n målinger med standard avvik hhv. s 1 og s. Testen består i å finne ut om forskjellen mellom middelverdiene er tydelig (signifikant) forskjellig fra 0 (nullhypotesen, H 0 ) mot en alternativ hypotese (H l ), enten at det er signifikant forskjell (M l M ), at M l >M eller M l <M. Hvor tydelig, uttrykkes med signifikansnivået (p) som forteller hvor stor sannsynligheten er for at nullhypotesen forkastes når den er riktig (type 1 feil). Denne sannsynligheten bør være liten (alltid 0.05). Hvis det skal testes om det er signifikant forskjell, må absoluttverdien av denne, M l M, sammenlignes med standard avviket for forskjellen, (s 1 /n l +s /n ) ved å beregne forholdet mellom dem: Ml M / (s 1 /n l +s /n ). Hvis forskjellen utgjør mange standard avvik, er det stor sannsynlighet for at nullhypotesen må forkastes, dvs den absolutte forskjellen er reelt >0. Hvis standard avvikene hadde vært beregnet med mange resultater (>60) kan man i stedet for t benytte z (f.eks. gir p=0.05 en z verdi på 1.96 (z 0.975 ), dvs hvis forholdet over er >1.96, så er forskjellen signifikant på 5% nivå. Hvis forskjellen er beregnet med et mindre antall resultater, må den relevante t finnes i stedet. Med f=l0 (bruker f for frihetsgrader i stedet for n) må man i stedet for 1

å bruke Z 0.975 =1.96 bruke t l0, 0.05 =.3. Grunnen til at t>z, er at usikkerheten i det beregnede standard avvik øker når antall måleresultater minker. Det generelle uttrykket for signifikant forskjell på p nivå i forsøket skissert over, blir: M 1 M / (s 1 /n l +s /n )>t n1+n,p/ som blir M 1 M [n/(s 1 +s )] når n l = n (her forutsettes at E(s 1 )=E(s )=E(s) dvs. forventningen av s 1 og s er den samme). Hvis den alternative hypotesen (Hl) enten er at M 1 >M eller M l <M (ensidig test), vil uttrykket for signifikant forskjell bli M 1 M / (s 1 /n l +s /n )>t n,p (p/ over er erstattet med p). Et l p konfidensintervall er et intervall rundt den målte middelverdi som (i gjennomsnitt ved mange gjentagelser av testen) med sannsynligheten l p inneholder den sanne verdi. For eksempelet over er dette intervallet: M 1 M ± t n1+n,p/ (s 1 /n l +s /n ). Hvis forskjellen IKKE er signifikant på p nivå (0 er inneholdt i l p konfidensintervallet), men viktig (se «Analytiske mål» under), har man brukt for få data i forsøket. Hvordan man i et forsøk kan sørge for at en viktig feil blir signifikant? Hvis G er en viktig forskjell, må man, i et forsøk for å finne ut om forskjellen er så stor, passe på at man har et tilstrekkelig stort datamateriale (n) slik at en så stor feil blir signifikant på et ønsket nivå (p). Flg. relasjon gjelder i dette tilfellet: G>t n1+n,p/ (s 1 /n l +s /n ). Hvis n l =n =n og s 1 =s =s, fås n>x[t n,p/ xs/g]. Eksempel Man ønsker å teste om det er forskjell mellom to lot'er av bruksstandard ved å måle begge annen hver en i en serie med det samme antall av hver (n). Anta at innen serie variasjonen er ca. % (s), det tillates en forskjell på 3% (G), signifikansnivå velges til p=0.05. Da fås n>x[t n,p/ x0.0/0.03] som gir n=5 dvs. 5 stk av hver bruksstandard vil være tilstrekkelig til at en feil på 3 % skal bli signifikant på 5% nivå. Analytisk kvalitet Riktighet Definisjon: Grad av overensstemmelse mellom gjennomsnittlig verdi fremskaffet fra en stor serie måleresultater og en sann verdi []. Kvantitativt uttrykkes riktighet ved bias eller systematisk feil. Som et mål for systematisk feil (B) når den analytiske variasjonskoeffisient CVa er ubetydelig og total biologisk variasjon er CVt (= (CVw +CVb ) der CVw og CVb er hhv. intraog interindividuell biologisk variasjon), kan denne inndelingen være nyttig [3]: Optimalt: B < 0,15 x CVt, ønskelig: B < 0,50 x CVt, minimum: B < 0,375 x CVt. Hvis samme komponent måles på ulike instrumenter innen et laboratorium, foreslås flg. kriterium for akseptabel forskjell [3]: B<CVw/3. Definisjon av sporbarhet: Egenskap for et måleresultat eller verdi for en standard som gjør at den kan relateres til angitte referanser, vanligvis nasjonale eller internasjonale standarder gjennom en ubrutt kjede av sammenligninger, alle med angitt usikkerhet [1]. Legg merke til at sporbarhet er etablert hvis «måleresultatet kan relateres til angitte referanser», det er altså ikke nødvendig å ha korrigert en evt. systematisk feil for at måleresultatet skal være sporbart. Ved usikkerhetsberegninger for måleresultatet forutsettes imidlertid at alle kjente systematiske feil er korrigert (se «Standard/ekspandert usikkerhet» i neste artikkel). Test ved bruk av sertifisert referansemateriale Definisjon: Referansemateriale: Et materiale eller stoff hvor en eller flere egenskaper er tilstrekkelig godt kjent til å kunne brukes for kalibrering av utstyr, vurdering av en målemetode eller for å bestemme verdier på materialer [1]. I korthet betyr «sertifisert» at verdiene for referansematerialet skal være funnet ved teknisk gyldig målemetode med angitt sporbarhet og usikkerhet. Eksempel: Anskaff et sertifisert referansemateriale med oppgitt verdi (OV) og mål konsentrasjonen på en slik måte at usikkerheten i resultatet er tilstrekkelig lav. Mål prøven i N (f.eks. 10) replikater i ulike serier. Beregn middelverdi (M) og standard avvik (s) for de N målingene. For Klinisk Kjem i Norden 4,000

skjellen mellom oppgitt verdi og den målte verdi, D=M OV, er et uttrykk for den systematiske feil for metoden ved denne konsentrasjonen med standard usikkerhet ud= (uov +s /N) der uov er angitt/beregnet standard usikkerhet for OV (som skal være oppgitt for et sertifisert referansemateriale). Forskjellen er signifikant hvis M OV > (uov +s /n)xt n 1,p/. Test mot referansemetode eller annen metode. En meget vanlig og god metode for å teste overensstemmelse med annen metode, er å velge ut et antall prøver jevnt fordelt i hele måleområdet, måle dem med begge metoder, plotte dataene i et xy diagram med verdier for referansemetode på x akse og den andre metodens verdier på y aksen (eller differansen mellom dem, da kalles det et differanseplott). Hvis antall prøver som måles på begge metoder er større enn ca 5, kan man bruke regresjonsmetoder for å beregne parametre for systematiske (helning og skjæringspunkt) og tilfeldige forskjeller (variasjon rundt regresjonslinjen i form av for eksempel s y/x ). Det finnes mange typer regresjonsmetoder, alle med sine fordeler og ulemper. De viktigste er: Standard minste kvadraters metode: Beregner regresjonslinjen slik at summen av de kvadrerte avvikene (i y retning) fra regresjonslinjen er minimert. Antar normalfordelte og konsentrasjonsuavhengige avvik og usikkerhet bare i y verdier. Finnes tilgjengelig i Excel regneark. Veiet minste kvadraters metode: Som over, men usikkerhet varierer med konsentrasjon. I prinsippet kan man selv angi usikkerheten i hele måleområdet, men det vanlige er å anta konstant variasjonskoeffisient. Demings metode: Antar usikkerhet både i x og y verdier (man kan også bruke veiet Demings metode). Passing og Bablocks metode: Prinsippet er at man finner regresjonslinjens helning ved å beregne median av alle mulige kombinasjoner av linjer mellom to og to punkter. Skjæringspunktet med Klinisk Kjem i Norden 4,000 y aksen finnes ved å legge linjer gjennom alle punkter med helning som funnet foran og beregne medianen av alle skjæringspunktene med y aksen. Fordelen med denne metoden er at punkter som avviker mye fra resten får liten innvirkning på resultatet. Metoden er tilgjengelig i for eksempel statistikkprogrammet Analyse It (http://www.analyse it.com/info/genstat.htm). Av disse 4 metodene er de tre første såkalte parametriske metoder fordi teorien forutsetter normalfordelte avvik fra regresjonslinje, mens den siste (Passing/Bablock) ikke forutsetter dette og derfor kalles en uparametrisk metode. I de fleste sammenhenger anbefales enten (veiet) Deming eller Passing og Bablocks metode. Mye viktig informasjon kan hentes fra et slikt plott f.eks.: Særlig avvikende punkter kan tyde på interferenser eller molekylære isoformer, ikke lineær sammenheng tyder på problemer med standardkurven for minst en av metodene, skjæringspunkt med y aksen forskjellig fra 0 prøve kan tyde på matriksproblem for blind eller en konstant interferens, avvik for helning kan tyde på gal verdi på minst en av bruksstandardene, stor spredning rundt regresjonslinje (men god presisjon for begge metodene), kan bety at komponentene som måles i metodene kan være noe forskjellige osv. Man bør vurdere om sammenhengen er lineær, evt. om helning og skjæringspunkt er signifikant forskjellige fra ideelle verdier (1 og 0). Se for øvrig [4] for nødvendig antall prøver for at spesifiserte krav (forskjeller) skal bli signifikante ved bruk av ulike regresjonsmetoder. Testing ved tilsetting av ren komponent til prøve («spiking») Hvis ren komponent er tilgjengelig, kan denne tilsettes aktuell matriks, måle prøve med og uten tilsatt komponent, og finne hvor stor mengde av det tilsatte som «gjenfinnes» (recovery) ved analyse. Finner man igjen 100% av tilsatt mengde, er dette en god indikator på at man ikke har systematiske feil for analysen, men konstante feil (som ikke varierer med konsentrasjonen) kan ikke påvises med et slikt forsøk. Eksempel: Del en prøve (helst lav konsentrasjon) i to og tilsett kjent mengde (T) komponent til en 3

av dem. Prøve med og uten tilsatt komponent analyseres 5 ganger innen serie, og test utføres på differansen mellom middelverdiene. T test for forskjell mellom middelverdier benyttes. Man tester om forskjellen mellom middelverdiene med (Ma) og uten (Mo) tilsatt komponent er signifikant (p=0.05) forskjellig fra tilsatt mengde: Ma Mo T /s (/n)>t n,0.05 der n=5 og t 8,0.0.05 =.306. I dette tilfellet er forskjellen signifikant når forskjellen er > 1.46s. Man kan beregne % gjenfinning (recovery) etter formelen 100x(Ma Mo)/T. 100% er ideelt. For at gjenfinning skal være signifikant forskjellig fra 100% på p nivå, må gjenfinning ligge i intervallet: 100%±t n,0.05 xs (/n)/t (bare en omforming av formelen for konfidensintervall) eller i tilfellet over: 100 ± 146s/T. Hvis innen serie %CV er 1.0%, vil en gjenfinning mellom 98.5 og 101.5 % ikke være forskjellig fra 100 % på 5 % (signifikans) nivå. Linearitet Det kan være et problem å få testet hele måleområdet ved å sammenligne reelle prøver med referansemetode. Ved å velge en høy og en lav prøve, lage fortynninger ved å blande disse og måle dem, vil man på en enkel måte kunne få et klart bilde av lineariteten for analysen. Eksempel: Velg en lav og en høy prøve, fortynn disse med hverandre til f.eks. 5 konsentrasjoner jevnt fordelt i måleområdet og mål disse i en serie. Plott resultatene og vurder lineariteten (f.eks. ved regresjonsanalyse her testes ikke om dataene er lineære, dette gjøres ved visuell inspeksjon). Interferenser Matriks Definisjon: Alle komponentene i en prøve, unntatt komponenten. Der skal angis hvilke matrikser (prøvetyper) som er aktuelle for metoden. Det bør enten sannsynliggjøres at de aktuelle matrikser er av liten betydning for analyseresultatet, eller utføres forsøk for å finne det ut. Interferens (spesifisitet) Definisjon: Systematisk feil som følge av at komponenter i prøven andre enn komponenten påvirker analyseresultatet. Data om interferens hentes hovedsakelig fra reagensprodusentens valideringsdata, men kan være aktuelt å utføre ved laboratoriet i spesielle tilfeller. Eksempel: Tilsett kjent mengde interferent til en prøve. Prøve med og uten interferent analyseres 5 ganger innen serie, og test utføres på differansen mellom middelverdiene. T test for forskjell mellom middelverdier benyttes. Man tester om forskjellen mellom middelverdiene med (Mi) og uten (Mo) interferent er signifikant (p=0.05) forskjellig fra 0: Mi Mo /s (/n)>t n,0.05 der n=5 og t 8,0.05 =.306. I dette tilfellet er forskjellen signifikant når forskjellen er >1.46s. Man kan beregne gjenfinning etter formelen 100xMi/Mo. 100% er ideelt. Intervallet i % for IKKE signifikant forskjell fra 100 er: 100±146s/Mo. Man bør angi hva som anses som viktige forskjeller. Man bør angi eller henvise til dokumentasjon som omhandler interferenser og viser deres innflytelse på analyseresultatet. Holdbarhet Holdbarhet er ikke direkte relatert til måleprosessen, men tas med her. Holdbarhetstest l (enkel): Hvis prøvene kan oppbevares under betingelser hvor man vet de er holdbare (f.eks. frosset), kan n prøver (f.eks. 5) hver deles i to, en del oppevares slik at den er holdbar (0 prøven) og en del oppbevares i det tidsrom og under de betingelser som skal testes ut (test prøven). På analysedagen måles 0 prøvene og test prøvene sammen i en serie. Beregn gjennomsnittlig forskjell mellom testprøvene og 0 prøvene: M Mo. Hvis innen serie variasjon er s (hentes fra annen kilde enn fra selve forsøket), vil forskjellen være signifikant på p nivå hvis M Mo /s (/n)>z l p/ (bruker z i stedet for t fordi s er hentet fra annen kilde og har antatt sikker verdi, dvs n er stor). Holdbarhetstest : Man kan benytte buksemetoden slik den er beskrevet i [5]. 4 Klinisk Kjem i Norden 4, 000

Man bør ha gjort seg opp en mening om hvilken endring som er viktig (se «Analytiske mål») og beregne nødvendig antall prøver i forsøket. Holdbarhetsdata kan hentes fra litteraturen. I tilfeller der slike data er ufullstendige, eller ikke relevante, skal holdbarhet testes. Litter atur 1. Kvalitetsledelse og kvalitetssikring. Terminologi. NS ISO 840. utgave oktober 1994.. VIM: «International vocabulary of basic and general terms in metrology», 1993, (BIPM, IEC, IFCC, ISO, IUPAC, IUPAP, OIML). 3. General strategies to set quality specifications for reliability performance characteristics. C.G. Fraser. Scand J Clin Lab Invest, Vol. 59, No. 7, Nov. 99. 4. Kristian Linnet. Necessary Sample Size for Method Comparison Studies Based on Regression Analysis. Clin Chem 45:6, 88 894 (1999). 5. "Buksemetode". Sample stability: A suggested definition and Method of determination. Thiers et. al. Clin. Chem. /, 176 83 (1976). 6. Statistiske vurderinger ved endring av analysemetode. Lars Mørkrid. Klinisk Kemi i Norden, nr, vol 10, 1998