Data Quality Perspectives. Various roles from arkivdanning to arkivbevaring



Like dokumenter
Datakvalitet og Noark

Hva er datakvalitet? Hvordan skal arkivtjenesten forholde seg til det?

Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland

Er Noark 5 og Datakvalitet det neste steget for depot? Thomas Sødring thomas.sodring@jbi.hio.no /

Oppgave 1a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet.

Bevaring av fagsystem og Noark 5

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

ARK2200-H18 - Digital arkivdanning og -bevaring II. Mappeeksamen

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

Å lage Noark 4 uttrekk selv. Thomas Sødring thomas.sodring@jbi.hio.no /

og effektiv earkivforvaltning

Kommunale, digitale depot i endring Trøndelagsmodellen. Kari.Remseth@ika-trondelag.no

NOARK Hva? Fra: Wikipedia, den frie encyklopedi

Noark med fokus på innhold og typografi

Del 3: Noark 5-basert databasestruktur

Registrering av e-post e-postrekker og dokumentbegrepet. Norsk arkivråds høstseminar Øivind Kruse Arkivar, Riksarkivet

Emneevaluering GEOV272 V17

Noark 5-godkjenning av sak/arkiv-system. Erfaringer fra systemleverandør.

Hva jeg skal snakke om

Noark-5. KDRS Petter Pedryc

To RDF or not to RDF Fagdag om Noark 5 og RDF

Hvordan kvalitetssikre åpne tidsskrift?

Kan RDF være en del av løsningen i arbeidet med å ta vare på fagsystem fra offentlig sektor? Thomas Sødring HiOA

Autentiske data hva er det og hvordan sikres det?

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

<Digitale_arkiver>fra A til #??A_#%,&</Digitale_arkiver> Digitale arkiver fra A til Å

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

Hvordan tenkes og jobbes det i dataindustrien til tema som bevaring og avlevering av earkiv til arkivdepot institusjoner

Fra produksjonsmiljø til bevaring - produksjonslinje for earkiv. v/sigve Espeland og Harald Nordli

IKT-sikkerhet for arkivarer. Kristine Synnøve Brorson

Erfaringer og tanker etter utvikling av et N4 uttrekksmodul

BLIR DET ENDELIG ORDEN PÅ DE ENORME DATAMENGDENE? Sett i lyset av Arkivverkets forslag om earkiv

Rapporterer norske selskaper integrert?

Uttrekk fra elektroniske arkiver

Public roadmap for information management, governance and exchange SINTEF

Digitization of archaeology is it worth while?

Feilmelding Årsak Løsning

Validering Noark 5-uttrekk Gjemnes kommune etter innlevering til Digitalt Depot IKAMR Torbjørn Aasen, IT-rådgiver

Hva har NOARK5 å bety for arkivet? Tormod Engebu, IKT-Rådgiver IKAVA

Kunnskapsinfrastruktur for forskningsdata i Norge

White paper. e-arkiv

Trash in, trash out Hvorfor er kvaliteten viktig? 18. okt 2018 // Silje Emilienne Aanderud-Larsen

Deponering og avlevering

Innspill til utvalget for endring av arkivloven. Camilla Knudsen Tveiten

GODKJENT NOARK UTTREKK OG FORMIDLINGSLØSNINGER FOR KOMMUNALE FAGSYSTEM 14/06/2013. Documaster skanning og arkiv IKA Rogaland -30.

Fagsystemer. Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

ARK Digital arkivdanning og -bevaring II Mappeeksamen. Eksamen består av fire deler

Skjema for spørsmål og svar angående: Skuddbeskyttende skjold Saksnr TED: 2014/S

Hvorfor ny versjon av Noark?

Social Project Management. CIO Konferansen Prosjektstyring 09. juni 2016

Forskningsrådets rolle som rådgivende aktør - innspill til EUs neste rammeprogram, FP9 og ERA

Eksamen ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister. Nynorsk/Bokmål

GEOV219. Hvilket semester er du på? Hva er ditt kjønn? Er du...? Er du...? - Annet postbachelor phd

Automatisering av uttrekk fra bevarte databaser

TRONDHEIM? Fagdag i Riksarkivet

Den europeiske byggenæringen blir digital. hva skjer i Europa? Steen Sunesen Oslo,

Arkivplan - internkontroll

REGIONALT ARKIV TRØNDELAG - ET PROSJEKTFORSLAG

Samdok konferansen 2013 Fra digital arkivdanning til digitalt depot i kommunene Tor Eivind Johansen, daglig leder KDRS

Periodisering Petter Pedryc

SAMMENDRAG.

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

Velkommen til Riksarkivarens undersøkelse for kommunale arkivtjenester 2015 (Storbyundersøkelsen)

7 years as museum director at the Röhsska Museum, Göteborg. since February 2012 the museum director at the Sigtuna Museum, Sthlm

Åpen Noark 5 kjerne i praksis Kontaktkonferanse IKA Møre og Romsdal 24. mai 2013

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

FME-enes rolle i den norske energiforskningen. Avdelingsdirektør Rune Volla

Elektronisk arkiv - hva er det? Karin Amalie Holmelid kaho@hib.no Arkivleder/leder for Dokumentsenteret ved Høgskolen i Bergen

TDT4117 Information Retrieval - Autumn 2014

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Dokumentfangst i praksis

Hvordan ser pasientene oss?

Slope-Intercept Formula

Risikostyring i et samfunnssikkerhetsperspektiv. Terje Aven Universitetet i Stavanger

EKSAMENSOPPGAVE I SØK 1002 INNFØRING I MIKROØKONOMISK ANALYSE

Digitalt depot. Instruks deponering

Innsynsløsningen til bergen byarkiv

DIAS - Digital arkivpakkestruktur

Samdok samla samfunnsdokumentasjon. Arkivarkitektur. Samdok-konferansen 12. november Hans Fredrik Berg, Riksarkivet.

NORSI Norwegian Research School in Innovation, PING Program for Innovation and Growth

Norsk Arkivråd - Høstseminar 2009 Erfaringer med bruk av NOARK 5

Statped har ca. 700 ansatte, fordelt på fire regioner med til sammen femten kontorsteder. For mer informasjon, se statped.no.

Er de elektroniske forvaltningsarkivene en trussel mot rettsikkerheten? Thomas Sødring HiOA.

Søknadsskjema Strategiske Partnerskap. Anne Kloster Holst Seniorrådgiver SIU Oslo

Opportunistiske forskere og utålmodige industripartnere? Om forskning og innovasjon i FMEene. 28. oktober 2014 Roger Sørheim

Arkivtjenesten HiT - prioriterte tiltak Områder Tiltak Merknader Ansvar og fremdrift

Kundetilfredshetsundersøkelse FHI/SMAP

case forts. Alternativ 1 Alternativer Sammensetning Objekt-interaktor med valg

Personvernreglenes betydning for stordata, analyse, AI, agreggerte data, etc

Ph.d-utdanningen. Harmonisering av krav i Norden

Quality in career guidance what, why and how? Some comments on the presentation from Deidre Hughes

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

ARKIVVERKETS UNDERSØKELSE FOR KOMMUNALE ARKIVTJENESTER

Blokkjede er løsningen... men hva var spørsmålet?

TK-Arkiv Trondheim kommunes nye arkivkjerne

NOARKSYSTEMER SHAREPOINT. Integrasjoner m.m Norsk Arkivråd 27/ Pål Mangset - Finansdepartementet

Transkript:

Data Quality Perspectives Various roles from arkivdanning to arkivbevaring

Pragmatic Data Quality In this project we explore what data quality is based on observation and understanding within a Noark context Project results are based on observations and discussion Start with analysis of what DQ is for NOARK 4 Who are the stakeholders What factors should be considered

Who are municipal DQ stakeholders Records Management (Arkivdanning) Case Handler (Saksbehandler) Manager (Leder) Records Manager (Arkivleder) Municipality Manager (Rådmann) Long Term Preservation (Arkivbevaring) Extraction Processor Record Locator Trends Analysis Archive Manager

How do stakeholders view DQ? Case Handler (Saksbehandler) Short term / assume good DQ Manager (Leder) Short term / assume by verify good DQ Records Manager (Arkivleder) Short to medium term (long term?) Knows the truth! Municipality Manager (Rådmann) Short to medium term (long term?) Assumption that all is well

How do stakeholders view DQ? Extraction Processor Very short term, probably only one that ever makes a formal DQ judgement Record Locator Wish that DQ is good. Sees fragments of the truth Trends Analysis Assumption of good DQ, but irrelevant Archive Manager Long term, cost perspective

Wangs 15 DQ Dimensions Data Quality Intrinsic Contextual Representational Accessibility Accuracy Believability Objectivity Reputation Value-added Relevancy Timeliness Completeness Appropriate amount of data Interpretability Ease of understanding Accessibility Access Security

Wangs 15 DK Dimensjoner Datakvalitet Iboende Kontekstuele Representasjon Tilgjengelighet Nøyaktig Troverdig Objektiv Omdømme Verdi Relevans Tidsriktig Helhetlig Passende mengde data Tolkes Enkel forståelse Konsistent Konsis Tilgjengelig Tilgangsikkerh et

Intrinsic Data Quality Accuracy Believability Objectivity Reputation

Iboende DK Dimensjoner Nøyaktighet Troverdighet Objektivt Omdømme

Nøyaktighet c Snakk om avvik, feks distansen fra v til v' v er databasen og v' er uttrekket

Trodverdighet Er dataene i uttrekket sann og troverdig? Hva skjer hvis finner et dokument uten tilknytning til arkivstrukturen? Hva skjer hvis finner en registrering uten tilsvarende dokument? Kanskje den viktigste av alle dimensjoner Hvordan måle det? Dokumentasjon Objektivt / Subjektivt? Bruken av sjekksummer, automatisk avlevering til depot, logger Jo mer vi har, jo mer objektiv vi kan måle

Trodverdighet Viktig å skille mellom troverdighet til systemet og innhold/saksgang Eksempel* Danning Depot Saksbehandler/Leder Arkivtjenesten Motakk/Ledelse Forsker Algoritmer http://www.dn.no/forsiden/politikksamfunn/article1962324.ece

Objektivitet Er datene nøyaktig, konsis og upartisk? Har noen prøvd å "dempe" en betent sak? Ser vi fordommer fra saksbehandler/kommunen i en sak? Forskjell mellom innhold og metadata? tittel / dokument type sak, hva og hvem Systemet / Noark sørger for et nivå av objektivitet

Objektivitet Danning Depot Saksbehandler/leder Arkivtjenesten Mottakk/Ledelse forsker/algoritmer Kan vi måle objektivitet? antall ord/tegn brukt i tittel / innholdsbesrivelse

Omdømme Kan vi si noe om pålitlighet og viktigheten av en gitt informasjonskilde Kilder kan være interne/eksterne Integrasjon med fagsystem Noen baser ansees å være mer pålitlig På systemnivå så kan et system ha en bedre omdømme enn et annet Saksgang kan utløse et omdømme problem for kommunen feks noe informasjon fra en betent byggesak /reguleringsplan som blir lekket

De krysser hverandre Flere dimensjoner krysser hverandre Omdømme / sikkerhet Omdømme / objektiviet Omdømme / troverdighet Veldig kontekst (Noark) og rolle avhengig hvordan de krysser hverandre

Kontekstuele DK Dimensjoner Verdi Relevans Tidsriktig Helhetlig Passende mengde data

Contextual Data Quality Value-added Relevancy Timeliness Completeness Appropriate amount of data

Verdi Hva slags verdi gir Noark systemet? Utenom det lovpålagte Hvis loven ikke var der mye rot og kostnader Danning saksbehandler/leder arkivtjeneste/kommunen Depot (verdi på uttrekk) Når Volum øker, kan få bedre omdømme mottak/ledelsen forskeren / algoritmene

Relevans Under danning er Noark relevant / nyttig? jobber med arkivbegrensing postmottak Heller et spørsmål om vi fanger alt som er relevant Er det eksempler der vi ser at Noark ikke er nyttig? Hva hvis ikke kan lage uttrekk fra systemet? For depot er det litt anderledes Alt i uttrekket er relevant

Tidsriktig Er systemet / data tilstrekkelig oppdatert Ingen bruker et Noark 3 system i dag "Data delayed is data denied På saksbehandling, får politikerne data tidsnok til å gjøre grundig vurdering? Folkeregisteret/BBREG holder data oppdatert Data inn i system vil ofte være tidsriktig fordi adressen står der Endring av eksterne kilder som feks oppdatering i offentlighetsloven/postnummer

bevarings/kassasjons regler Tidsriktig Forskrift om byggesak 7-4 Gebyrbortfall ved kommunens fristoverskridelse Når uttrekket blir laget mister dataene evnen til å bli oppdatert / dynamikken forsvinner Tilgang og forståelse kan spille en rolle om tidsriktig Hvis det er mye arbeid / tar lang tid å hente data da er vi i en "data denied" situasjon Volum og tid til å prossesere/lage uttrekk med/uten feil kan være en del at tidsriktig Uttrekk er tidsriktig bilde av det som skjedde

Helhetlig Har vi fanget nok data? Noark sier hva vi skal fange Er basen fullstendig? mangler det data? Er bredden og dybden av opplysningene riktige? Tolkning av standarden spiller en rolle her Krav til epost adresse? Ikke alle har epost.

Passende mengde data Brukeren / skjermbilde, tanke på hvordan man presenterer data Politikere blir presenter med et dokument på 500 sider som de skal stemme over På systemnivå burde ikke være et problem ephorte søk Basen vokser sakte men sikkert over tid Depot får alt og da er det ikke nødvendigvis en passende mengde data Så lite innholdsvurdering som kan gjøres, kun det som kan scriptes

Passende mengde data Forsker med verktøy behøver ikke være et problem, men uten verktøy så kan det være et problem Teknologiske utviklingen gjør at det er ikke et problem på kommunalt nivå Kanskje mer et problem for RA

Representational Data Quality Interpretability Ease of understanding Consistent Representation Concise Representation

Representasjons DK Dimensjoner Enkel forståelse Tolkes Konsistent Konsis

Enkel forståelse (understand) Er systemet / dataene for komplisert slik at det er vanskelig å forstå I forhold til prosess Depot Kan vi forstå at et sett med filer utgjør et uttrekk, uten av vi nødvdendigvis kan bruke det Litt forbi å sikre lesbarheten

Tolkes (interpret) Kan dataene tolkes / brukes Du må først forstå noe før du kan tolke det Du kan forstå dataene du ser i tabelluttrekket (tall, dato, tekst) men du tolker at et data produkt er en sak eller journalpost

Konsistent Med GUI tankegang, Depot å være konsitent med visuell utforming å være konsistet med navngivning For Noark så bør uttrekkene til et vist nivå være konsistent Fagsystem og andre kilder Heterogene uttrekk kan være et problem

Konsis Beskrivelser er utformet på en konsis måte feks titelfelt ikke bruker mye unødvendig informasjon/språk Tabellnavn og attributter er "riktig" I forhold til å lage uttrekk konsis er at du får med det som trengs Unngå 200 tomme systemtabeller Unngå en overdokumentasjon

Accessibility Data Quality Accessibility Access Security

Tilgjengelighets DK Dimensjoner Tilgjengelig Tilgangsikkerhet

Tilgjengelig Problemer med systemet, nedetid Bruken av skytjenester Data er tilgjengelig og kan lett innhentes Bruken av gamle tegnsett Bruken av disker som ikke kan lenger leses Bruken av teritær lagring med lang hentetid Bruk av kryptering

Tilgangsikkerhet Sikker sone Tilgangskontroll på objekter Skille mellom lese og redigerings muligheter i forhold til materiale For noe informasjon skal ikke være mulig å fastslå eksistens På systemnivå er dette relatert til tillit

Mye informasjon... OAIS Modellen Iboende / Kontekstuelt / Represetasjon / Tilgang Arkivpakke?? Hva sitter vi igjen med nå? Hvordan kan dette brukes? Hva kan måles subjektivt / objektivt? I et Noark kontekst så krysser disse dimensjone hverandre på måter som de ikke gjør i andre kontekster Utfordring til å samle tankene og publisere dette