Digitalt skapt kildemateriale og arkivarenes påvirkning - fast element i kildekritikken? Av Børge Strand



Like dokumenter
Historie på individnivå - historieforskning basert på datagrunnlag fra fagsystemer. Børge Strand KAI-konferansen

Om bruk av digitalt skapt arkivmateriale i historieforskning. Av Børge Strand Daglig leder IKA Øst

ARKIVVERKETS EARKIV- PROSJEKT : STATUS

Retningslinjer for deponering og avlevering av digitalt arkiv. Kontaktkonferansen 2018 Arkiv Troms v/jan Grav, IT-rådgiver

Bevaring og tilgjengeliggjøring- Hvor ligger forbedringspotensialet?

Norsk helsearkiv og helsearkivregisteret

Innføring av earkiv i offentlig forvaltning

DEN DIGITALE TIDSALDER

Tilgang til forskningsdata. Bjørn Henrichsen NSD Norsk senter for forskningsdata

Periodisering og avlevering av elektronisk arkiv hvem, hva, når? Rådgiver Ole-Bjørn Fossbakk og rådgiver Solveig Heløe Olsen, IKA Troms

Fagsystemer. Kommunearkivkonferansen IKA Opplandene Pål Mjørlund

Instruks for elektronisk arkivmateriale som avleveres eller overføres som depositum til IKA Møre og Romsdal IKS

Samdok samla samfunnsdokumentasjon. Arkivarkitektur. Samdok-konferansen 12. november Hans Fredrik Berg, Riksarkivet.

HelsIT 2015 Submission/Paper 9 (rev.)

Uttrekk fra elektroniske arkiver

Public. earkiv 360. Integrasjonsmuligheter og nye metoder for import Stian Gregory

KDRS 12.juni Hvordan tenkes og jobber «noen» i dataindustrien om tema bevaring og avlevering av earkiv til arkivdepot institusjoner

Samdok samla samfunnsdokumentasjon

Testverktøy Status og videre tanker

Ole Myhre Hansen Seksjon for digitalt depot, RA

Saksbehandling, arkivdanning og arkiv om arbeidsprosesser, dokumentasjonsforvaltning og langtidslagring

PRESENTASJON NORDIG OKTOBER Alle skal kunne teste alt - overalt

Bevaring av fagsystem og Noark 5

Om det pågående arbeid med standard for arkivering av EPJ Hva med kommunenes behov?

«Farvel DBS» - mottak av database-arkiver fra privat sektor. Arbeiderbevegelsens arkiv og bibliotek

Om tilsyn Kort oppsummering av statsarkivets tilsyn herunder litt om kvalitetssikring Om ny strategi for Arkivverkets tilsyn

Riksarkivet og Oslo kommunes earkivsatsinger

Er du rede til å stå for dine handlinger? Kjetil Reithaug statsarkivar i Kristiansand

Er du rede til å stå for dine handlinger? Kjetil Reithaug statsarkivar i Kristiansand

Del 2: Uttrekk fra udokumentert database

SAMDOK prosjekt, partnerskap og utviklingsarena

Datakvalitet og Noark

Produksjonslinje for bevaring og formidling av elektroniske arkiv fra kommunal sektor KDRS RIKSARKIVARENS ARKIVUTVIKLINGSMIDLER

Noark-5. KDRS Petter Pedryc

Noark-5 hva blir det til? Ståle Prestøy IKA Trøndelag. 23. mai 2007 Noark-5 - hva blir det til? 1

Alle skal kunne teste alt - overalt KDRS TRONDHEIM JUNI 2017

Samdok. PRIORITERT OPPGAVE Arkiv i eforvaltning. samla samfunnsdokumentasjon

Samdok konferansen 2013 Fra digital arkivdanning til digitalt depot i kommunene Tor Eivind Johansen, daglig leder KDRS

Mikrodata til forskere - erfaringer og planer fra Norge

Konseptutredning om modernisering av arkivvedlikehold og overføring til depot (MAVOD) Presentasjon for KDRS 13. juni 2017

Elektronisk arkiv - hva er det? Karin Amalie Holmelid kaho@hib.no Arkivleder/leder for Dokumentsenteret ved Høgskolen i Bergen

Dokumenter som må være på papir i en fullelektronisk verden?

Samdok. Samdok og. Arkiv i e-forvaltning. KDRS-samling 14. november Arkiv i e-forvaltning. Hans Fredrik Berg, Riksarkivet

Riksrevisjonens undersøkelse av arbeidet med å sikre og tilgjengeliggjøre arkivene i kommunal sektor. Dokument 3:13 ( )

Periodisering av elektronisk sak-/arkivsystem, med fokus på NOARK 4 og 5 systemer. Pål Mjørlund Odd Gunnar Ludvigsen Kommunekonferansen

Om populasjonsforvaltning - Tema 2 Nye

Marcus et digitalt verktøy

Datakvalitet i praksis i SSB

Hovedtema: Primær- og sekundær arkivbruk bør den siste legge premisser for den første?

Infrastruktur i samfunnsvitenskap - Om tilgang til registerdata for forskningsformål

Kontaktkonferansen 2015

Fagsystemer. Interkommunalt arkiv for Buskerud, Vestfold og Telemark IKS

Daglig leder Tor Eivind Johansen Kommuneseminaret

Velkommen til Arkivstatistikken 2018 (skjema for arkivinstitusjoner)

En presentasjon av SAMDOK prosjektet: Digitalt skapt materiale i kommunal sektor Sigve Espeland Interkommunalt Arkiv i Rogaland IKS

Arkivverkets tilsynsvirksomhet praksis og utfordringer. Om tilsyn Våre tilsyn Arkivverkets tilsynsstrategi

KOMMUNEREFORM ARKIV OG DOKUMENTASJONSFORVALTNING

R I K S A R K I V A R E N S U N D E R S Ø K E L S E F O R K O M M U N A L E A R K I V T J E N E S T E R

Velkommen til Riksarkivarens undersøkelse for kommunale arkivtjenester 2015 (Storbyundersøkelsen)

Arkivplanlegging hva, hvorfor og hvordan. Sigve Espeland Interkommunalt Arkiv i Rogaland IKS

Strategiplan for IKA Øst

Avlevering av digitale arkiver (DA)

Hva kan vi bruke NSD til?

Noark 5 hvor går veien videre? Arkiv i e- forvaltning Gardermoen, 4. desember 2013 Øivind Kruse og Jon Atle Haugen

RIKSARKIVET, KOMMUNENE OG STRATEGIPROSESSEN I ARKIVVERKET

Digitalt depot - KS og Riksarkivets workshop om digitalt depot Anne Mette Dørum spesialrådgiver KS

PRESENTASJON Uttrekk og bevaring av eldre fagsystem med dots kjernen

Verdiløse arkiv? Norsk Arkivråds høstseminar 20.oktober Lars-Martin Kristensen Rune Stenhaug Systemintegrasjon AS

Ny tjeneste fra Arkiv i Nordland. Digitalisering av eiendomsarkiv

Prosessorientert arkiv en introduksjon Samdok- konferansen 16. oktober 2014

Regelverk, instrukser, bestemmelser og metode

Samdok Delprosjekt Kommunale arkiv Metodikk for bevaring fra kommunale fagsystem (Pleie og omsorgssektoren) Sigve Espeland, IKA Rogaland

HVORFOR FAGSYSTEM BØR BEVARES ELEKTRONISK OGSÅ!

Dataforvaltning og digitalisering. Stein Ivar Rødland IT-sjef Stavanger kommune

Riksarkivarens tilsyn med kommunale arkivordninger. oppsummering av resultatene etter spørreundersøkelsen 2010

Riksarkivarens årlige undersøkelse for kommunale arkivtjenester for Du starter undersøkelsen ved å trykke på "neste" nederst på siden.

Tenkte å si litt om...

Nytt om elektronisk arkiv og deponering. v/tormod Engebu, IKAVA

HVORFOR FAGSYSTEM BØR BEVARES ELEKTRONISK OGSÅ! Sigve Espeland, IKA Rogaland

Informasjonsskriv om forskningsprosjektet Nye mønstre trygg oppvekst

Samletabell arkivinstitusjoner 2016

EPJARK-standarden (Standard for arkivavlevering av elektronisk pasientjournal til Norsk helsearkiv )

Digitalisering for kassasjon. Kan digitale kopier erstatte originalmateriale på papir?

Kommunereform, arkiv og IKA. IKAs kontaktkonferanse 2015

ØYGARDEN KOMMUNE DELEGERT SAK

Overgang fra papirarkiv til digitale arkiv. IKA Finnmark, 26. september 2017

Arkivverket Dokumentasjonsforvaltning - ny struktur. Kjetil Reithaug Fagdirektør Seksjon for Dokumentasjonsforvaltning,

Arkivtjenesten bør påta seg de funksjonelle oppgavene, herunder ha rollen som kravstiller. Oppgaver som krever IKT kompetanse vil det for mange være

Mot en nye folke og boligtelling

Informasjon om Arkivverkets tilsyn med arkivarbeidet i Nordland fylkeskommune

1 Stemningsrapport fra konferansen Arkiv i e-forvaltning Møteplan for våren Samdok Side 1 av 5. Agenda:

Høringsnotat endringer av riksarkivarens forskrift 2019

Kontaktkonferansen 2012 Stavanger 31. mai 2012

Samdok samla samfunnsdokumentasjon

I denne artikkelen får vi en innføring i arbeidet med Noark-standarden, og med fokus på kravene til godkjenning og hvilke konsekvenser dette gir.

KAI-konferansen AVTRYKK Aust-Agder museum og arkiv KUBEN september 2015

Felles kommunalt rammeverk for digitalisering - eller Felles kommunal IKT-arkitektur

Hva jeg skal snakke om

Hva har NOARK5 å bety for arkivet? Tormod Engebu, IKT-Rådgiver IKAVA

Dias, Ny lagringsmodell for elektroniske arkiver

Transkript:

Digitalt skapt kildemateriale og arkivarenes påvirkning - fast element i kildekritikken? Av Børge Strand

Forskerforum Fra 2014 har det vært en rekke artikler og debattinnlegg om Registerbasert forskning 1/2014,s 35, 9/2014,s 42 verdens beste dataregistre Bekymring for tilgangen til mikrodata for forskning SSB har et tilnærmet monopol på utlån av mikrodata for forskning SSBs egne registre og eksterne, administrative registre Tilrettelegger - skreddersyr - datagrunnlag for forskere Prisøkning på tilrettelegging, SSBs tiltak(2/2015, s 37) Dette er i stor grad de samme registrene som arkivinstitusjonene bevarer

Forskningens etterspørsel og bruk Stor og økende etterspørsel etter mikrodata fra registre alltid informasjonsverdien som etterspørres SSB tilrettelegger og distribuerer mikrodata til forskere avidentifisert eller anonymisert Ingenting av dette kommer fra registre/fagsystemer som er godkjent av Riksarkivaren Ingenting har vært gjennom arkivdanning detaljregulert av Arkivverket Ingenting av dette datagrunnlaget har vært innom arkivinstitusjoner og fått et stempel som autentisk Ingenting av dette datagrunnlaget er forseglet med sjekksummer Likevel brukes det og tilliten til registermaterialet er stor SSB og forskerne selv kvalitetssikrer datagrunnlaget og vurderer beviskraften, feilmarginer etc. - øver kildekritikk

Registre/fagsystemer En gullgruve for forskning historieforskning og annen forskning Informasjon i strukturert form: I tabeller, rader, kolonner og celler Tilrettelagt for datautveksling og gjenbruk ved kobling maskinell bruk Informasjon i kodet form i stor grad tallkoder (yrke, utdanning, bosted, sivilstand ) Dette er egenskaper som gir store gevinster i forskningssammenheng Alt er klausulert og må avidentifiseres eller anonymiseres før utlevering til forskeren Lagres som rådata i arkivdepot (og hos SSB) dvs. vi mister opprinnelig funksjonalitet for spørring, gjenfinning, prosessering Men som forskere vil vi uansett stille nye og andre spørsmål til materialet - ikke gjenta arkivskapers spørringer og bruk

Informasjonsverdien i registre Egnet for å avdekke strukturer, mønstre, samvariasjon, endringer over tid, livsløp, geografiske variasjoner m.m.m. Også brukes til enkeltoppslag etter mønster fra digitalisert materiale søk etter en og en person (slektsforskning) Hvis enkeltoppslag blir den eneste form for bruk, er det en skrøpelig utnyttelse av registermaterialet Forskere etterspør registermateriale skreddersydd for et gitt forskningsprosjekt (DIP) - data om grupper/populasjoner, i tabellform for maskinelle analyser Forskere vil ikke søke opp en og en opplysning

Arkivskaperes og publikums etterspørsel Skiller seg fra forskningens Enkeltoppslag rettighetsdokumentasjon Strengere krav til pålitelighet? Dokumentasjon av historisk, pensjonsgivende inntekt et typisk eksempel på publikumsforespørsel Dette er dokumentert i Ligningsregisteret (SKD) årlige datasett fra 1967 Katalogen opprinnelig og ADDML-fil Script for søking - eks Dataflyt fra Ligningsregisteret til Det Sentrale Folketrygdsystem (NAV) Skattelistene er utskrifter fra Ligningsregisteret - Ligningsregisteret er primærkilden både for listene og for DSF Et stort antall slike forespørsler aldri fått tilbakemelding med spørsmål om nærmere dokumentasjon

Registermateriale og kildekritikk Maskinell kildekritikk Logiske kontroller - sammenhenger og gjensidig avhengighet, systemgenerert informasjon, verdiområder for variable Konsistens samsvar avvik - internt i registeret Validering av fødselsnummer, organisasjonsnummer, kommunenummer Referanseintegritet Sammenligning på makronivå datautveksling og gjenbruk Sammenligning på mikronivå - registervasking mellom registre Retning av dataflyt hvor kommer data fra? avhengighet mellom kilder? Entitet: Person, familie, husholdning, skattyter, organisasjon Adresse ulike nivåer av numerisk adresse Mye avvik kan forklares med ulike entiteter og ulike perioder

Leverandører av registerdata Statistisk sentralbyrå (SSB) Norsk Samfunnsvitenskapelig Datatjeneste (NSD) Forskningsinstitusjoner Arkivverket Arkivinstitusjoner (interkommunale/kommunale/andre Museer? Arkivskaperne selv?

Hver sine nisjer SSB er en stor aktør som i mange år har levert mikrodata til forskere anonymisert eller avidentifisert, men stort sett bare ferske data, dvs. nyeste tilgjengelige samfunnsvitenskapelig forskning prognoser, beslutningsgrunnlag Arkivinstitusjonene tilbyr data langs den historiske aksen Arkivinstitusjonenes materiale er velegnet for å sette sammen paneldata Samme type datagrunnlag, men hver sin nisje

Arkivinstitusjonenes påvirkning Fast spørsmål for kildekritkken - hvordan har arkivinstitusjonene påvirket kildematerialet? Regelverk og inngripen gjennom livssyklusen Hva som kommer inn i arkivet og på hvilken form hvilke tabeller, hvilke felt, hva slags format? Lite rom for arkivskaperne BK hva som kommer inn i depotet og ikke minst på hva slags form mikrodata som pdf? Dette er valg som legger rammer for etterspørselen Prosessen med arkivuttrekk - er det uproblematisk at arkivdepotene lager SIP? earkiv og synkron overføring - kontinuerlig feilretting? Arkivinstitusjonen som medaktør i arkivdanningen - en aktiv part og en med-arkivskaper Heldigvis har Riksarkivaren holdt fingrene fra fatet i registerverden så langt (Folketellinger, system for ligning, matrikkelen.)

NOARK-3-uttrekk eks. på feil og mangler Dubletter på primærnøkkel manglende referanseintegritet Manglende løpenummer i saksnr. Datofelt som ikke validerer Mengder av saker som ikke er avsluttet skal de avsluttes maskinelt? Hvem skal avslutte dem? Mengder av dokumenter som ikke er knyttet til sak kan disse gjenfinnes? Systemene har tillatt dette til tross for Riksarkivarens godkjenning Dette er autentiske feil arkivdanningen er ikke perfekt - skal arkivdepotene kreve at feilene rettes opp?

Eksempel på forespørsel fra arkivskaper Sosialtjenesten lokalt og fagsystemet Humanus (Telenor Allianse) Fagsystem som var i bruk 1998 2002 alt innhold er mikrodata i strukturert form selvsagt KLAUSULERTE data Uttrekk til IKA Øst 2014 Uttrekket produsert av HIKT tekniske metadata produsert av IKA Øst Forespørsel fra NAV i kommunen om utbetalingshistorikk for klient Svaret en tabell strukturerte data Grunnlaget for svaret sammenstilling av tre tabeller og et antall felt fra hver tabell fødselsnummer som søkebegrep Klienten og utbetalingshistorikken er det viktige her kommunen kan få tilbake drøyt 200 000 kroner

Humanus forespørsel forts. Kan vi ha tillit til dette? Hvilken beviskraft har det? Uberørt av arkivarer bare arkivskaper og systemleverandør Et system for å håndtere sosialtjenestens behov flere moduler klientmodul økonomimodul statistikkmodul systemmodul osv. til sammen 75 tabeller ER-diagram modul Klient-økonomi Systemleverandøren har utviklet systemet i forhold til funksjonen (sosialtjeneste), lovverk og kundenes krav Ikke godkjent av Riksarkivaren har ingenting med Noark å gjøre Kildekritiske vurderinger konsistens (klientdata henger sammen, beløpene samsvarer med satsene, tidspunkter er logiske) utveksler data med andre systemer - lokalt: økonomisystem, personalsystem, med andre kommuners systemer, sentralt: noen ytelser er skattepliktige (FLT)

Bestilling av datagrunnlag for forskning Et forskningsprosjekt har utgangspunkt i noen ideer om datagrunnlag kildemateriale. Hva finnes? For registermateriale er det addml-filene som er katalogen hvor finnes data for mitt konkrete forskningsprosjekt? Koblinger deretter anonymisering! Arkivarene må være i stand til å veilede publikum i dette landskapet Hvilke arkivskapere, hvilke registre, hvilke tabeller, hvilke felt? Hva slags populasjon? Datagrunnlag skreddersydd for et gitt forskningsprosjekt (DIP) Nytt originalmateriale, men kan ikke gjenbrukes i andre sammenhenger For mitt forskningsprosjekt ville bestillingen sett slik ut Hvordan ville arkivarene håndtert en slik bestilling?