Noark 5 kjerne Status og planer. Thomas Sødring P-R

Størrelse: px
Begynne med side:

Download "Noark 5 kjerne Status og planer. Thomas Sødring thomas.sodring@jbi.hio.no P-R428 22452610"

Transkript

1 Noark 5 kjerne Status og planer Thomas Sødring P-R

2 Noark5 Noark 5 kjerne Tjeneste/Grensesnitt laget (service layer) WSDL Virksomhetslogikk laget (Business Logic Layer) Lagrings laget (Persistence Layer ORM) Noark kjernen implementert med business logic og object relational mapping Relasjonsdatabase 2

3 n5c status Vi har en kodebase fra Dublin som implementerer en Noark 5 indre kjerne Den har ingen brukergrensesnitt Har hatt noen implementasjons problemer Er i en prosess der vi bygger bruker grensesnitt samtidig som vi sjekker logikken Uavhengig testing (Unit tests) Kan demonstrere kjerne med følgende arkivstruktur Arkiv, arkivdel, mappe og registrering Vi vil snart ta igjen friark på funksjonalitet 3

4 Utvikling og Distribusjon Plattform uavhengig for utvikling Eclipse, jboss, mysql, java, graniteds, flex kompilator* finnes alle på win/lin/mac Brukergrensesnittet er avhengig av adobe flash :o( Kjernen kan kompileres og distribueres som en jar (kun kjerne) eller ear (applikasjon) JAR (Java ARchive) WAR (Web ARchive) EAR (Enterprise ARchive) 4

5 AdobeFlex Brukergrensesnitt Noark 5 kjerne Noark5 kjerne GraniteDS (AMF) Tjeneste/Grensesnitt laget (service layer) WSDL/RemoteObjects Virksomhetslogikk laget (Business Logic Layer) Lagrings laget (Persistence Layer ORM) Noark kjernen implementert med business logic og object relational mapping Relasjonsdatabase 5

6 Demo JBOSS AS Tom database Databasestruktur blir opprettet Eclipse Flex Noark5CoreService.java Noark5CoreServiceBean.java Arkiv.java ArkivSeeker.java GraniteDS som lager actionsript filer NoarkCoreApplication.mxml Hvordan bygge og deploye prosjektet 6

7 Kommunikasjon Brukergrensesnitt til kjerne kommunikasjon Webservices/SOAP SOAPUI Mange muligheter RemoteObject En Flex/Actionscript optimalisering Data utveksling i en binær standard som heter AMF (Action Message Format) Mye mer effektiv enn XML Slipper marshalling (koding / dekoding) av objekter som XML Type mapping skjer uten problemer java.util.date til actionscript Date? 7

8 Hvorfor denne arkitekturen Utviklingsperspektiv som kommer fra midten Positive Lettere å videreutvikle og jobbe med Kostnadene kraftig redusert for videreutvikling Gjenbruk som kommunal felleskomponent Negative Databasen er ikke optimalisert Er det riktig teknologi?.net/silverlight, ruby on rails, groovy on grail Kjernen er en 'ren' kjerne Autentisering / Autorisering er ikke direkte i kjerne men håndteres av JAAS (Java Authentication Ikke implementert enda 8

9 Skalerbarhet Skalerbarhet er viktig. Per i dag vet vi ikke hvor mange som kan bruke kjernen samtidig JBOSS kan konfigureres for å kjøre i en cluster Men det kan være en flaskehals i lagringslaget (Object Relational Mapping) Vi har lab på HiO, så vi kan lett teste opp mot hundre brukere samtidig for å se hvordan kjernen skaleres 9

10 Lisens kompatibilitet Liten / Ingen Beskyttelse Svak Beskyttelse Sterk Beskyttelse Nettverk Beskyttelse Offentlig domene LGPLv2.1 GPLv2 MIT/X11 LGPLv2.1+ GPLv2+ BSD (ny) LGPLv3/v3+ GPLv3/v3+ AGPLv3 Apache 2.0 MPL 1.1 Kjernen skal være LGPL, alt annet skal være BSD. Fra/til. Programvare som kombinerer kode fra 2 lisenser må leve med at programmet har til lisensen Utviklet fra 10

11 Framover Indre kjerne med brukergrensesnitt ferdig mot slutten av juni Ytre kjerne utover høsten Pappaperm og andre hensyn 11

12 Spørsmål til KAI miljøet Hva slags interesse har dere for en slik kjerne? Har dere kompetanse til å drifte/videreutvikle den? JAVA, System Administrator Urealistisk å tro at vi vil utvikle en fullverdig saksbehandlingsløsning Men vi skal prøve! Student prosjekt Nærmer seg slutten av det som kan gjøres innenfor en FoU ramme 12

13 Pågående prosjekter Integrasjon med Facebook Windows basert applikasjon Integrasjon med Android mobil Integrasjon med Fedora Commons for sikker overføring fra Noark kjerne til depot 1. juni starter 1 student 3 måneders masters prosjekt for å utvikle en datakvalitet plugin for kjernen Ønsker at den skal være implementasjon uavhengig (med tanke på friark) 13

14 Neste runde med prosjekter Innsynforespørselløsning for KAI miljøet Foreslått av IKA Kongsberg og Trøndelag Ikke mye som skal til Kjernen i nettskyen Arkivloven 12.b står for fall!!! Kanskje få leverandørene til å åpne øynene Konvertering fra produksjon format til arkivformat med garantier Slutt på at noen leverandører prøver å selge one-size-fits-all løsninger 14

15 Undervisningsverktøy Uansett om kjernen brukes eksternt eller ikke så vil det være en undervisningsressurs På alt fra Årsstudium Bachelors Masters Ønsker å se nærmere om Noark Arkivråd har bruk for den Kompetanseheving med tanke på Riksrevisjonensrapport 15

16 Forskningsverktøy Snart kan vi vise hvordan: Integrere kjernen mot utradisjonelle arkivdannings kilder Sikker overføring fra kjernen til depot (begrenset i størrelse) Men vi ønsker å bruke kjernen til å se nærmere på: Semantikk Datakvalitet Infrastruktur InterPares4 16

17 NFR søknad Jobber med en søknad for en forskerprosjekt 3-4 Ph.D stillinger med prosjekter som bygger på kjernen Må ha utviklingskompetanse 17

18 Semantikk og arkivdanning kilde1 kilde3 arkiv arkivdel sak1 mappe JP1 sak er part i Hans hansen sak2 kilde2 JP2 arkivstruktur innhold saksgang 18

19 Trenger vi semantikk i arkiv? Er arkivdanning styrt etter depotets behov? NOARK kjerne, hva er det egentlig? God arkivdanning Dokumentasjon på forvaltningens vedtak Informasjon som skal avleveres til depot <arkiv> <arkivdel> <saksmappe> <journalpost> </journalpost> </saksmappe> </arkivdel> </arkiv> Er dette et systemsentrisk syn? Hva ellers skulle det være? 19

20 Trenger vi semantikk i arkiv? "Når vi bruker semantisk teknologi så abstraherer vi oss vekk fra syntaks og opp mot budskapet innholdet representerer" Arkivstrukturen som er realisert utifra Metadatakatalogen er en type abstraksjon av arkivdanningen som har skjedd ved en viss tidspunkt I dette tilfellet er semantikk et langtidslagrings spørsmål 20

21 Trenger vi semantikk i arkiv? Semantikk kan brukes i 3 forskjellig områder Arkivdanning Arkivstruktur Innhold Saksgang Depot Depot kan arve semantikken fra semantiskbevist arkivdanningsystemer hvis det fantes Depot kan prosessere avlevert materiale slik at det blir semantisk 21

22 Semantikk og Arkivstruktur arkiv (KommuneA) har har har arkivdel (barnehagesøknad) mappe (søknad om plass) journalpost (1) har <arkiv beskrivelse="kommunea"> <arkivdel beskrivelse="barnehagesøknad"> <saksmappe tittel="søknad om plass"> <journalpost> 1 </journalpost> <journalpost> 2 </journalpost> </saksmappe> </arkivdel> </arkiv> journalpost (2) 22

23 Semantikk og Arkivstruktur Hva får vi fra dette? Ikke så mye som vi ikke har før Det åpner opp for bruken av semantiske verktøy Det kan danne grunnlaget for bruken av statistikk informasjon om organet Hvor mange saker de behandler Hvor lang tid de bruker til å behandle søknader Hvilken type søknader de behandler For depot vil dette være langt mer nyttig enn ved danning Dette er noe som kan automatiseres 23

24 <rdf:rdf xmlns:n5="http://www.arkivlab.no/n5" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <n5:arkiv rdf:nodeid="arkiv_1"> <n5:systemid>1</n5:systemid> <n5:beskrivelse>oslo Kommune</n5:beskrivelse> <n5:errelatert rdf:nodeid="arkivdel_1"/> </n5:arkiv> <n5:arkivdel rdf:nodeid="arkivdel_1"> <n5:systemid>2</n5:systemid> <n5:beskrivelse>barnehage søknader</n5:beskrivelse> <n5:errelatert rdf:nodeid="mappe_1"/> </n5:arkivdel> <n5:mappe rdf:nodeid="mappe_1"> <n5:tittel>mappe for Hans Hansen</n5:tittel> <n5:systemid>3</n5:systemid> <n5:errelatert rdf:nodeid="journalpost_1"/> <n5:errelatert rdf:nodeid="journalpost_2"/> </n5:mappe> <n5:journalpost rdf:nodeid="journalpost_1"> <n5:systemid>4</n5:systemid> </n5:journalpost> <n5:journalpost rdf:nodeid="journalpost_2"> <n5:systemid>5</n5:systemid> </n5:journalpost> </rdf:rdf> <arkiv> <systemid>1<systemid> <beskrivelse>oslo Kommune</beskrivelse> <arkivdel> <systemid>2</systemid> <beskrivelse>barnehage søknader<beskrivelse> <mappe> <systemid>3</systemid> <tittel>mappe for Hans Hansen</tittel> <journalpost> <systemid>4<systemid> </journalpost> <journalpost> <systemid>5</systemid> <journalpost> </mappe> <arkivdel> </arkiv> RDF XML 24

25 Oslo Kommune Semantikk og Innhold ansvarlig for Byrådsavdeling for kultur og utdanning ansvarlig for har presedens fra Presedens Sak Barnehage søknad er saksbehandler er part i sak Hans Hansen Maria Hansen 25

26 Semantikk og Innhold Med bruken av semantikk her så går vi bort fra et systemsentrisk forståelse av arkivdanning til et objektsentrisk forståelse av arkivdanning Ja, det er egentlig det samme underliggende data, men det er måten vi bruker det måten vi søker gjennom det som blir anderledes Datamaskiner kan forstå og prosessere det 26

27 <rdf:rdf xmlns:innhold="http://www.arkivlab.no/innhold" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <innhold:sak rdf:nodeid="presedens_sak_1"> <innhold:sak_id>12334</innhold:sak_id> </innhold:sak> <innhold:person rdf:nodeid="hanshansen"> <innhold:person_navn>hans Hansen</innhold:person_navn> <innhold:person_personnummer> </innhold:person_personnummer> </innhold:person> <innhold:person rdf:nodeid="karlkarlsen"> <innhold:person_navn>karl Karlsen</innhold:person_navn> <innhold:rolle>saksbehandler</innhold:rolle> </innhold:person> <innhold:sak> <innhold:part_i_sak rdf:nodeid="hanshansen"/> <innhold:saksbehandler rdf:nodeid="karlkarlsen"/> <innhold:presedens rdf:nodeid="presedens_sak_1"/> </innhold:sak> </rdf:rdf> 27

28 Datakvalitet Datakvalitet for kommunene Hva er det? Completeness, accuracy, timeliness, correctness Datakvalitet som en del av integritet Datakvalitet opp mot TRAC standarden Både ved danning og bevaring 28

29 Infrastruktur Stipendiat prosjektet blir bred og kan utvikles på mange måter Inkluderer brukeren (saksbehandleren) Sikre tillit (chain-of-custody) fra danning til bevaring Nettskyen 29

30 InterPares 4 Det jobbes med en ny runde av InterPares prosjektet Så vidt jeg vet er det ingen norske deltakere "The need to be remembered, the right to be forgotten" 30

31 VERDIKT fagsøyler 31

32 EU Prosjekt (depot og datakvalitet) EU innenfor 7. rammeverk har en arkiv relatert utlysning med frist April 2011 Sikker overføring til depot med datakvalitet Mulig konsortiet* HiO arkivdanning/semantikk (forsker) DCU/DnV datakvalitet (forsker) ESSolutions (ESSARCH) (kommersialisering) KDRS/ En eller flere IKA institusjoner (bruker) Grovt sett prosjekt budsjett 7 millioner per år over 3 år Bruker partner kanskje ,- til per år men må egen finansiere 50% Ønsker å finne ut hvem kunne tenke seg å være med i konsortiet, ikke svar idag Vi må begynne nå hvis vi ønsker et prosjekt *NB, dette er første gange sammensetting av konsortiet er luftet offentlig. Ingen av de nevnte selskapene har sagt ja til å være med 32

33 EU Prosjekt (depot og datakvalitet) Mulig kombinasjon av TRAC standarden og Noark 5 kjerne og ESSARCH Naturlig neste steg etter DIAS? Fokus på kommunene ikke statlig forvaltning Krav fra TRAC Standarden: Overtagelse av innhold ved Mottak B1.1 til B1.8 Generering av arkiv pakke (AIP) B2.2, B2.4 til B2.6, B2.8 til B2.13 Kanskje søke Kulturråd midler for å skrive søknaden 33

34 TRAC B1.1 til B1.4 (B1.1) Depot må identifisere egenskapene til digitale objekter de ønsker å bevare (B1.2) Depot angir klare definisjoner om informasjonen som inngår i en avlevering (dvs., SIP) (B1.3) Depot har mekanismer som kan identifisere og autentisere kilden til alt materialer (B1.4) Depotets mottaksprosess sjekker hvert mottatt objekt (SIP) for fullstendighet og korrekthet 34

35 TRAC B1.5 til B1.8 (B1.5) Depot har tilstrekkelig fysisk kontroll over de digitale objektene for å bevare dem (B1.6) Depot gir arkivskapere passende svar på forhåndsdefinerte punkter i løpet av mottaks prosessen (B1.7) Depot kan vise når bevarings ansvaret er formelt godkjent for en avlevering (dvs. SIP) (B1.8) Depot må samtidig registrere handlinger og administrative prosesser som er relevante for bevaring 35

36 B2.2, B2.4 til B2.6 (B2.2) Depot har en identifiserbar, spesifisert definisjon for hver AIP eller klasse av informasjon som depot bevarer (B2.4) Depot kan dokumentere at alle mottatte objekter (dvs. SIP) enten aksepteres i sin helhet eller som deler av en eventuell arkivpakke (dvs. AIP), eller hvis der er forkastet så er det journalført (B2.5) Depot har og bruker en navngivingsprosess som genererer synlige, varige og unike identifikatorer for alle arkiverte objekter (AIPer) (B2.6) Hvis unike identifikatorer er forbundet med en SIP før mottak, skal depot bevare denne identifikatoren på en måte som opprettholder en vedvarende assosiasjon med den arkiverte objekten (f.eks AIP) 36

37 B2.8 til B2.13 (B2.8) Depot registrerer representasjoninformasjon (inkludert formater) ved mottak (B2.9) Depot tilegner seg bevaringsmetadata (dvs. BBI) for tilhørende innholdsinformasjon (B2.10) Depot har en dokumentert prosess for testing av forståelighet av innholdsinformasjon og kan utvikle dette til et avtalt nivå på forståelighet (B2.11) Depot verifiserer hver AIP for fullstendighet når de er generert (B2.12) Depot har en uavhengig mekanisme for å verifisere integriteten av samlinger / innhold (B2.13) Depot har samtidige registreringer av handlinger og administrative prosesser som er relevante for bevaring (generering av AIP ) 37

38 EU søknad skriving Må bli enig om budsjett tidlig Unngå kostnadseksplosjon siste uken Deadlines er viktige Viktig at alle er samstemt Unngå at konsortiet kollapser den siste uken En redaktør som ser helheten Partner roller må være klare: Forskning, Kommersiselsering, Bruker Geografisk fordeling også viktig: Norge, Sverige, Irland Usikker om vi må ha en til 38