Kunnskapsorganisasjon og gjenfinning 1.1 Introduksjon til databaseteori Tine L. Frost, Jørn Helge B. Dahl og Kim Tallerås Dagens forelesning Overblikk over emnet Praktisk informasjon Høstens temaer Hvorfor databaseteori? Grunnleggende terminologi Introduksjon til modellering av databaser 1
Faglærere resten av høsten Jørn Helge B. Dahl Tine L. Frost Kim Tallerås Praktisk informasjon Fagsider Forelesningsplan Lenker til introduksjonsforelesninger Timeplan Pensum er i Programplanen Fronter Beskjeder Forelesningspresentasjoner i etterkant Scannet pensum (enkelte kapitler/artikler) Oppgavetekster/løsningsforslag 2
Arbeids- og undervisningsformer Undervisningen veksler mellom: Forelesninger Seminarer Øvelsesoppgaver hjemme Studentene tilegner seg stoffet ved Selvstudium Oppgaveløsning og/eller gruppearbeid Arbeidskrav Skriftlig gruppeoppgave på ca. 5 sider Skal presenteres i plenum Grupper på 2-5 studenter Godkjent/ikke godkjent Eksamensform 6 timers individuell skoleeksamen Scenarier/eksempler En student jobber med å ferdigstille masteroppgaven sin «Langrenn og norsk identitet: en analyse av Sportsrevyen på NRK». Arbeidet innebærer blant annet å lage en litteraturliste over kilder som er referert i oppgaven. Studentens fakultet viser til internasjonale retningslinjer for hvordan litteraturlista skal utformes. For å slippe å gjøre jobben helt fra bunnen av benytter studenten et program som kan importere beskrivelser av kildene fra ulike databaser, tilpasse beskrivelsene etter de spesifiserte retningslinjene og automatisk sette opp en litteraturliste. Ettersom beskrivelsene er hentet fra ulike databaser er de i utgangspunktet også utformet på forskjellige måter og inneholder ulik informasjon om tekstene de beskriver. Programmet greier derfor bare delvis å ordne beskrivelsene i litteraturlista på en konsistent måte. Studenten som nærmer seg innleveringsfrist jobber intensivt med å legge til informasjon som mangler og rette opp feil, og sukker oppgitt: «Hvorfor kan ikke bare alle gjøre ting på samme måte?» 18.08.2014 3
Scenarier/eksempler 18.08.2014 Scenarier/eksempler NRK har fått i oppdrag å tilgjengeliggjøre gamle TV- og radioprogrammer på nettet. En slik tilgjengeliggjøring krever en nettside hvor publikum kan søke og navigere for å finne frem i et enormt materialet. En arbeidsgruppe hos NRK diskuterer hvordan de kan løse denne utfordringen. Gjennom NRKs 80-årige historie er programmer blitt lagret og beskrevet på ulike måter i samsvar med den teknologiske utviklingen. Beskrivelsene som skal understøtte søk og navigasjon kan foreligge i form av alt fra etiketter på voksruller og gamle disketter til digitale databasesystemer. Databasesystemene inneholder beskrivelser som stammer fra ulike faser i programproduksjonen, fra planlegging til arkivering. For å lage en oversiktlig sluttbrukertjeneste må gruppen hos NRK vurdere hvordan de best kan samordne dette mangfoldet av beskrivelser. 18.08.2014 4
Overblikk over emnet Fra programplanen: I emnet gis en bred oversikt over fagfeltet kunnskapsorganisasjon og gjenfinning samt fordypning i temaet dokumentbeskrivelse. Historisk gjennomgang og definisjoner av sentrale begreper innen kunnskapsorganisasjon og gjenfinning Fra Til Overblikk over emnet Bibliografiske datamodeller, registreringsstandarder og metadataskjemaer «Dokumentbeskrivelser» Tittel: Kroppens geni Emne: Marit Bjørgen, Petter Northug 5
Overblikk over emnet ER-modellering, relasjonsdatabaseteori og spørrespråket SQL SELECT * FROM Film WHERE Tittel = 'Psycho'; Overblikk over emnet Grunnleggende XML og strukturering av data med markeringsspråk <artikkel> <tittel>langrenn - en døende idrett?</tittel> <ingress>å heie på et smøreteam er nå en gang ikke helt det samme som å heie på Northug & co., der de halser rundt ute i løypene på vegne av konge, fedreland og Coop.</ingress> <metadata> <forfatter>tommy Sørbø</forfatter> <rolle>kunsthistoriker og dramatiker</rolle> </metadata> <avsnitt>ol er over, og vi nordmenn er sånn halvfornøyde med vår egen innsats: Elleve gull og nest beste nasjon, men i den norskeste av alle disipliner, lagrenn, ble vår beste prestasjon en bronsemedalje. Hvorfor? Smøreteamet gjorde ikke god nok jobb, mente noen. Det skyldes utstyret, mente andre. <land>norge</land> hadde simpelthen ikke fått tilgang på det nyeste og beste innenfor ski og skismøring.</avsnitt> </artikkel> 6
Overblikk over emnet Anvendelsesområder og utviklingsperspektiver innen kunnskapsorganisasjon og gjenfinning 7
Over eller under panseret Under panseret: «Maskinlesbarhet» Over panseret: «Sluttbrukerlesbarhet» Hvorfor databaseteori? 8
Hvorfor databaseteori? Hvor brukes databaser ellers? 9
Hvor brukes databaser ellers? Overalt! Hva er en database? En systematisk samling av data som er koblet sammen Som beskriver eller modellerer en del av verden Dataene i databasen er persistente Databaser tegnes typisk som en sylinder i diagrammer over IKT-arkitektur. 10
Data vs. informasjon Data Rene fakta eller tall som må behandles for å få mening Eksempel: J. K. Rowling og Harry Potter Informasjon Data i kontekst / tillagt tolkning Eksempel: J. K. Rowling har skrevet bøkene om Harry Potter Databasehåndteringssystem (DBMS) DBMS, forkortelse for Database Management System. Programvare for å opprette og administrere databaser. Databasen = samlingen med data og organiseringen av dem. Databasehåndteringssystemet = Programmet som håndterer databasen. 11
Databasehåndteringssystemet Kommunikasjon med databasen foregår via databasehåndteringssystemet (DBMS). Databasehåndteringssystemets oppgaver Definerer, styrer og administrerer databasen Skjuler tekniske detaljer for brukeren Styrer datasikkerheten Berger data ved eventuelle systemfeil Kontrollfunksjoner hindrer duplisering av data flerbrukerkontroll Støtter bruk av SQL Kan tilby flere ulike grensesnitt 12
Database med flere grensesnitt, ett DBMS SQL (Structured Query Language) ISO-standardisert spørrespråk Kommunikasjon med databaser via et DBMS SQL-spørringer Med SQL kan man bl.a.: opprette en database endre en database legge inn / fjerne data hente ut og koble sammen data 13
SQL Hvordan lages en database? 14
Hvordan lages en database? 1. Lag en konseptuell modell ved hjelp av ER-analyse (ER = Entity/Relationship) 2. Overføre den konseptuelle modellen til en logisk modell 3. Validere den logiske modellen ved hjelp av normalisering 4. Opprette databasen i relasjonsdatabasehåndteringssystemet vi har valgt (i vårt tilfelle MySQL) (fysisk nivå) Forholdet mellom de tre nivåene i datamodelleringen 15
Neste gang (10. september) ER-Analyse Les: Berget (2010), s. 1-23 16