INF1300 Introduksjon til databaser

Like dokumenter
UNIVERSITETET I OSLO INF1300 Introduksjon til databaser

Informasjonsbærende representasjoner

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser

Dagens tema: Ringskranker Informasjonsbærende representasjoner Behandling av tid Tommelfingerregler

Dagens tema: Ekvivalente stier og joinskranker Ringskranker Informasjonsbærende representasjoner Behandling av tid

INF1300 Introduksjon til databaser

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker Verdiskranker Mengdeskranker Underbegreper og underbegrepsskranker Kombinerte totale roller

INF1300 Introduksjon til databaser

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker Representasjon n-1-regelen Verdiskranker Mengdeskranker

INF1300 Introduksjon til databaser

Repetisjon: (nesten) alt du trenger å kunne om ORM og realisering

Repetisjon: (nesten) alt du trenger å kunne om ORM og realisering

Notater: INF1300. Veronika Heimsbakk 8. januar 2013

PENSUM H2012 INF1300. Joakim Myrvoll Johansen. Pensum fra forelesnings-foilere

INF1300 Introduksjon til databaser

Repetisjon: (nesten) alt du trenger å kunne om ORM og realisering

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

IN2090 Databaser og datamodellering ORM 1

INF1300 Introduksjon til databaser

Realiseringsalgoritmen fra ORM til relasjoner Intro til mengdeskranker i ORM

Datamodellering med ORM

INF1300 Introduksjon til databaser

Dataorientert modellering

Dagens tema: Realiseringsalgoritmen (også kalt "grupperingsalgoritmen") fra ORM-diagram til relasjonsskjema

Dagens tema: Relasjonsmodellen Funksjonelle avhengigheter og nøkler Realisering: Fra ORM til relasjoner

INF1300 Introduksjon til databaser

INF Introduksjon til databaser ORM I

Dagens tema: Relasjonsmodellen (funksjonelle avhengigheter og nøkler, integritetsregler) Realisering: Fra ORM til relasjoner

Dataorientert modellering

INF1300 Introduksjon til databaser

Forelesning INF1300. Simen Buodd. Plenumstime 8. September 2015

INF1300 Introduksjon til databaser

Språk for dataorientert modellering

INF1300 Introduksjon til databaser

INF september Relasjonsmodellen funksjonelle avhengigheter og nøkler Realisering: Fra ORM til relasjoner

Flere skranker i ORM Integritetsregler med «CHECK» i SQL

Modellenes to formål. Datamodellering med UML (forts.) Ugrupperte og grupperte modeller. Figur 5-2. Ogdens trekant

Modellenes to formål. Datamodellering med UML (forts.) Ugrupperte og grupperte modeller. Figur 5-2. Ogdens trekant

IN2090 Introduksjon til databaser

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet. INF1080 Logiske metoder for informatikk

IN2090 Introduksjon til databaser

Relasjonsdatabasedesign

INF1300. Grunnbegrepene i ORM: fakta, begreper, roller, faktatyper, broer, entydighetsskranker, totale roller, funksjonelle avhengigheter

INF1300 Introduksjon til databaser

INF3100 Databasesystemer

UNIVERSITETET. Relasjonsdatabasedesign

Relasjonsdatabasedesign

Forelesning 30: Kompleksitetsteori

MAT1030 Diskret Matematikk

Kapittel 5: Mengdelære

Relasjonsdatabasedesign

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

Dagens tema: Eksempel Klisjéer (mønstre) Tommelfingerregler

UNIVERSITETET I OSLO

INF1050 Klasseromsoppgave Uke 6

MATOPPSKRIFTER Obligatorisk oppgave nr. 2 i INF1300 høsten 2010

Relasjonsdatabasedesign

Datamodellering med UML. Modellenes to formål. The Unified Modeling Language - UML

Datamodellering med UML (forts.)

The Unified Modeling Language - UML

Datamodellering med UML

INF3100 Databasesystemer

Hvis Ole følger inf3170, så liker Ole logikk. Ole følger inf3170, og Ole følger ikke inf3170. Ole følger inf3170, eller Ole følger ikke inf3170.

UNIVERSITETET I OSLO

Dagens plan. INF3170 Logikk. Syntaks: Utsagnslogiske formler. Motivasjon

Relasjonsdatabasedesign

Oppgaver til INF 5110, kapittel 5 Fullt svar på oppgave 5.4, og en del andre oppgaver med svar

INF1800 LOGIKK OG BEREGNBARHET

UNIVERSITETET I OSLO

Transkript:

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: Underbegreper Underbegrepsskranker Ekvivalente stier og joinskranker Behandling av tid Informasjonsbærende representasjoner INF1300 22.09.2008 Ragnar Normann 1

Underbegreper Kjernespørsmål: Kan alle tenkelige forekomster av et begrep spille alle roller som er knyttet til begrepet? Hvis nei: Kan få en mer presis modell ved å innføre underbegreper B er et underbegrep av A hvis vi alltid har at pop(b) pop(a) Notasjon: INF1300 22.09.2008 Ragnar Normann 2

Underbegrepsskranke INF1300 22.09.2008 Ragnar Normann 3

Underbegreper Underbegreper arver representasjon og roller fra superbegrepet. I tillegg har de sine egne roller Underbegrepsskranker brukes til å bestemme hvilket underbegrep hver enkelt forekomst tilhører Underbegreper kan overlappe eller være disjunkte Underbegrepene kan, men må ikke, være uttømmende mhp sitt superbegrep Resonnementer over entydighetsskranker, påkrevde roller og underbegrepsskrankene avslører om underbegrepene er overlappende og/eller uttømmende INF1300 22.09.2008 Ragnar Normann 4

Eksempel på overlappende og ikke-uttømmende underbegreper INF1300 22.09.2008 Ragnar Normann 5

Underbegreper i flere nivåer Det transitive underbegrepet tegnes ikke inn! INF1300 22.09.2008 Ragnar Normann 6

Påkrevd rollekombinasjon A skal ha enten rollen r1 eller rollen r2. pop(r1) pop(r2) = pop(a) for alle tilstander INF1300 22.09.2008 Ragnar Normann 7

Eksempel på påkrevd rollekombinasjon og underbegrep INF1300 22.09.2008 Ragnar Normann 8

Generell påkrevd rollekombinasjon pop(r1) pop(r2)... pop(rk) = pop(a) INF1300 22.09.2008 Ragnar Normann 9

Se opp for manglende påkrevde roller Mangel på påkrevde roller kan indikere et underbegrep INF1300 22.09.2008 Ragnar Normann 10

Spesialisering og generalisering INF1300 22.09.2008 Ragnar Normann 11

Stier Dette er en sti fra A til B INF1300 22.09.2008 Ragnar Normann 12

Ekvivalente stier Dersom vi har to stier fra A til B som er slik at hvis vi starter med én forekomst i A, så skal vi komme til samme forekomst i B uavhengig av hvilken av de to stiene vi følger, så kaller vi de to stiene ekvivalente. INF1300 22.09.2008 Ragnar Normann 13

Avledbare data - 1 Unødvendig (avledbar) informasjon Merk de ekvivalente stiene! INF1300 22.09.2008 Ragnar Normann 14

Avledbare data - 2 Unødvendig (avledbar) informasjon? Det kan være mange grunner til å lagre avledbar informasjon INF1300 22.09.2008 Ragnar Normann 15

Eksempel på ekvivalente stier INF1300 22.09.2008 Ragnar Normann 16

Joinskranker Ekvivalente stier er et viktig eksempel på det vi kaller joinskranker For å håndheve disse skrankene kan det være nødvendig å foreta en join mellom tabeller Alle mengdeskranker kan opptre som joinskranker Ekvivalente stier er en joinlikhetsskranke INF1300 22.09.2008 Ragnar Normann 17

Avanserte skranker Alle skranker vi ikke har grafiske symboler for, kalles avanserte skranker Disse skrives på ORM-diagrammet som tekst Lovlig språk er førsteordens logikk og vanlig aritmetikk (regneformler) Lovlige variable er konstanter, roller, stier og inverse stier Se f.eks. foilen Avledbare data 2 ORM 2 har et eget språk for avanserte skranker INF1300 22.09.2008 Ragnar Normann 18

Behandling av tid Versjonering Hva er et tidspunkt Hva skal et tidsstempel reflektere Praktisk versjonsmodellering INF1300 22.09.2008 Ragnar Normann 19

Versjonering Hvis vi ønsker at databasen skal vise historiske opplysninger, lagrer vi tidsstemplede versjoner av informasjonen Med en versjon mener vi her et øyeblikksbilde av all informasjon De tidsstemplede versjonene kan ordnes langs en tidsakse INF1300 22.09.2008 Ragnar Normann 20

Versjoner med tidsstempel ansatt avdeling 120 salg 110 salg 081 produksjon 230 økonomi prosjekt ansatt prosj.timer Alfa 120 200 Beta 120 250 Alfa 110 75 Alfa 081 150 Beta 230 100 ansatt avdeling 120 salg 110 salg 081 produksjon 2007 03 230 07 økonomi prosjekt ansatt prosj.timer Alfa 120 207 Beta 120 250 Alfa 110 81 Alfa 081 157 Beta 230 106 ansatt avdeling 120 salg 110 salg 081 produksjon 2007 230 03 08 salg prosjekt ansatt prosj.timer Alfa 120 207 Beta 120 256 Alfa 110 88 Alfa 081 164 Beta 230 113 2007 03 09 t INF1300 22.09.2008 Ragnar Normann 21

Hva er et tidspunkt Tidsaksen består i praksis alltid av tidsintervaller i informasjonsmodellen Granulariteten til intervallene avhenger av behovet for nøyaktighet. Granularitet avgjør hvordan tidsintervallene skal representeres Hvert tidsintervall identifiseres ved et tidsstempel, f.eks. år+måned, år+ukenummer, år+mnd+dag+time+minutt hva som er samtidig Hendelser innen samme tidsintervall kan ikke skilles i tid En informasjonsmodell kan ha flere tidsakser med ulik oppdeling og granularitet det er ikke alltid mulig å bestemme samtidighet på tvers av ulike tidsakser INF1300 22.09.2008 Ragnar Normann 22

Forskjellige tidsakser, eksempel september 2007 Uke ma ti on to fr lø sø 35 1 2 36 3 4 5 6 7 8 9 37 10 11 12 13 14 15 16 38 17 18 19 20 21 22 23 39 24 25 26 27 28 29 30 4: 11: 19: 26: dag uke måned 244 273 35 36 37 38 39 40 9 10 INF1300 22.09.2008 Ragnar Normann 23

Tidsmessig isomorfi Utviklingen av versjonene må gjenspeile virkeligheten på en hensiktsmessig måte Hvilken type tidspunkter tidsstempelet skal inneholde, må velges etter hva modellen skal reflektere Versjonene må registreres i databasen slik at forsinkelsen fra hendelse til registrering er akseptabel INF1300 22.09.2008 Ragnar Normann 24

Hva skal tidsstempelet reflektere? 1. Når en hendelse faktisk inntraff? 2. Når versjonen ble lagt inn? 3. Når versjonen skal tre i kraft? 4. Når versjonen ble ugyldig? 5.... Maks én av disse! (men neppe nr. 4) Merk: De fleste modeller ligger etter virkeligheten, f.eks. nr.1 (og nr. 2): Det tar tid før en hendelse i virkeligheten kan gjenfinnes som en versjon i databasen (mikrosekunder til dager, avhengig av registreringsprosess) Noen modeller må ligge foran virkeligheten, f.eks. nr.3 INF1300 22.09.2008 Ragnar Normann 25

Tidsmessig kontinuitet Det er maksimalt én versjon pr. mulig tidsstempel Dersom det legges inn færre enn en versjon pr. mulig tidsstempel, så må det være mulig å avlede ikke-materaliserte versjoner for de tidsstemplene som ikke har en tilhørende versjon INF1300 22.09.2008 Ragnar Normann 26

Tidsmessig kontinuitet ansatt avdeling 120 salg 110 salg 081 produksjon 230 økonomi prosjekt ansatt prosj.timer Alfa 120 200 Beta 120 250 Alfa 110 75 Alfa 081 150 Beta 230 100 ansatt avdeling 120 salg 110 salg 081 produksjon 230 2007 03 07 økonomi prosjekt ansatt prosj.timer Alfa 120 203 Beta 120 253 Alfa 110 81 Alfa 081 157 Beta 230 106 ikke-materalisert versjon ansatt avdeling 120 salg 110 salg 081 produksjon 2007 03 08 230 salg prosjekt ansatt prosj.timer Alfa 120 207 Beta 120 256 Alfa 110 88 Alfa 081 164 Beta 230 113 2007 03 09 t INF1300 22.09.2008 Ragnar Normann 27

Film- eller lysbildeprinsippet? lysbildeprinsippet filmprinsippet INF1300 22.09.2008 Ragnar Normann 28

Film- og lysbildeprinsippet Filmprinsippet: Én ny versjon for hvert nytt mulig tidsstempel Trenger mye lagerplass ved fin granularitet Lysbildeprinsippet: Observerer og registrerer virkeligheten bare av og til Bygg inn nok kunnskap til at de ikkemateraliserte versjonene kan utledes INF1300 22.09.2008 Ragnar Normann 29

Elementære setninger og tid Tre typer elementære setninger: De som ikke har noen tidsdimensjon De hvor vi bare ønsker å ta vare på siste aktuelle verdi De hvor vi ønsker å modellere en tidsdimensjon Virkeligheten har to typer endringer: Kontinuerlige Sprangvise Virkelighet kontra modell: Versjonene endrer seg alltid i rykk og napp Versjonene kan være tidsmessig forskjøvet i forhold til virkeligheten INF1300 22.09.2008 Ragnar Normann 30

Begrepsdannelse med tidsaksen INF1300 22.09.2008 Ragnar Normann 31

Eksempel INF1300 22.09.2008 Ragnar Normann 32

Eksempel: Hvor lenge varer det? INF1300 22.09.2008 Ragnar Normann 33

Angivelse av opphør INF1300 22.09.2008 Ragnar Normann 34

Angivelse av varighet INF1300 22.09.2008 Ragnar Normann 35

Representasjoner Alle begreper må kunne representeres Begrepsforekomster kan ikke lagres; det vi lagrer, er representasjonsforekomster Skal vi kunne realisere modellen som en relasjonsdatabase, må vi representere alle begrepene entydig INF1300 22.09.2008 Ragnar Normann 36

Valg av representasjon Valg av representasjon: entydig bro mellom en forekomst av en representasjon og forekomsten av det tilhørende begrepet helst uforanderlig støtte utveksling av informasjon mellom systemer Identifikator = representasjon hvor det er en uforanderlig en-til-en-bro mellom begrep og representasjon INF1300 22.09.2008 Ragnar Normann 37

Representasjonstyper navn, koder, forkortelser boolske verdier tellbare størrelser tids- og romlige verdier fritekst representasjoner av bilde og lyd INF1300 22.09.2008 Ragnar Normann 38

Ikke-informasjonsbærende representasjoner Representasjonen til begrepet identifiserer en forekomst av begrepet Det fins ingen innkodet informasjon i representasjonen INF1300 22.09.2008 Ragnar Normann 39

Delvis informasjonsbærende representasjoner Deler av representasjonen til et begrep identifiserer en forekomst av et annet begrep Dette kan, men behøver ikke, være synlig i modellen INF1300 22.09.2008 Ragnar Normann 40

Totalt informasjonsbærende representasjoner Representasjonen til begrepet består av en samling elementer der hvert element identifiserer en forekomst av et annet begrep INF1300 22.09.2008 Ragnar Normann 41

Synliggjøring eller ikke av informasjonsbærende representasjon i modellen? Hvis det er en mulighet for at brukeren etterspør denne informasjonen, bør den vises i modellen INF1300 22.09.2008 Ragnar Normann 42

Representasjon via superbegrep Underbegreper arver alltid representasjonen til sitt superbegrep INF1300 22.09.2008 Ragnar Normann 43

Representasjon via en-til-en-faktatype Et begrep med en påkrevd rolle i en en-til-enfaktatype til et annet begrep kan identifiseres indirekte gjennom det andre begrepet Eksempel: En hovedstad kan identifiseres med det landet den er hovedstad i INF1300 22.09.2008 Ragnar Normann 44

Referansebegreper Et begrep som ikke spiller noen andre gruppererroller enn de som inngår i den prefererte referansen, og som spiller minst en referanserolle, kalles et referansebegrep Tabeller som kommer fra referansebegreper, kan fjernes (supresses) fra relasjonsdatabaseskjemaet Alle begrepene nedenfor er referansebegreper INF1300 22.09.2008 Ragnar Normann 45