Dagens tema: Ringskranker Informasjonsbærende representasjoner Behandling av tid Tommelfingerregler

Like dokumenter
Dagens tema: Underbegreper og underbegrepsskranker Kombinerte totale roller Behandling av tid Informasjonsbærende representasjoner Ringskranker

Dagens tema: Ekvivalente stier og joinskranker Ringskranker Informasjonsbærende representasjoner Behandling av tid

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser

Informasjonsbærende representasjoner

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser

Dagens tema: Ringskranker Klisjéer (mønstre) Tommelfingerregler

UNIVERSITETET I OSLO INF1300. Dagens tema: Ringskranker. Tommelfingerregler. Institutt for informatikk. INF Ellen Munthe-Kaas 1

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

Flere skranker i ORM Integritetsregler med «CHECK» i SQL

INF1300 Introduksjon til databaser

Dagens tema: Eksempel Klisjéer (mønstre) Tommelfingerregler

Repetisjon: (nesten) alt du trenger å kunne om ORM og realisering

Repetisjon: (nesten) alt du trenger å kunne om ORM og realisering

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker Representasjon n-1-regelen Verdiskranker Mengdeskranker

PENSUM H2012 INF1300. Joakim Myrvoll Johansen. Pensum fra forelesnings-foilere

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker Verdiskranker Mengdeskranker Underbegreper og underbegrepsskranker Kombinerte totale roller

Vegard Nossum. 21. oktober 2010

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker Representasjon n-1-regelen

Repetisjon: (nesten) alt du trenger å kunne om ORM og realisering

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker Verdiskranker Mengdeskranker

Dagens tema: Begrepsdannelse Eksterne entydighetsskranker

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

Dagens tema: Relasjonsmodellen (funksjonelle avhengigheter og nøkler, integritetsregler) Realisering: Fra ORM til relasjoner

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

Dataorientert modellering

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

Dagens tema. Den redundansfri datamodellen. Modellenes to formål. Den grunnleggende konstruksjonen det elementære utsagnet

INF1050 Klasseromsoppgave Uke 7

Dagens tema: Realiseringsalgoritmen (også kalt "grupperingsalgoritmen") fra ORM-diagram til relasjonsskjema

IN2090 Databaser og datamodellering ORM 1

INF1300 Introduksjon til databaser

Gruppeøvelse 20/ Dagens tema: - Gruppering/realisering

Modellenes to formål. Datamodellering med UML (forts.) Ugrupperte og grupperte modeller. Figur 5-2. Ogdens trekant

Relasjonsdatabasedesign

Relasjonsdatabasedesign

*UXSSHULQJ IRU JUDXWVNDOOHU (QYLVXHOOJXLGHJMHQQRPQRHQ DY1,$0JUXSSHULQJHQV XQGHUIXQGLJKHWHU

INF1300 Introduksjon til databaser

INF1800 LOGIKK OG BEREGNBARHET

Repetisjon INF1800 LOGIKK OG BEREGNBARHET FORELESNING 3: MENGDELÆRE, RELASJONER, FUNKSJONER. Mengder. Multimengder og tupler.

Datamodellering med ORM

INF1300 Introduksjon til databaser

IN2090 Introduksjon til databaser

Dagens tema. Den redundansfri datamodellen. Modellenes to formål. Individer i interesseområdet

Den redundansfri datamodellen

Relasjonsdatabasedesign

UNIVERSITETET I OSLO. Relasjonsmodellen. Relasjoner og funksjonelle avhengigheter. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

Modellenes to formål. Datamodellering med UML (forts.) Fra naturlig språk til datamodell. Figur 5-2. Ogdens trekant

INF Introduksjon til databaser ORM I

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

UNIVERSITETET. Relasjonsdatabasedesign

Repetisjonsforelesning - INF1080

Sensorveiledning for IN2090 og INF desember :30 18:30 (4 timer)

Relasjonsdatabasedesign

UNIVERSITETET I OSLO

Relasjonsdatabasedesign

VÆRSTASJONER Obligatorisk oppgave nr. 2 i INF1300 høsten 2011

Realiseringsalgoritmen fra ORM til relasjoner Intro til mengdeskranker i ORM

Modellenes to formål. Datamodellering med UML (forts.) Ugrupperte og grupperte modeller. Figur 5-2. Ogdens trekant

Relasjonsdatabasedesign

Relasjonsdatabasedesign

UNIVERSITETET I OSLO

Notat 05 for MAT Relasjoner, operasjoner, ringer. 5.1 Relasjoner

Relasjonsdatabasedesign

IN2090 Introduksjon til databaser

Relasjonsdatabasedesign

Tillegg til kapittel 11: Mer om relasjoner

Relasjonsdatabasedesign

{(1,0), (2,0), (2,1), (3,0), (3,1), (3,2), (4,0), (4,1), (4,2), (4,3) } {(1,0), (1,1), (1,2), (1,3), (2,0), (2,2), (3,0), (3,3), (4,0)}

Datamodellering med UML. Modellenes to formål. The Unified Modeling Language - UML

UNIVERSITETET I OSLO

INF1300. Grunnbegrepene i ORM: fakta, begreper, roller, faktatyper, broer, entydighetsskranker, totale roller, funksjonelle avhengigheter

INF3100 Databasesystemer

Datamodellering med UML

INF3100 Databasesystemer

INF1300 Introduksjon til databaser

Datamodellering med UML (forts.)

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Notater: INF1300. Veronika Heimsbakk 8. januar 2013

INF1300 Introduksjon til databaser

Dataorientert modellering

INF1300 Introduksjon til databaser

MAT1030 Diskret Matematikk

Forelesning 30: Kompleksitetsteori

INF212 - Databaseteori. Kursinnhold

The Unified Modeling Language - UML

Relasjonsdatabasedesign

MAT1030 Diskret matematikk

Kapittel 6: Funksjoner

Forelesning 23. MAT1030 Diskret Matematikk. Repetisjon og mer motivasjon. Repetisjon og mer motivasjon. Forelesning 23: Grafteori.

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet. INF1080 Logiske metoder for informatikk

Dagens plan. INF3170 Logikk

Transkript:

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: Ringskranker Informasjonsbærende representasjoner Behandling av tid Tommelfingerregler Institutt for informatikk INF1300 21.09.2015 1

Ringskranker 2

Refleksiv skranke x pop(r1) pop(r2) (x,x) pop(r1,r2) 3

Symmetriskranke (x,y) pop(r1,r2) (y,x) pop(r1,r2) 4

Transitiv skranke (x,y) pop(r1,r2) (y,z) pop(r1,r2) (x,z) pop(r1,r2) 5

Irrefleksiv skranke (x,x) pop(r1,r2) 6

Antisymmetriskranke (x,y) pop(r1,r2) x y (y,x) pop(r1,r2) 7

Asymmetriskranke = antisymmetri + irrefleksivitet 8

Intransitiv skranke (x,y) pop(r1,r2) (y,z) pop(r1,r2) (x,z) pop(r1,r2) 9

Asyklisk skranke (x 1,x 2 ) pop(r1,r2)... (x n-1, x n ) pop(r1,r2) (x n, x 1 ) pop(r1,r2) 10

Kombinerte ringskranker asyklisk og intransitiv asymmetrisk og intransitiv symmetrisk og intransitiv symmetrisk og irrefleksiv 11

Representasjoner Alle begreper må kunne representeres Begrepsforekomster kan ikke lagres; det vi lagrer, er representasjonsforekomster Skal vi kunne realisere modellen som en relasjonsdatabase, må vi representere alle begrepene entydig Identifikator = representasjon hvor det er en uforanderlig en-til-en-bro mellom begrep og representasjon 12

Representasjonstyper navn, koder, forkortelser boolske verdier tellbare størrelser tids- og romlige verdier Fritekst... 13

Ikke-informasjonsbærende representasjoner Representasjonen til begrepet identifiserer en forekomst av begrepet Det fins ingen innkodet informasjon i representasjonen 14

Delvis informasjonsbærende representasjoner Deler av representasjonen til et begrep identifiserer en forekomst av et annet begrep Dette kan, men behøver ikke, være synlig i modellen 15

Totalt informasjonsbærende representasjoner Representasjonen til begrepet består av en samling elementer der hvert element identifiserer en forekomst av et annet begrep 16

Synliggjøring eller ikke av informasjonsbærende representasjon i modellen? Hvis det er en mulighet for at brukeren etterspør denne informasjonen, bør den vises i modellen 17

Representasjon via superbegrep Underbegreper arver alltid representasjonen til sitt superbegrep 18

Representasjon via en-til-en-faktatype Et begrep med en påkrevd rolle i en en-til-enfaktatype til et annet begrep kan identifiseres indirekte gjennom det andre begrepet Eksempel: En hovedstad kan identifiseres med det landet den er hovedstad i 19

Behandling av tid Versjonering Hva er et tidspunkt Hva skal et tidsstempel reflektere Praktisk versjonsmodellering 20

Versjonering Hvis vi ønsker at databasen skal vise historiske opplysninger, lagrer vi tidsstemplede versjoner av informasjonen Med en versjon mener vi her et øyeblikksbilde av all informasjon De tidsstemplede versjonene kan ordnes langs en tidsakse 21

Versjoner med tidsstempel ansatt avdeling 120 salg 110 salg 081 produksjon 230 økonomi prosjekt ansatt prosj.timer Alfa 120 200 Beta 120 250 Alfa 110 75 Alfa 081 150 Beta 230 100 ansatt avdeling 120 salg 110 salg 081 produksjon 2007 03 23007 økonomi prosjekt ansatt prosj.timer Alfa 120 207 Beta 120 250 Alfa 110 81 Alfa 081 157 Beta 230 106 ansatt avdeling 120 salg 110 salg 081 produksjon 2007 230 03 08 salg prosjekt ansatt prosj.timer Alfa 120 207 Beta 120 256 Alfa 110 88 Alfa 081 164 Beta 230 113 2007 03 09 t 22

Hva er et tidspunkt Tidsaksen består i praksis alltid av tidsintervaller i informasjonsmodellen Granulariteten til intervallene avhenger av behovet for nøyaktighet. Granularitet avgjør hvordan tidsintervallene skal representeres Hvert tidsintervall identifiseres ved et tidsstempel, f.eks. år+måned, år+ukenummer, år+mnd+dag, år+mnd+dag+time+minutt hva som er «samtidig» Hendelser innen samme tidsintervall kan ikke skilles i tid En informasjonsmodell kan ha flere tidsakser med ulik oppdeling og granularitet 23

Tidsmessig isomorfi Utviklingen av versjonene må gjenspeile virkeligheten på en hensiktsmessig måte Hvilken type tidspunkter tidsstempelet skal inneholde, må velges etter hva modellen skal reflektere Versjonene må registreres i databasen slik at forsinkelsen fra hendelse til registrering er akseptabel 24

Hva skal tidsstempelet reflektere? 1. Når en hendelse faktisk inntraff? 2. Når versjonen ble lagt inn? 3. Når versjonen skal tre i kraft? 4. Når versjonen ble ugyldig? 5.... Maks én av disse! (men neppe nr. 4) Merk: De fleste modeller ligger etter virkeligheten, f.eks. nr.1 (og nr. 2): Det tar tid før en hendelse i virkeligheten kan gjenfinnes som en versjon i databasen (mikrosekunder til dager, avhengig av registreringsprosess) Noen modeller må ligge «foran» virkeligheten, f.eks. nr.3 25

Tidsmessig kontinuitet Det er maksimalt én versjon pr. mulig tidsstempel Dersom det legges inn færre enn en versjon pr. mulig tidsstempel, så må det være mulig å avlede ikke-materialiserte versjoner for de tidsstemplene som ikke har en tilhørende versjon 26

Tidsmessig kontinuitet ansatt avdeling 120 salg 110 salg 081 produksjon 230 økonomi prosjekt ansatt prosj.timer Alfa 120 200 Beta 120 250 Alfa 110 75 Alfa 081 150 Beta 230 100 ansatt avdeling 120 salg 110 salg 081 produksjon 230 2007 03 07 økonomi prosjekt ansatt prosj.timer Alfa 120 204 Beta 120 253 Alfa 110 82 Alfa 081 157 Beta 230 107 ikke-materialisert versjon ansatt avdeling 120 salg 110 salg 081 produksjon 2007 03 08 230 salg prosjekt ansatt prosj.timer Alfa 120 207 Beta 120 256 Alfa 110 88 Alfa 081 164 Beta 230 113 2007 03 09 t 27

Film- eller lysbildeprinsippet? lysbildeprinsippet filmprinsippet 28

Film- og lysbildeprinsippet Filmprinsippet: Én ny versjon for hvert nytt mulig tidsstempel Trenger mye lagerplass ved fin granularitet Lysbildeprinsippet: Observerer og registrerer virkeligheten bare av og til Bygg inn nok kunnskap til at de ikkematerialiserte versjonene kan utledes 29

Begrepsdannelse med tidsaksen 30

Eksempel 31

Eksempel: Hvor lenge varer det? 32

Angivelse av opphør 33

Angivelse av varighet 34

Tommelfingerregler 1. Vær skeptisk overfor «mange-til-mange» (lange piler) og «en-tilen» (to korte piler) 2. Total rolle står vanligvis på samme side som entydighetsskranken 3. Entydighetsskranken omfatter sjelden mål, vekt, antall o.l. 4. Entydighetsskranken omfatter (nesten) aldri to tidspunkter 5. Manglende total rolle kan skjule et underbegrep 6. Dersom flere stier fører fra et begrep til et annet, sjekk om det finnes overflødige faktatyper eller om vi har ekvivalente stier/ joinskranker 7. Ikke formaliser fritekst det ikke skal søkes i 8. Vær skeptisk overfor begrepsdannelser og underbegreper uten grupperende roller 35

Tommelfingerregler (forts.) 9. Roller som spilles av begrepsdannelser har som oftest en entydighetsskranke (intern eller ekstern) 10. Bruk standardiserte referansemåter hvis de finnes 11. Dersom to begreper har samme referansemåte, bør de sannsynligvis tilhøre samme underbegrepsfamilie 12. Ikke baser informasjonsbærende referansemåter på ustabile fakta 13. Gjør informasjonsmodellen robust mot forretningsmessige og politiske endringer (av forretningsreglene i interesseområdet) 36