INF1300 Introduksjon til databaser

Like dokumenter
INF1300 Introduksjon til databaser

INF1300 SQL Structured Query Language del 1. Stoff som blir/ble forelest i oktober 2013

INF1300 Introduksjon til databaser: SQL Structured Query Language. En første introduksjon Lysark til forelesning mandag 14.

INF1300 Introduksjon til databaser: SQL Structured Query Language. En første introduksjon Lysark til forelesning onsdag 22.

INF1300 Introduksjon til databaser: SQL Structured Query Language

SQL Structured Query Language

Relasjoner terminologi

UNIVERSITETET I OSLO SQL. Structured Query Language. (The intergalactic dataspeak) Institutt for Informatikk. INF Ragnar Normann 1

SQL Structured Query Language

SQL Structured Query Language. Definere tabeller Skranker Fylle tabeller med data

UNIVERSITETET I OSLO SQL. Structured Query Language. (forts.) Institutt for Informatikk. INF Ellen Munthe-Kaas 1

Integritetsregler i SQL

UNIVERSITETET SQL. Structured Query Language (forts.) Institutt for Informatikk. INF Ellen Munthe-Kaas 1

Integritetsregler i SQL. Primærnøkler

UNIVERSITETET I OSLO SQL. Structured Query Language. (forts.) Institutt for Informatikk. INF Ragnar Normann 1

SQL. SQL-standarder. Flere standarder: ANSI SQL SQL2 (SQL-92) SQL3 (SQL-99) = SQL2 + objekt-relasjonelle egenskaper mm

UNIVERSITETET I OSLO SQL. Structured Query Language. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

UNIVERSITETET I OSLO SQL. Structured Query Language. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

UNIVERSITETET SQL. Structured Query Language. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

Integritetsregler i SQL

UNIVERSITETET I OSLO SQL. Structured Query Language. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

UNIVERSITETET. triggere og views. Institutt for Informatikk. INF Arne Maus 1

Repetisjon: Normalformer og SQL

IN2090 Databaser og datamodellering 07 Datamanipulering

Metaspråket for å beskrive grammatikk

Databaser: Relasjonsmodellen, del I

UNIVERSITETET I OSLO SQL. Structured Query Language. (The intergalactic dataspeak) Institutt for Informatikk. INF Ellen Munthe-Kaas 1

1. SQL datadefinisjon og manipulering

Dagens tema: Relasjonsmodellen (funksjonelle avhengigheter og nøkler, integritetsregler) Realisering: Fra ORM til relasjoner

Datamodellering og databaser SQL, del 2

Sensorveiledning for IN2090 og INF desember :30 18:30 (4 timer)

INF1300 Introduksjon til databaser

Utvikling fra kjernen og ut

INF1300 Introduksjon til databaser

Datamodellering og databaser SQL, del 2

Oppgaver Oppgave a: Sett opp mulige relasjoner

Alle attributter har NULL som mulig verdi. mulige verdier for integer: NULL, 0, 1, 2, 3...

Notater: INF1300. Veronika Heimsbakk 8. januar 2013

Datamodellering og databaser SQL, del 2

INF1300 Relasjonsalgebra. Et matematisk fundament for å forstå SQL-setninger

INF212 - Databaseteori. Kursinnhold

Løsningsforslag til eksamen i IN2090 Databaser og datamodellering og INF1300 Introduksjon til databaser 6. desember :30 18:30 (4 timer)

Komplisert eksempel. IN2090 Databaser og datamodellering 07 Datamanipulering. Flere eksempler: Kombinere aggregater. Komplisert eksempel med WITH

INF1300 Det meste av resten av SQL. Utleggsark v. 2.0

INF3100 Databasesystemer

INF1300 Introduksjon til databaser

SQL Structured Query Language. Repetisjon av select spørringer Nestede select spørringer Mengdeoperasjoner Views Flere operatorer

Databaser. Relasjonsmodellen 1 Læreboka: Kap. 2 Relasjonsmodellen Faglærere: Tore Mallaug, Kjell Toft Hansen

INF1300 Relasjonsalgebra og SQL, mengder og bager. Lysark for forelesning v. 2.1

Relasjonsalgebraen. Algebra

Utvikling fra kjernen og ut

IN2090 Introduksjon til databaser

INF3100 Databasesystemer

Ekstramateriale: Eksempel på PostgreSQL 8.4 og SQL:1999 (ikke pensum 2012)

Miniverden og ER- modell

INF1300 Introduksjon til databaser

UNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

Spørsmålskompilering del 1

SQL Introduksjonskurs. Oversikt

Oppgave 1 (Opprett en database og en tabell)

INF1300 Introduksjon til databaser

1. Innføring i bruk av MySQL Query Browser

SQL: SELECT-spørringer

PENSUM H2012 INF1300. Joakim Myrvoll Johansen. Pensum fra forelesnings-foilere

Tilkobling og Triggere

UNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk. INF Ellen Munthe-Kaas

SQL 3: Opprette tabeller, datainnsetting og utsnitt

Spørsmålskompilering del 1

INF1300 Introduksjon til databaser

INF1300 Introduksjon til databaser

IN2090 Databaser og datamodellering. 08 Typer og skranker

Databasers typesystem. IN2090 Databaser og datamodellering. 08 Typer og skranker. SQL-standarden vs. RDBMSer. Hvilke datatyper har vi

IN2090 Databaser og datamodellering. 08 Typer og skranker

Løsningsforslag maskindatabasen på Ifi SQL og normalisering

Applikasjonsutvikling med databaser

Databaser. Relasjonsmodellen 2 Læreboka: Kap. 2 Relasjonsmodellen

Institutt for datateknikk. Fag TDT4145 Datamodellering og databasesystemer Løsningsforslag til øving 3: Algebra og SQL

EKSAMEN 6102 / 6102N DATABASER

IN2090 Introduksjon til databaser

Prosedyrer. Lars Vidar Magnusson. October 26, Lars Vidar Magnusson () Forelesning i DAS October 26, / 19

UNIVERSITETET I OSLO

SQL for INF1300. Stein Michael Storleer 7. november 2014

UNIVERSITETET I OSLO. Relasjonsmodellen. Relasjoner og funksjonelle avhengigheter. Institutt for Informatikk. INF Ellen Munthe-Kaas 1

SQL: SELECT-spørringer

Transkript:

UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: SQL SQLs definisjonsspråk SQLs spørrespråk: select-from-where distinct order by SQLs manipulasjonsspråk Indekser Filmdatabasen INF1300 15.09.2008 Ragnar Normann 1

SQL The Intergalactic Dataspeak SQL Structured Query Language er et deklarativt språk for spørringer mot relasjonsdatabaser SQL inneholder også konstruksjoner for å definere nye relasjonsdatabaser, for å legge inn og endre data i databasen, mm En referanse til PostgreSQL er http://www.postgresql.org/docs/8.2/interactive/ INF1300 15.09.2008 Ragnar Normann 2

Hvordan uttale «SQL» På norsk uttaler vi SQL bokstav for bokstav: «ess ku ell» På engelsk uttales SQL «si:kwel» Årsaken er historisk: SQL ble utviklet av IBM, og prototypen het SEQUEL et akronym for «Structured English QUEry Language» Da SEQUEL ble lansert som et produkt i 1976, ble navnet forkortet til SQL, men uttalen ble beholdt og har overlevd til nå INF1300 15.09.2008 Ragnar Normann 3

SQL-standarder Flere standarder: ANSI SQL (1986) SQL2 (SQL-92) SQL3 (SQL:1999) = SQL2 + objekt-relasjonelle egenskaper mm Mange dialekter: Hvert DBMS har sine særegenheter. Sjekk den aktuelle DBMSens dokumentasjon! Alle oppfyller ANSI SQL, stort sett også SQL2 Noen deler av SQL er ikke veldefinert (selv ikke i ANSI SQL) og behandles derfor potensielt forskjellig i forskjellige DBMSer INF1300 15.09.2008 Ragnar Normann 4

SQLs bestanddeler SQL består av en samling konstruksjoner som funksjonelt, men ikke syntaktisk, kan deles opp slik: SDL: Storage Definition Language 3-skjema-arkitekturens fysiske lag DDL: Data Definition Language 3-skjemaarkitekturens konseptuelle lag VDL: View Definition Language 3-skjemaarkitekturens presentasjonslag DML: Data Manipulation Language innlegging, endring og sletting av data DQL: Data Query Language spørrespråk DCL: Data Control Language integritet og sikkerhet INF1300 15.09.2008 Ragnar Normann 5

3-skjemaarkitekturen for databaser (repetisjon) Presentasjonslaget beskrevet med eksterne skjemaer («views») hvordan informasjon skal presenteres for ulike brukere Det konseptuelle (eller logiske) laget beskrevet i det begrepsmessige skjemaet hva som kan lagres og hva som er lovlige forandringer Det fysiske laget beskrevet i det interne skjemaet hvordan informasjon lagres, forandres og bearbeides INF1300 15.09.2008 Ragnar Normann 6

SQLs DDL create: Opprette tabell drop: Fjerne tabell alter table: Endre tabell Herunder: Legge til eller fjerne kolonner Legge til, fjerne eller endre integritetsregler (constraints)... INF1300 15.09.2008 Ragnar Normann 7

create create table R (A 1 datatype 1 [skranke 1 ],... A n datatype n [skranke n ], [LISTE AV SKRANKER] ); INF1300 15.09.2008 Ragnar Normann 8

Ansatt create - eksempel AId Navn Tittel Fdato Pnr AnsDato Ansatt(AId, Navn, Tittel, Fdato, Pnr, AnsDato) Vi ønsker ikke at to ansatte skal kunne ha samme AId To personer kan aldri ha samme fødselsnummer = Fdato + Pnr Dermed er både AId og (Fdato, Pnr) kandidatnøkler. Vi velger AId som primærnøkkel og markerer (Fdato, Pnr) som kandidatnøkkel. create table Ansatt ( AId int primary key, Navn varchar(40) not null, Tittel varchar(15) not null, Fdato char(6) not null, Pnr char(5) not null, AnsDato date, unique (Fdato, Pnr) ); INF1300 15.09.2008 Ragnar Normann 9

Datatyper i PostgreSQL Datatype integer real numeric(n,d) char(n), varchar(n) bit(n), bit varying(n) boolean date time timestamp... Forklaring Heltall Flyttall n desimale sifre, d etter desimalpunktum Tekst med henholdsvis fast og variabel lengde Bitstreng med henholdsvis fast og variabel lengde Boolsk verdi Dato Klokkeslett Dato og klokkeslett INF1300 15.09.2008 Ragnar Normann 10

Primærnøkler Kan deklareres i create table sammen med primærnøkkelattributtet (bare hvis attributtet utgjør primærnøkkelen alene) create table Ansatt ( AId int primary key,... ); Kan deklareres separat i create table etter attributtdeklarasjonene create table Ansatt ( AId int,... primary key (AId) ); INF1300 15.09.2008 Ragnar Normann 11

Primærnøkler, regler Maks én primærnøkkeldeklarasjon pr. relasjon Konsekvenser av deklarasjonen: To tupler i relasjonen får ikke stemme overens i alle attributtene i primærnøkkelen Forsøk på brudd ved insert eller update skal avvises av DBMSet Attributtene i primærnøkkelen får ikke inneholde null Dette må sjekkes av systemet ved hver insert og hver update INF1300 15.09.2008 Ragnar Normann 12

Kandidatnøkler Kan deklareres i create table sammen med nøkkelattributtet (bare hvis attributtet utgjør kandidatnøkkel alene) create table Ansatt (... Fnr char(11) not null unique,... ); Kan deklareres separat i create table etter attributtdeklarasjonene create table Ansatt (... Fdato char(6) not null, Pnr char(5) not null,... unique (Fdato, Pnr) ); INF1300 15.09.2008 Ragnar Normann 13

Kandidatnøkler, regler Flere kandidatnøkkeldeklarasjoner er tillatt pr. relasjon Konsekvenser av deklarasjonen: To tupler i relasjonen får ikke stemme overens i alle attributtene i kandidatnøkkelen Kan brytes hvis ett eller flere av attributtene i kandidatnøkkelen inneholder null Dette må sjekkes av systemet ved hver insert og hver update INF1300 15.09.2008 Ragnar Normann 14

Skranker Skranke på et attributt eller et tuppel i en relasjon: create table R (... check... ); Sjekkes ved insert og update av R Skranke på tvers av relasjoner: create trigger T...; Triggere vekkes når en hendelse (typisk insert, update, delete på en relasjon) skal til å inntreffe Når triggerne vekkes, eksekveres en tilhørende prosedyre INF1300 15.09.2008 Ragnar Normann 15

Skranke på ett attributt not null: create table Ansatt (... Fdato int not null,..); Konsekvenser: Kan ikke sette inn tuppel med verdien null i attributtet Kan ikke endre verdien til null senere check: create table Ansatt (... Tittel varchar(15) check (Tittel = Selger or Tittel = Direktør or..),...); Angir en betingelse på attributtet Sjekkes ved hver endring av attributtets verdi INF1300 15.09.2008 Ragnar Normann 16

Fremmednøkler Deklarasjon av fremmednøkler: create table Timeliste ( AId int references Ansatt (AId),..); Alternativt: create table Timeliste ( AId int,.. foreign key (AId) references Ansatt (AId)..); INF1300 15.09.2008 Ragnar Normann 17

Fremmednøkler, regler Konsekvenser av deklarasjonen: De refererte attributtene må være deklarert unique eller primary key Verdier ( null) som opptrer i fremmednøkkelens refererende attributter må opptre i de refererte attributtene Dette må sjekkes av systemet både ved insert, update og delete INF1300 15.09.2008 Ragnar Normann 18

drop, alter drop table R ; alter table R add A x D y ; alter table R drop A x ; R er et relasjonsnavn A x er et attributt D y er et domene INF1300 15.09.2008 Ragnar Normann 19

SQLs DQL select [distinct] ATTRIBUTTLISTE from NAVNELISTE [where WHERE-BETINGELSE] [group by GRUPPERINGSATTRIBUTTER [having HAVING-BETINGELSE] ] [order by ATTRIBUTT [asc desc] [, ATTRIBUTT [asc desc] ]... ]; [ ] betyr at dette leddet er en valgfri del av setningen betyr at leddet kan gjentas vilkårlig mange ganger INF1300 15.09.2008 Ragnar Normann 20

Select-setningens enkeltdeler select Angir hvilke attributter som skal vises i svaret distinct Fjerner flerforekomster (duplikater) av svar-tuplene from Navn på de relasjonene spørringen refererer til where Seleksjonsbetingelse (kan inneholde en eller flere join-betingelser) group by, having Angir grupperingsattributter til bruk ved aggregering og betingelser på resultatet av grupperingen; disse kommer vi tilbake til i en senere forelesning order by Ordner tuplene i henhold til angitte kriterier INF1300 15.09.2008 Ragnar Normann 21

Select-setningen Typisk utseende: select [distinct] a 1, a 2,..., a j from r 1, r 2,..., r k where C; hvor r 1, r 2,..., r k er relasjonsnavn a 1,...,a j er attributter fra r 1, r 2,..., r k C er en betingelse INF1300 15.09.2008 Ragnar Normann 22

Eksempelmodell INF1300 15.09.2008 Ragnar Normann 23

select eksempel 1 Skjema: Prosjekt(PId,Pnavn,KId,Pleder,StartDato) Ansatt(AId, Navn, Tittel, Fdato, Pnr, AnsDato) Timeliste(AId,Dato,PId,Timer) Kunde(KId,Knavn,Adresse) Oppgave: Finn navn på de ansatte som er ansatt etter 2003. (Det kan være flere ansatte som har samme navn.) Løsning: select distinct Navn from Ansatt where AnsDato > date 2003-12-31 ; INF1300 15.09.2008 Ragnar Normann 24

Merknader til SQL SQL skiller ikke mellom store og små bokstaver, unntatt i tekststrenger SQL beregner bager (med unntak av noen av operatorene) INF1300 15.09.2008 Ragnar Normann 25

select eksempel 2 Skjema: Prosjekt(PId,Pnavn,KId,Pleder,StartDato) Ansatt(AId,Navn,Tittel,Fdato,Pnr,AnsDato) Timeliste(AId,Dato,PId,Timer) Kunde(KId,Knavn,Adresse) Oppgave: Finn navn og startdato for alle prosjekter bestilt av kunden «Pust og pes AS». Sorter dem slik at det nyeste prosjektet kommer først. Løsning: select from where order by Pnavn, StartDato Kunde K, Prosjekt P Knavn = Pust og pes AS and K.KId = P.KId StartDato desc; INF1300 15.09.2008 Ragnar Normann 26

Seleksjons- og join-betingelser La oss se nærmere på løsningen på forrige lysark: select Pnavn, StartDato from Kunde K, Prosjekt P where Knavn = Pust og pes AS and K.KId = P.Kid order by StartDato desc; Where-betingelsen består av to deler: Knavn = Pust og pes AS Dette leddet kalles en seleksjonsbetingelse Det plukker ut forekomster i Kunde (her trolig bare en) K.KId = P.Kid Dette leddet kalles en join-betingelse Det kobler sammen forekomster fra Kunde med forekomster i Prosjekt forutsatt at verdiene i attributtene KId og Kid er like INF1300 15.09.2008 Ragnar Normann 27

Uttrykk i betingelser I where-betingelsen er et boolsk uttrykk hvor atomene har en av følgende former: Verdisammenlikning: P op Q P og Q må ha samme domene, minst en av dem må være et attributt, den andre kan være en konstant op {=, <, >, <=, >=, <>, like} (like er bare lov når Q er en konstant tekststreng) null-test: P is null eller P is not null Relasjonssammenlikning: exists, in, all, any (Disse tar vi for oss i en senere forelesning) INF1300 15.09.2008 Ragnar Normann 28

Uttrykk i betingelser II Spesialregler for sammenlikning av strenger : Leksikografisk ordning: s<t, s>t, s<=t, s>=t Sammenlikning: s=t, s<>t Mønstergjenkjenning: s like p p er et mønster hvor % matcher en vilkårlig sekvens (null eller flere tegn) _ matcher ett vilkårlig tegn INF1300 15.09.2008 Ragnar Normann 29

Uttrykk i betingelser III Datoer og tidspunkter: Dato: date yyyy-mm-dd Tidspunkt: time hh:mm, time hh:mm:ss Tidspunkt med finere gradering enn sekund: time hh:mm:ss.ccc Tidspunkt før GMT: time hh:mm:ss+hh Tidspunkt etter GMT: time hh:mm:ss-hh Dato og tid: timestamp yyyy-mm-dd hh:mm:ss INF1300 15.09.2008 Ragnar Normann 30

select eksempel 3 Skjema: Prosjekt(PId,Pnavn,Kunde,Pleder,StartDato) Ansatt(AId,Navn,Tittel,Fdato,Pnr,AnsDato) Timeliste(AId,Dato,PId,Timer) Kunde(KId,Knavn,Adresse) Oppgave: Finn navn og tittel på alle som har arbeidet på prosjektet Vintersalg Løsning: select distinct Navn, Tittel from Ansatt A, Timeliste T, Prosjekt P where Pnavn = Vintersalg and P.PId = T.PId and T.AId = A.AId; INF1300 15.09.2008 Ragnar Normann 31

Mer om joinbetingelser (select eksempel 3 forts.) Skjema: Prosjekt(PId,Pnavn,Kunde,Pleder,StartDato) Ansatt(AId,Navn,Tittel,Fdato,Pnr,AnsDato) Timeliste(AId,Dato,PId,Timer) Kunde(KId,Knavn,Adresse) Løsning: select distinct Navn, Tittel from Ansatt A, Timeliste T, Prosjekt P where Pnavn = Vintersalg and P.PId = T.PId and T.AId = A.AId; Her består join-betingelsen av to ledd Den binder sammen en forekomst fra hver av de tre tabellene Ansatt, Timeliste og Prosjekt At join-attributtene parvis har samme navn, er tilfeldig Det holder at de har samme domene INF1300 15.09.2008 Ragnar Normann 32

Navnekonflikter Kvalifiser attributter med relasjonsnavn: R.A Navngi relasjoner med aliaser:...from R as S... (as kan sløyfes) S blir en kopi av R med nytt relasjonsnavn Gi attributter nytt navn: select A as B from... A renavnes til B i resultatrelasjonen INF1300 15.09.2008 Ragnar Normann 33

SQLs DML insert: Innsetting av nye data update: Endring av eksisterende data delete: Sletting av data INF1300 15.09.2008 Ragnar Normann 34

insert insert into R(A1, A2,..., Ak) values (v1, v2,..., vk); insert into R(A1, A2,..., Ak) select-setning; Attributtlisten kan sløyfes hvis den dekker samtlige attributter i R og følger attributtenes default rekkefølge NB Optimaliseringer i DBMSet kan medføre at tuplene legges inn etterhvert som de beregnes i selectsetningen. Dette kan ha sideeffekter på beregningen av select-setningen INF1300 15.09.2008 Ragnar Normann 35

update, delete update R set A 1 =E 1,.., A k =E k [where C]; delete from R [where C]; [ ] betyr at dette leddet er en valgfri del av setningen INF1300 15.09.2008 Ragnar Normann 36

SQLs SDL: indekser create index X on R(A 1,..,A k ); drop index X; Valg av indekser må gjøres med omhu. Indekser gjør at spørringer mot vedkommende attributt(er) går mye fortere innsetting, sletting og oppdatering blir mer komplisert og tidkrevende INF1300 15.09.2008 Ragnar Normann 37

Implementasjon av indekser Implementasjon av indekser: B+-trær Hash... For mer informasjon: Se INF2220 Algoritmer og datastrukturer INF1300 15.09.2008 Ragnar Normann 38

Indekser på kandidatnøkler DBMSer bygger vanligvis indekser automatisk på primærnøklene. For hver kandidatnøkkel må man vurdere spesielt om det bør deklareres indeks på nøkkelen Syntaks avhenger av DBMSet Noen SQL-implementasjoner tillater deklarasjon av kandidatnøkkel + indeks i en og samme setning: create unique index FnrIndex on Ansatt (Fdato, Pnr); I Postgres bygges automatisk en unique index på kandidatnøkler. Hvis det er opprettet indeks på en nøkkel, benyttes denne under sjekk av flerforekomster Ellers: Må i verste fall søke gjennom hele relasjonen INF1300 15.09.2008 Ragnar Normann 39

Hvordan aksessere filmdatabasen Fra Linux-promptet > gi kommandoen > psql -h kurspg -U <brukernavn> -d fdb og du blir bedt om å oppgi PostgreSQL-passordet ditt kurspg er vertsmaskinen, <brukernavn> er ditt Postgresbrukernavn, og fdb er navnet på filmdatabasen Dersom du vil lage egne tabeller, skriver du ditt eget brukernavn i stedet for fdb For å kjøre en kommandofil, skriv \i <filnavn> For å avslutte, skriv \q Les forøvrig dokumentet om filmdatabasen og postgres som er tilgjengelig via lenke fra kursets semesterside. INF1300 15.09.2008 Ragnar Normann 40