DBS18 - Strategier for Query-prosessering
|
|
- Jacob Corneliussen
- 7 år siden
- Visninger:
Transkript
1 Side 1 for Databaser DBS18 - Strategier for Query-prosessering søndag 22. mai Pensum , side , unntatt og En spørring som blir skrevet i et høynivå-språk, må bli scannet, altså å identifisere de ulike typene ord i spørringen (sql-ord, attributtnavn, tabellnavn); parset, å sjekke at syntaksen er riktig; og validert, sjekke at attributtnavn og tabellnavn faktisk eksisterer. Spørringen får deretter en intern representasjon, ofte i form av en spørringstre, eller en spørringsgraf (DAG). Deretter må databasehåndteringssystemet planlegge en kjøringsstrategi, eller spørringsplan. Det finnes mange forskjellige kjøringsstrategier, og å velge en god en kalles spørringsoptimalisering. Spørringsoptimaliseringsmodulen velger en kjøringsstrategi, og kodegeneratoren genererer kode for å kjøre planen. Runtime Database-prosessoren kjører selve koden Oversette SQL-spørringer til relasjonsalgebra og andre operatorer Spørringer blir tolket som "select-from-where-group by-having"-blokker, så hvis en spørring er nøstet, må man identifisere de ulike blokkene, og deretter gjøre dem om til relasjonsalgebrauttrykk. Når man har identifisert blokkene, så velger spørringsoptimalisereren en kjøringsplan Semi-join og anti-join Semi-join blir brukt for å nøste opp EXISTS, IN og ANY-delspørringer. Hvis man utgjør en semi-join på tabellene T1 og T2 (T1 til venstre), vil den returnere en rad av T1 hvis det finnes en match i T2, og deretter stoppe - den vil altså ikke returnere alle treff den finner, i motsetning til inner join. Anti-join blir brukt for å nøste opp NOT IN, NOT EXISTS og ALL-delspørringer. Hvis man utgjør en anti-join på tabellene T1 og T2 (T1 til venstre), vil en rad i T1 ikke bli med hvis det finnes en match i T2 - altså blir raden returnert kun hvis det ikke finnes en match i T Algoritmer for ekstern sortering Ekstern sortering brukes på store filer som er lagret på disk, og ikke får plass i minnet. Man bruker en sortér-flett-strategi, som går ut på at man sorterer delfiler, kalt "runs", som deretter blir flettet sammen i større sorterte filer. Denne måten å sortere på krever buffer-plass i hovedminne for å utføre den faktiske sorteringen. I bokas algoritme har hvert buffer samme størrelse som én diskblokk. I sorteringsfasen blir deler (runs) av filen som får plass i bufferne lest inn i minnet, sortert ved hjelp av en intern sorteringsalgoritme og skrevet tilbake på disk som en midlertidig sortert delfil. Hvor mange runs som trengs er avhengig av antall filblokker og mengden ledig bufferrom: Eventuelt (hvis du antar at størrelsen på ett buffer = størrelsen på én filblokk):
2 Side 2 for Databaser I flettefasen blir de sorterte "runs"-ene flettet sammen i en eller flere flettepass. Graden av fletting er antallet sorterte delfiler som kan flettes sammen i hvert flettesteg. Ved hvert steg trengs en bufferblokk for hver diskblokk som skal flettes sammen, og det trengs en bufferblokk der resultatet skal lagres, der resultatet vil være større. Antall flettepass blir: Ytelse: Følgende formel er en tilnærming til ytelsen: Der b er antall blokker. I sorteringsfasen blir hver blokk aksessert to ganger, en for å lese og en for å skrive. I hvert flettesteg blir et antall blokker ca. likt de originale blokkene også aksessert to ganger Algoritmer for ekstern sortering Implementasjon av SELECT-operasjon Søkemetoder for enkel seleksjon: Lineært søk hent alle poster og sjekk om attributtverdier tilfredsstiller søkebetingelse. Binært søk hvis søkebetingelsen går på likhet og postene er sortert. Primærindeks hvis det er en likhetsbetingelse på et nøkkelattributt med primærindeks. Hvis det er en større/mindre enn (eller lik)-sammenligning i betingelsen på et nøkkelfelt med primærindeks, finn den som matcher, og deretter alle etter(/på)følgende. Hashnøkkel hvis søkebetingelsen går på likhet på et nøkkelattributt med en hashnøkkel. Bruke en sekundærindeks (b+-tre) Med likhetssammenligning kan dette brukes for å finne én post hvis indeksfeltet er unikt, eller for å finne flere poster hvis det ikke er det. Kan også brukes for verdiområdespørringer (større/mindre enn eller lik). Bruke unclustered B+-tre og heapfil Hvis man søker på indeksfeltet, kan man bruke dette. Da slipper man å åpne heapfilen, siden alle indeksene er i B+-treet Søkemetoder for AND-seleksjoner Det er best hvis det finnes indekseringer, så man slipper og kjøre lineært søk. Når man har AND-er i betingelsene, og flere poster blir returnert (spørringen er ikke basert på nøkkelattributter): Individuell indeks: Hvis det finnes en tilgangssti (access path) på en av attributtene som er brukt i en av betingelsene, kan man finne alle poster som
3 Side 3 for Databaser oppfyller den betingelsen, og deretter sjekke resten. Sammensatt indeks: Hvis det finnes en indeks på sammensatte attributter, der attributtene er med i betingelsene, kan man finne postene som oppfyller betingelsene via indeksen, og deretter sjekke de gjenværende betingelsene. Snitt av postpekere: Hvis flere av attributtene i betingelsene er indeksert (sekundær), og disse indeksene gir en mengde med postpekere, kan man ta snittet av mengdene, og eventuelt sjekke de resterende betingelsene Søkemetoder for OR-operasjon Dette er ikke like enkelt med OR som med AND. For at det skal fungere bra, bør alle betingelser være på attributter som har en indeks - altså, siden det blir en union av forskjellige mengder, kan vi ikke avgrense området, og hvis én av betingelsene ikke inneholder en attributt som er indeksert, må det kjøres et lineært søk Estimere selektiviteten av en betingelse En databasekatalog inneholder følgende informasjon: For hver relasjon (tabell) r, med skjemaet R, der det finnes n tupler: Antallet rader/poster, eller kardinaliteten r(r) Bredden til relasjonen (lengden på hver tuppel) Antallet blokker relasjonen bruker i lagringsområdet. Blokkfaktor, antallet poster per blokk. For hvert attributt A i relasjonen R: Antallet distinkte verdier av A i R Max og min-verdiene til attributtene A i R. Selektiviteten til en betingelse er definert som antallet rader i relasjonen som tilfredsstiller betingelsen ut av hvor mange rader det er i tabellen. Det er ikke alltid slik at man har tilgang til selektiviteten til en betingelse, og da er det mulig å estimere den. Hvis betingelsen for eksempel er basert på en nøkkel, så kan selektiviteten estimeres til å være 1/ r(r). Hvis betingelsen er basert på et ikke-nøkkelattributt med n distinkte verdier, så kan selektiviteten estimeres til å være 1/i, hvis man antar at postene er uniformt fordelt over de distinkte verdiene Implementasjon av JOIN-operasjonen Metoder for å implementere joins Her er bare en beskrivelse av toveis-join. Et join-attributt er en av attributtene det joines på. Nested-loop join Dette er brute-force-versjonen. For hver post i den ene files sjekker den for alle poster i den andre filen om det er en match. Indeksbasert nested-loop join med aksesstruktur for å hente matchende poster Hvis det eksisterer en indeks (eller hash-nøkkel) for en av joinattributtene, si i fil B, så itereres det over fil A, også hentes alle matchende join-attributter direkte fra fil B med indeksen (trenger altså ikke iterere over alle attributter i fil B, de kan hentes direkte). Sorter-flett join Hvis begge filer A og B er fysisk sortert på join-attributtene, kan begge filer scannes samtidig i rekkefølgen til join-attributtene, og matche postene som har like join-attributter. Altså, man trenger kun å gå gjennom filene én gang. Hvis de ikke allerede er sortert, kan de sorteres med ekstern sortering (18.2). Det er også mulig å implementere dette på sekundærindekser, men det kan fort bli mindre effektivt, da postene kan være spredt rundt
4 Side 4 for Databaser på forskjellige blokker, så det blir mange blokkaksesser. Partition-hash join Alle poster i fil A hashes i bøtter med hash-funksjon h. Dette kalles partisjoneringsfasen. For enkelthets skyld antas det at hele fil A får plass i hovedminnet. I den andre fasen, probingsfasen, brukes samme hash-funksjon h på fil B, og hver post fra fil B blir satt sammen med alle matchende poster fra fil A som er hashet i samme bøtte Hvordan bufferplass og valg av OUTER-LOOP-filer påvirker ytelsen til Nested-Loop join Når man skal joine to tabeller med nested-loop join, så har det noe å si hvilken tabell det itereres over i den ytre løkka (outer loop). Hvis man har buffer med plass til n blokker i minnet, så trengs én blokk for resultat-fila og én blokk for inner-loop-filen, ILF. Derfor er det n - 2 blokker tilgjengelig for outer-loop-fila, OLF. For hver gang man leser inn n - 2 blokker fra OLF, må man også lese inn alle blokker fra ILF, og sjekke om noen av postene i ILF matcher med noen i OLF. Hvis videre OLF har x blokker og ILF har y blokker, så antallet innlesninger av blokker fra ILF blir: Antall blokkaksesser blir: Hvis man dermed prøver å joine to filer A og B, der A har 10 blokker og B har 2000, og n = 7. Hvis A er OLF, blir antall blokkaksesser: Hvis B er OLF blir antall blokkaksesser: Hvis i tillegg resultatfilen har z blokker, må det legges til z blokkaksesser for hver gang blokkene skrives tilbake til fil, slik at antall blokkaksesser totalt blir: Hvordan bufferplass og valg av OUTER-LOOP-filer påvirker ytelsen til Nested-Loop join Join-seleksjonsfaktoren er brøkdelen av filer i Inner Loop-fila, ILF, som faktisk vil joines med filer i Outer Loop-fila. Hvis man for eksempel har to filer, Employee og Department, der Employee har 6000 poster lagret i 2000 blokker og Department har 50 poster lagret i 10 blokker. Si videre at man skal joine de to tabellene på avdelingsleder - da vil resultatet inneholde 50 poster, siden det er 50 avdelinger og hver avdeling har én avdelingsleder.
5 Side 5 for Databaser Hvis begge filene har sekundærindekser på join-attributtene med 4 nivåer for Employee, notert e, og 2 nivåer for Department, notert d, og videre at Employee brukes som OLF og Department som ILF. Da blir antall blokkaksesser: I motsetning, hvis Department brukes som OLF og Employee som ILF, blir antall blokkaksesser: Altså, det er mye mer effektivt å bruke Department som OLF, siden den har joinselektivitet lik 1 med hensyn på join-betingelsen (alle rader i Department vil bli joinet), i motsetning til Employee der join-selektiviteten er 50/6000 = 0,0083. Så hvis man skal joine to filer, der det er indeksering for begge join-attributter, er det mest effektivt å bruke den minste fila som OLF.
Effektiv eksekvering av spørsmål
UNIVERSITETET I OSLO Effektiv eksekvering av spørsmål Spørsmålshåndtering Modell for kostnadsberegning Kostnad for basisoperasjoner Implementasjonsalgoritmer Institutt for Informatikk INF3100 23.3.2015
DetaljerEffektiv eksekvering av spørsmål
UNIVERSITETET I OSLO Effektiv eksekvering av spørsmål Spørsmålshåndtering Modell for kostnadsberegning Kostnad for basisoperasjoner Implementasjonsalgoritmer Institutt for Informatikk INF3100 6.4.2016
DetaljerEffektiv eksekvering av spørsmål
UNIVERSITETET I OSLO Effektiv eksekvering av spørsmål Basert på foiler av Hector Garcia-Molina, Ragnar Normann Oversikt Spørsmålshåndtering Modell for kostnadsberegning Kostnad for basis-operasjoner Implementasjons-algoritmer
DetaljerEffektiv eksekvering av spørsmål
UNIVERSITETET I OSLO Effektiv eksekvering av spørsmål Spørsmålshåndtering Modell for kostnadsberegning Kostnad for basisoperasjoner Implementasjonsalgoritmer Institutt for Informatikk INF3100 21.3.2014
DetaljerEffektiv eksekvering av spørsmål
UNIVERSITETET I OSLO Effektiv eksekvering av spørsmål Spørsmålshåndtering Modell for kostnadsberegning Kostnad for basisoperasjoner Implementasjonsalgoritmer Institutt for Informatikk INF3100 V18 Evgenij
DetaljerRepetisjonsforelesning, SQL og utover
Repetisjonsforelesning, SQL og utover Evgenij Thorstensen V18 Evgenij Thorstensen Repetisjon V18 1 / 23 Temaer SQL, semantikk Databasearkitektur Spørringskompilering og optimisering Indekser Transaksjonshåndtering
DetaljerSpørsmålskompilering del 1
UNIVERSITETET I OSLO Spørsmålskompilering del 1 Parsering Logiske spørreplaner uttrykt i relasjonsalgebra Optimalisering ved hjelp av algebraiske lover Institutt for Informatikk INF3100 - V18 - Evgenij
DetaljerINF1300 Relasjonsalgebra. Et matematisk fundament for å forstå SQL-setninger
INF1300 Relasjonsalgebra Et matematisk fundament for å forstå SQL-setninger Innhold Relasjonsalgebraen Operatorene i relasjonsalgebraen Relasjonsalgebratolkning av select-setningen Kostbare operasjoner
DetaljerSpørsmålskompilering del 1
UNIVERSITETET I OSLO Spørsmålskompilering del 1 Parsering Logiske spørreplaner uttrykt i relasjonsalgebra Optimalisering ved hjelp av algebraiske lover Institutt for Informatikk INF3100-11.4.2016 - Ellen
DetaljerSpørsmålskompilering del 2
UNIVERSITETET I OSLO Spørsmålskompilering del 2 Estimere størrelsen på mellomresultater Vurdere fysiske spørreplaner Institutt for Informatikk INF3100-7.4.2015 - Ellen Munthe-Kaas 1 Oversikt: Fra spørring
DetaljerOppgave 1 Datamodellering 25 %
Side 1 av 6 Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap LØSNINGSFORSLAG TIL EKSAMENSOPPGAVE I FAG TDT4145 DATAMODELLERING OG DATABASESYSTEMER Eksamensdato:
DetaljerOppgave 1 Datamodellering 22 %
Side 1 av 8 Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap LØSNINGSFORSLAG TIL EKSAMENSOPPGAVE I FAG TDT4145 DATAMODELLERING OG DATABASESYSTEMER Eksamensdato:
DetaljerINF1300 Relasjonsalgebra og SQL, mengder og bager. Lysark for forelesning v. 2.1
INF1300 Relasjonsalgebra og SQL, mengder og bager. Lysark for forelesning v. 2.1 Dagens temaer Relasjonsalgebraen Renavning Algebra Heltallsalgebra Klassisk relasjonsalgebra Mengdeoperatorer Union Snitt
DetaljerLøsningsskisse til eksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitenskap Løsningsskisse til eksamensoppgave i TDT4145 Datamodellering og databasesystemer Eksamensdato: 12. august 2013 Eksamenstid (fra-til): 15:00-19:00 Hjelpemiddelkode/Tillatte
DetaljerLøsningsskisse til Eksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitenskap Løsningsskisse til Eksamensoppgave i TDT4145 Datamodellering og databasesystemer Eksamensdato: 23. mai 2013 Eksamenstid (fra-til): 09:00-13:00 Hjelpemiddelkode/Tillatte
DetaljerLøsningsskisse til eksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitenskap Løsningsskisse til eksamensoppgave i TDT4145 Datamodellering og databasesystemer Eksamensdato: 12. august 2013 Eksamenstid (fra-til): 15:00-19:00 Hjelpemiddelkode/Tillatte
DetaljerUNIVERSITETET. Indeksering. Hvordan finne et element raskt? Vera Goebel, Ellen Munthe-Kaas
UNIVERSITETET IOSLO Indeksering Hvordan finne et element raskt? Basert på foiler av Hector Garcia Molina Basert på foiler av Hector Garcia-Molina, Vera Goebel, Ellen Munthe-Kaas Oversikt Konvensjonelle
DetaljerUNIVERSITETET I OSLO. Indeksering. Hvordan finne et element raskt? Institutt for Informatikk. INF Ellen Munthe-Kaas
UNIVERSITETET I OSLO Indeksering Hvordan finne et element raskt? Institutt for Informatikk INF3100 2.3.2010 Ellen Munthe-Kaas 1 Oversikt Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser
DetaljerDBS16: Disklagring, filstrukturer, hashing
Side 1 for Databaser DBS16: Disklagring, filstrukturer, hashing onsdag 11. mai 2016 21.26 Pensum: Kapittel 16.116.8, side 541580, men ikke fra dynamic hashing og forover. 16.1 Introduksjon 16.1.1 Minnehierarki
DetaljerRelasjonsalgebra Kopi av lysark om relasjonsalgebra. Vi går igjennom denne for å lage et matematisk fundament for forståelsen av hvordan
Relasjonsalgebra Kopi av lysark om relasjonsalgebra. Vi går igjennom denne for å lage et matematisk fundament for forståelsen av hvordan select-setningen virker. Temaer som blir tatt inn i SQL-notatet:
DetaljerUNIVERSITETET I OSLO SQL. Structured Query Language. (The intergalactic dataspeak) Institutt for Informatikk. INF Ragnar Normann 1
UNIVERSITETET I OSLO SQL Structured Query Language (The intergalactic dataspeak) Institutt for Informatikk INF3100 1.2.2005 Ragnar Normann 1 SQL SQL Structured Query Language er et deklarativt språk for
DetaljerIndeksering. Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Treliknende strukturer Hashliknende strukturer Bitmapindekser
UNIVERSITETET I OSLO Indeksering Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Treliknende strukturer Hashliknende strukturer Bitmapindekser Institutt for Informatikk INF30 3.3.2014
DetaljerINF1300 Introduksjon til databaser
UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: Relasjonsalgebraen Oversettelse av select-from-where til relasjonsalgebra SQL: union, snitt, differanse, kartesisk produkt INF1300 22.10.2007
DetaljerRelasjonsalgebraen. Algebra
Relasjonsalgebraen Definerer en mengde av operasjoner på relasjoner Gir oss et språk til å beskrive spørsmål om innholdet i relasjonene Språket er prosedyralt: Vi sier hvordan svaret skal beregnes. Alternativet
DetaljerNormalisering. ER-modell
Normalisering Hensikten med normalisering: En informasjonsenhet ett sted. Forhindrer anomalier Anomalier: Innsettingsanomalier. F.eks være avhengig av å sette inn flere verdi, selv om det er det er bare
DetaljerDatabaser. Relasjonsmodellen 2 Læreboka: Kap. 2 Relasjonsmodellen
Databaser Relasjonsmodellen 2 Læreboka: Kap. 2 Relasjonsmodellen Tema for dagen Hva er relasjonsalgebra? Seleksjon Projeksjon Produkt Indre forening Ytterforening Settoperasjoner: union, snitt, differanse
DetaljerUNIVERSITETET. Indeksering. Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Hashliknende strukturer.
UNIVERSITETET IOSLO Indeksering Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Treliknende strukturer Hashliknende strukturer Bitmapindekser Institutt for Informatikk INF30 22.2.2011
DetaljerJoin. Intuitivt: Skjøte sammen to relasjoner. Intuitivt: 1. Beregn R S 2. Velg ut de tuplene som tilfredsstiller joinbetingelsen C
Join Intuitivt: Skjøte sammen to relasjoner R S C Intuitivt: 1. Beregn R S 2. Velg ut de tuplene som tilfredsstiller joinbetingelsen C Join Bistro bn mkat A kosher A vegetabilsk B uten melk B hallal B
DetaljerSpørsmålskompilering del 2
UNIVERSITETET I OSLO Spørsmålskompilering del 2 Estimere størrelsen på mellomresultater Vurdere fysiske spørreplaner Institutt for Informatikk INF3100 V18 Evgenij Thorstensen 1 Overblikk For å vurdere
DetaljerAlle attributter har NULL som mulig verdi. mulige verdier for integer: NULL, 0, 1, 2, 3...
NULL verdier Alle attributter har NULL som mulig verdi mulige verdier for integer: NULL, 0, 1, 2, 3... Dog mulig å lage tabeller med attributter som forbyr NULL Ulik bruk: manglende informasjon («vet ikke
DetaljerUNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk. INF Ragnar Normann
UNIVERSITETET I OSLO RELASJONSALGEBRA Regning med relasjoner Institutt for Informatikk 1 Relasjonsalgebraen definerer en mengde av operasjoner på relasjoner gir oss et språk til å beskrive spørsmål om
DetaljerEKSAMENSOPPGAVE I TDT4145 DATAMODELLERING OG DATABASESYSTEMER. Faglig kontakt under eksamen: Svein Erik Bratsberg og Roger Midtstraum
Side 1 av 5 Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap EKSAMENSOPPGAVE I TDT4145 DATAMODELLERING OG DATABASESYSTEMER Faglig kontakt under eksamen:
DetaljerAndre sett obligatoriske oppgaver i INF3100 V2013
Andre sett obligatoriske oppgaver i INF3100 V2013 Oppgavesettet skal i utgangspunktet løses av grupper på to og to studenter som leverer felles besvarelse. Vi godkjenner også individuelle besvarelser,
DetaljerD: Ingen trykte eller håndskrevne hjelpemiddel tillatt. Bestemt, enkel kalkulator tillatt.
Side 1 av 6 Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap LØSNINGSFORSLAG TIL EKSAMENSOPPGAVE I FAG TDT4145 DATAMODELLERING OG DATABASESYSTEMER, ver
DetaljerIndeksering. Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Trestrukturer Hashliknende strukturer Bitmapindekser
UNIVERSITETET I OSLO Indeksering Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Trestrukturer Hashliknende strukturer Bitmapindekser Institutt for Informatikk INF30 29.2.2016 Ellen
DetaljerUNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk. INF Ellen Munthe-Kaas 1
UNIVERSITETET I OSLO RELASJONSALGEBRA Regning med relasjoner Institutt for Informatikk INF3100-8.2.2010 Ellen Munthe-Kaas 1 Relasjonsalgebraen definerer en mengde av operasjoner på relasjoner gir oss et
DetaljerUNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk. INF Ellen Munthe-Kaas
UNIVERSITETET I OSLO RELASJONSALGEBRA Regning med relasjoner Institutt for Informatikk 1 Relasjonsalgebraen definerer en mengde av operasjoner på relasjoner gir oss et språk til å beskrive spørsmål om
DetaljerIndeksering. Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Trestrukturer Hashliknende strukturer Bitmapindekser
UNIVERSITETET I OSLO Indeksering Konvensjonelle indekser B-trær og hashing Flerdimensjonale indekser Trestrukturer Hashliknende strukturer Bitmapindekser Institutt for Informatikk INF3100 V18 Evgenij Thorstensen
DetaljerSpørringer mot flere tabeller
Spørringer mot flere tabeller Kartesisk produkt / kryssprodukt/krysskobling Likekoblinger INNER JOIN syntaks Generelle koblinger Egenkoblinger Ytre koblinger Union, snitt og differanse Mer om gruppering
DetaljerUNIVERSITETET RELASJONSALGEBRA. Regning g med relasjoner. Institutt for Informatikk. INF Ellen Munthe-Kaas 1
UNIVERSITETET IOSLO RELASJONSALGEBRA Regning g med relasjoner Institutt for Informatikk INF3100-7.2.2011 Ellen Munthe-Kaas 1 Relasjonsalgebraen definerer en mengde av operasjoner på relasjoner gir oss
DetaljerRepetisjon: Normalformer og SQL
IN2090 databaser og datamodellering Repetisjon: Normalformer og SQL Mathias Stang og Stein Michael Storleer 21. november 2018 1 Agenda Normalformer Funksjonelle avhengigheter Nøkler Finne hvilke normalformer
DetaljerD: Ingen trykte eller håndskrevne hjelpemiddel tillatt. Bestemt, enkel kalkulator tillatt.
Side 1 av 7 Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap LØSNINGSFORSLAG TIL KONTINUASJONSEKSAMEN I FAG TDT4145 DATAMODELLERING OG DATABASESYSTEMER
DetaljerINF2220: Time 12 - Sortering
INF0: Time 1 - Sortering Mathias Lohne mathialo Noen algoritmer Vi skal nå se på noen konkrete sorteringsalgoritmer. Gjennomgående i alle eksempler vil vi sortere tall etter tallverdi, men som diskutert
DetaljerAndre sett obligatoriske oppgaver iinf3100v2011
Andre sett obligatoriske oppgaver iinf3100v2011 Oppgavesettet skal i utgangspunktet løses av grupper på to og to studenter som leverer felles besvarelse. Vi godkjenner også individuelle besvarelser, men
DetaljerUNIVERSITETET I OSLO SQL. Structured Query Language. (forts.) Institutt for Informatikk. INF Ragnar Normann 1
UNIVERSITETET I OSLO SQL Structured Query Language (forts.) Institutt for Informatikk INF3100 7.2.2005 Ragnar Normann 1 null Resultatet av å evaluere et uttrykk som produserer en skalar verdi, kan være
DetaljerINF1300 Det meste av resten av SQL. Utleggsark v. 2.0
INF1300 Det meste av resten av SQL Utleggsark v. 2.0 Dagens temaer Sammenligning med tekstmønstre Aggregeringsfunksjoner Nestede spørsmål Gruppering Relasjonssammenligninger: View JDBC exists in any all
DetaljerEKSAMENSOPPGÅVE I TDT4145 DATAMODELLERING OG DATABASESYSTEMER
Side 1 av 5 Noregs teknisk-naturvitskapelege universitet Institutt for datateknikk og informasjonsvitskap EKSAMENSOPPGÅVE I TDT4145 DATAMODELLERING OG DATABASESYSTEMER Fagleg kontakt under eksamen: Svein
DetaljerOppgave 1a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet.
TDT445 Øving 4 Oppgave a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet. Nøkkel: Supernøkkel: Funksjonell avhengighet: Data i en database som kan unikt identifisere (et sett
DetaljerOppgave 1 ER- og relasjonsmodell 10 %
Side 1 av 7 Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap LØSNINGSFORSLAG TIL KONTINUASJONSEKSAMEN I FAG TDT4145 DATAMODELLERING OG DATABASESYSTEMER
DetaljerAndre sett obligatoriske oppgaver i INF3100 V2012
Andre sett obligatoriske oppgaver i INF3100 V2012 Oppgavesettet skal i utgangspunktet løses av grupper på to og to studenter som leverer felles besvarelse. Vi godkjenner også individuelle besvarelser,
DetaljerINF3100 V2018 Obligatorisk oppgave nr. 2
INF3100 V2018 Obligatorisk oppgave nr. 2 Oppgavesettet skal løses og leveres individuelt. Gjennomføring og innlevering av oppgaven skal skje i henhold til gjeldende retningslinjer ved Institutt for informatikk,
DetaljerDatabaser fra et logikkperspektiv
Databaser fra et logikkperspektiv Evgenij Thorstensen IFI, UiO Høst 2013 Evgenij Thorstensen (IFI, UiO) Databaser fra et logikkperspektiv Høst 2013 1 / 31 Outline 1 Logikk som verktøy 2 Relasjonsdatabaser
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF212 Databaseteori Eksamensdag: 28. mai 2003 Tid for eksamen: 9.00 15.00 Oppgavesettet er på 8 sider. Vedlegg: Tillatte hjelpemidler:
DetaljerLæringsmål og pensum. Algoritmeeffektivitet
1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Algoritmer i praksis Professor Alf Inge Wang 2 Læringsmål og pensum Mål Lære å forstå og kunne programmere algoritmer for søk og sortering. Lære å forstå
DetaljerTDT4110 Informasjonsteknologi grunnkurs: Tema: Algoritmer i praksis. Professor Alf Inge Wang
1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Algoritmer i praksis Professor Alf Inge Wang 2 Læringsmål og pensum Mål Lære å forstå og kunne programmere algoritmer for søk og sortering. Lære å forstå
DetaljerRelasjonsalgebra. Hva?
Relasjonsalgebra. Hva? Relasjonsalgebra består av et sett med høynivås operatorer som kan brukes til å manipulere med relasjoner (slå sammen to tabeller, selektere data etc.). Tankegangen er viktig å kjenne
DetaljerQuerying the Internet with PIER
Querying the Internet with PIER TDT2 Avanserte distribuerte systemer 17.10.2005 Truls Jørgensen Disposisjon 2 Hva er PIER? (1) Peer-to-Peer Information Exchange and Retrieval Paring av tradisjonell prosessering
DetaljerDictionary er et objekt som lagrer en samling av data. Minner litt om lister men har klare forskjeller:
1 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Algoritmer i praksis Terje Rydland - IDI/NTNU 2 Datastruktur: Dictionaries Kap 9.1 Dictionary er et objekt som lagrer en samling
Detaljer1. SQL spørringer mot flere tabeller
1. SQL spørringer mot flere tabeller Avdeling for informatikk og e-læring, Høgskolen i Sør-Trøndelag SQL spørringer mot flere tabeller Tore Mallaug 29.9.2008 Lærestoffet er utviklet for faget Databaser
DetaljerEn lett innføring i foreninger (JOINs) i SQL
En lett innføring i foreninger (JOINs) i SQL Noen ord om forening (JOIN)! 2 JOINs til gjennomgang! 3 1. INNER JOIN! 3 Eksempel på [INNER] JOIN! 4 NATURAL JOIN! 5 Eksempel på NATURAL JOIN! 5 2. LEFT [OUTER]
DetaljerSkisse til løsning av eksamensoppgave i TDT4145 Datamodellering og databasesystemer
Skisse til løsning av eksamensoppgave i TDT4145 Datamodellering og databasesystemer Vers: 17.aug 2016 Faglig kontakt under eksamen: Roger Midtstraum: 995 72 420 Svein Erik Bratsberg: 995 39 963 Eksamensdato:
DetaljerHvordan databasesystemene kan hjelpe RAM-produsentene
Hvordan databasesystemene kan hjelpe RAM-produsentene Kreativ bruk av RAM i DBMSer Ragnar Normann Innhold Litt databasehistorie Litt UiO datahistorie Hvorfor (manglende) minnebruk i DBMSer er blitt et
DetaljerLøsningsskisse til Eksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitenskap Løsningsskisse til Eksamensoppgave i TDT4145 Datamodellering og databasesystemer Eksamensdato: 26. mai 2014 Eksamenstid (fra-til): 09:00-13:00 Hjelpemiddelkode/Tillatte
DetaljerINF1300 Det meste av resten av
INF1300 Det meste av resten av SQL Utleggsark v. 1.0 Tekstmønstre I SQL kan vi bruke like for å sammenligne et tekst-attributt med et tekstmønster Et tekstmønster er en tekstkonstant hvor to tegn, kalt
DetaljerEksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informatikk Eksamensoppgave i TDT4145 Datamodellering og databasesystemer Faglig kontakt under eksamen: Roger Midtstraum: 995 72 420 Svein Erik Bratsberg: 995 39 963 Eksamensdato:
DetaljerEksamensoppgåve i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitskap Eksamensoppgåve i TDT4145 Datamodellering og databasesystemer Fagleg kontakt under eksamen: Svein Erik Bratsberg: 73550382 Eksamensdato: 12. august 2013
DetaljerDatamodellering og databaser SQL, del 2
http://www.aitel.hist.no/fag/_dmdb/ SQL, del 2 Eksempelbase side 2 Virtuelle tabeller (views) side 3-6 NULL-verdier side 7-14 UPDATE-setningen side 15-16 INSERT-setningen side 17 DELETE-setningen side
DetaljerEksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitenskap Eksamensoppgave i TDT4145 Datamodellering og databasesystemer Faglig kontakt under eksamen: Roger Midtstraum: 995 72 420 Svein Erik Bratsberg: 995 39
DetaljerEksamensoppgave i TDT4225 Lagring og behandling av store datamengder
Institutt for datateknikk og informasjonsvitenskap Eksamensoppgave i TDT4225 Lagring og behandling av store datamengder Faglig kontakt under eksamen: Kjell Bratbergsengen Tlf.: 90617 185 / 7359 3439 Eksamensdato:
DetaljerSQL Structured Query Language. Repetisjon av select spørringer Nestede select spørringer Mengdeoperasjoner Views Flere operatorer
SQL Structured Query Language Repetisjon av select spørringer Nestede select spørringer Mengdeoperasjoner Views Flere operatorer Generelt utseende av SQL-spørsmål select [ distinct ]
DetaljerDictionary er et objekt som lagrer en samling av data. Minner litt om lister men har klare forskjeller:
1 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Algoritmer i praksis Terje Rydland - IDI/NTNU 2 Datastruktur: Dictionaries Kap 9.1 Dictionary er et objekt som lagrer en samling
DetaljerDatamodellering og databaser http://www.aitel.hist.no/fag/_dmdb/ SQL, del 2
http://www.aitel.hist.no/fag/_dmdb/ SQL, del 2 Eksempelbase side 2 Virtuelle tabeller (views) side 3-6 NULL-verdier side 7-14 UPDATE-setningen side 15-16 INSERT-setningen side 17 DELETE-setningen side
DetaljerTDT4105 Informasjonsteknologi, grunnkurs
1 TDT4105 Informasjonsteknologi, grunnkurs Matlab: Sortering og søking Anders Christensen (anders@idi.ntnu.no) Rune Sætre (satre@idi.ntnu.no) TDT4105 IT Grunnkurs 2 Pensum Matlab-boka: 12.3 og 12.5 Stoffet
DetaljerEn liten rekap. Spørrespråk. I dag SELECT
[Kurssidene] [ ABI - fagsider bibin ] Michael Preminger (michaelp@hioa.no) 06/11-15 Databaser høsten 2015 En liten rekap ER-diagram - vi modellerer dataene våre til danne best mulig grunnlag for informasjonen
DetaljerUNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk INF Ellen Munthe-Kaas
UNIVERSITETET I OSLO RELASJONSALGEBRA Regning med relasjoner Institutt for Informatikk INF3100-2.2.2015 Ellen Munthe-Kaas Relasjonsalgebraen definerer en mengde av operasjoner på relasjoner gir oss et
DetaljerDatamodellering og databaser SQL, del 2
http://www.aitel.hist.no/fag/_dmdb/ SQL, del 2 Eksempelbase side 2 Virtuelle tabeller (views) side 3-6 NULL-verdier side 7-14 UPDATE-setningen side 15-16 INSERT-setningen side 17 DELETE-setningen side
DetaljerINF1300 Introduksjon til databaser
UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: SQL: Outer join Denormalisering og splitting Transaksjoner og ACID-reglene DBMSer en introduksjon til INF3100 INF1300 19.11.2007 Ragnar
DetaljerBruke SQL fra Python. Med Psycopg2
Bruke SQL fra Python Med Psycopg2 0 1 (1/3) 1 (2/3) 1 (3/3) 2 Pakken psycopg2 3 Pakken psycopg2 De viktigste klassene vi trenger i psycopg2: connection Håndterer forbindelsen fra Python til PostgreSQL
DetaljerSpørsmålskompilering. Basert på foiler av Hector Garcia-Molina
Spørsmålskompilering Basert på foiler av Hector Garcia-Molina Oversikt: Fra spørring til resultat SQL spørring parsere parseringstre konvertere resultat logiske spørreplaner (LSPer) anvende lover forbedrede
DetaljerDBS22 Databasegjenopprettingsteknikker
Side 1 for Databaser DBS22 Databasegjenopprettingsteknikker onsdag 1. juni 2016 21.49 Pensum: 22.1-22.5, side 813-831 22.1 Gjenopprettingskonsepter 22.1.1 Recovery outline and categorization of recovery
DetaljerUNIVERSITETET I OSLO SQL. Structured Query Language. (The intergalactic dataspeak) Institutt for Informatikk. INF Ellen Munthe-Kaas 1
UNIVERSITETET I OSLO SQL Structured Query Language (The intergalactic dataspeak) Institutt for Informatikk INF3100 6.2.2005 Ellen Munthe-Kaas 1 SQL SQL Structured Query Language er et deklarativt språk
DetaljerINF1300 Introduksjon til databaser
UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: Det meste av resten av SQL Sammenligning med tekstmønstre Aggregeringsfunksjoner Nestede spørsmål Gruppering Relasjonssammenligninger:
DetaljerUNIVERSITETET I OSLO RELASJONSALGEBRA. Regning med relasjoner. Institutt for Informatikk INF Ellen Munthe-Kaas
UNIVERSITETET I OSLO RELASJONSALGEBRA Regning med relasjoner Institutt for Informatikk INF3100-3.2.2016 Ellen Munthe-Kaas 1 Relasjonsalgebraen definerer en mengde av operasjoner på relasjoner gir oss et
DetaljerFørst litt praktisk info. Sorteringsmetoder. Nordisk mesterskap i programmering (NCPC) Agenda
Først litt praktisk info Sorteringsmetoder Gruppeøvinger har startet http://selje.idi.ntnu.no:1234/tdt4120/gru ppeoving.php De som ikke har fått gruppe må velge en av de 4 gruppende og sende mail til algdat@idi.ntnu.no
DetaljerOppgave 1 a. INF1020 Algoritmer og datastrukturer. Oppgave 1 b
Oppgave 1 1 a INF1020 Algoritmer og datastrukturer Forelesning 14: Gjennomgang av eksamen vår 2001 oppgave 1,2,4 Arild Waaler Institutt for informatikk, Universitetet i Oslo Oppgave 1 a Programmer en ikke-rekursiv
DetaljerLøsning til Eksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informatikk Løsning til Eksamensoppgave i TDT4145 Datamodellering og databasesystemer Faglig kontakt under eksamen: Roger Midtstraum: 995 72 420 Svein Erik Bratsberg: 995 39
DetaljerHeap og prioritetskø. Marjory the Trash Heap fra Fraggle Rock
Heap og prioritetskø Marjory the Trash Heap fra Fraggle Rock Binær heap En heap er et komplett binært tre: Alle nivåene i treet, unntatt (muligens) det nederste, er alltid helt fylt opp med noder Alle
DetaljerEksamensoppgave i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informasjonsvitenskap Eksamensoppgave i TDT4145 Datamodellering og databasesystemer Faglig kontakt under eksamen: Svein Erik Bratsberg: 99539963 Roger Midtstraum: 99572420
DetaljerSpørsmålskompilering
UNIVERSITETET I OSLO Spørsmålskompilering Parsering Logiske spørreplaner uttrykt i relasjonsalgebra Optimalisering ved hjelp av algebraiske lover Estimere størrelsen på mellomresultater Vurdere fysiske
DetaljerPython: Rekursjon (og programmering av algoritmer) Python-bok: Kapittel 12 + teoribok om Algoritmer
Python: Rekursjon (og programmering av algoritmer) Python-bok: Kapittel 12 + teoribok om Algoritmer TDT4110 IT Grunnkurs Professor Guttorm Sindre Læringsmål og pensum Mål Forstå, og kunne bruke, algoritmer
DetaljerUNIVERSITETET I OSLO SQL. Structured Query Language. (The intergalactic dataspeak) INF Ellen Munthe-Kaas 1. Institutt for Informatikk
UNIVERSITETET I OSLO SQL Structured Query Language (The intergalactic dataspeak) Institutt for Informatikk INF3100 5.2.2008 Ellen Munthe-Kaas 1 SQL SQL Structured Query Language er et deklarativt språk
DetaljerTildeling av minne til prosesser
Tildeling av minne til prosesser Tildeling av minne til en prosess Når en ny prosess opprettes har den et krav til hvor mye minne som skal reserveres for prosessen Memory Management System (MMS) i OS må
DetaljerTDT4225 Lagring og behandling av store datamengder
Eksamensoppgave i TDT4225 Lagring og behandling av store datamengder Fredag 2. desember 2011, kl. 0900-1300 Oppgaven er utarbeidet av faglærer Kjell Bratbergsengen og kvalitetssikrer Svein-Olaf Hvasshovd
DetaljerEksamensoppgåve i TDT4145 Datamodellering og databasesystemer
Institutt for datateknikk og informatikk Eksamensoppgåve i TDT4145 Datamodellering og databasesystemer Fagleg kontakt under eksamen: Roger Midtstraum: 995 72 420 Svein Erik Bratsberg: 995 39 963 Eksamensdato:
DetaljerTDT4225 Lagring og behandling av store datamengder
Eksamensoppgave i TDT4225 Lagring og behandling av store datamengder Kontinuasjonseksamen. Fredag 17. august 2012, kl. 0900-1300 Oppgaven er utarbeidet av faglærer Kjell Bratbergsengen. Kontaktperson under
DetaljerTDT4110 Informasjonsteknologi grunnkurs: Tema: Lister og tupler. - 3rd edition: Kapittel 7. Professor Alf Inge Wang
1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Lister og tupler - 3rd edition: Kapittel 7 Professor Alf Inge Wang 2 Læringsmål og pensum Mål Lære om Sekvenser Lister List Slicing Finne elementer i lister
DetaljerEt større programeksempel. Hvordan løse et reelt problem med en objektorientert fremgangsmåte
Et større programeksempel Hvordan løse et reelt problem med en objektorientert fremgangsmåte Plan for forelesingen Beskrive en større problemstilling Planlegge programmet Skrive koden, én klasse om gangen
DetaljerUNIVERSITETET I OSLO SQL. Structured Query Language. (forts.) Institutt for Informatikk. INF Ellen Munthe-Kaas 1
UNIVERSITETET I OSLO SQL Structured Query Language (forts.) Institutt for Informatikk INF3100 11.2.2008 Ellen Munthe-Kaas 1 null Resultatet av å evaluere et uttrykk som produserer en skalar verdi, kan
DetaljerObligatorisk oppgave 1 INF1020 h2005
Obligatorisk oppgave 1 INF1020 h2005 Frist: fredag 7. oktober Oppgaven skal løses individuelt, og må være godkjent for å kunne gå opp til eksamen. Før innlevering må retningslinjene Krav til innleverte
DetaljerOppgave 1 (Opprett en database og en tabell)
Oppgave 1 (Opprett en database og en tabell) 1) I «Object Explorer» (i «SQL Server Management Studio»), høyreklikk over Databases : 1 2 2) Skriv så databasenavnet og klikk OK: 3) Plasser så kursoren på
Detaljer