Datavarehus hva er det?



Like dokumenter
kvalifikasjoner (forskerutdanning flyttes ikke) Rettet opp noen småfeil under åpne spørsmål Stein Aske

Bruk av data kan deles i data for transaksjonsbruk og data for analyse bruk:

Veiledning til STAR Tableau

Referat FSAT. Møte i STAR-prosjektgruppe Tid: Onsdag 22. oktober kl 10:00 15:00. Forskningsveien 3b Møterom i 8.et. Felles studentsystem

Direktoratet for IKT og fellestjenester i høyere utdanning og forskning

Databearbeiding direkte i memory på LASR server nye muligheter? Trond Holmen, SAS Institute

STAR og Tableau. FS-Kontaktforum, April 2016

DT4300 Datavarehus og datagruvedri3

Oppgave 1 (Opprett en database og en tabell)

Sluttrapport fra prosjektgruppen STAR, prosjektperioden

Migrering hos Gjensidige Bank. 9. februar 2011 Ellen Aaslund - Gjensidige Bank Knut Erik Terjesen - bwise

Referat. Møte mellom FS og Lånekassen 9. september 2014

Hvordan komme langt med lite? NMBU Innsikt - Ledelsesinformasjonsverktøy for NMBU Digitaliseringskonferansen for høyere utdanning og forskning,

Webinar. Vitnemålsportalen. Marte Holhjem, produkteier

Studentweb3. Kathy Haugen 15. april 2015

Avtale om utviklingstjenester. Datauttrekk fra datavarehuset ifm UiOs styringskart

FSAT, FS og digital eksamen. SUHS 2015 Spor: Digitalt læringsmiljø

Campus-funksjonalitet i FS. Webinar Geir Vangen

Datavarehus og Data Mining. Helge Rege Gårdsvoll og Lasse Bache-Mathiesen NTNU

Tertialrapport for FS Første tertial Felles studentsystem

FS webapplikasjoner. Kathy Haugen Kontaktforum 2013

Tilrettelegging av store datagrunnlag for analyse med SAS Scalable Performance Data Engine (SPDE) Steinar Helstrup 8.juni 2017

SAP Lumira Demo Session

SAP Lumira Hans-On Session

Syscom Brukerforum 2013

UTDANNELSE NTNU i Trondheim, Sivilingeniør i datateknikk og informasjonsvitenskap

PhD-kandidater deles gjerne inn på ulike vis, etter finansieringstype:

UNIS og MN, UiO. Innpassing av UNIS-emner i våre nye Bachelor og Masterprogrammer

Lånekassen gjør om på sin nettsøknad for delstudier sommeren Mer informasjon om dette under punkt 5.

1. Innføring i bruk av MySQL Query Browser

Sluttrapport fra prosjektet MATRISE. MAtematikkfaget: Tiltak for Reduksjon I Studiefrafallet. Rekruttering og frafall

Kvalitetssikring av rapporteringsdata til DBH

Min side for studenter. Trine B. Elvebakken prosjektleder NAP/Min side

FAGMILJØ OG STUDIETILBUD I SPANSK (IS OG IKL)

Brukerveiledning til FS-rapportene

Erfaringer og eksempler fra Nord-Europas største implementering av SAP BPC for konsolidering. Stig Skoglund Leading Consultant Statoil

NTNU S-sak 39/13 Norges teknisk-naturvitenskapelige universitet RE/AMS Arkiv: 2012/11800 N O T A T

FAGMILJØ OG STUDIETILBUD I TYSK

System integration testing. Forelesning Systems Testing UiB Høst 2011, Ina M. Espås,

Struktur og arkitektur

Hvordan bedømmer Gartner de lange linjene?

Utdanningsplaner ved HF innføring

Introduksjon til fagfeltet

Store data til dem som trenger det

Bruk av datavarehus i beslutningsprosesser

Videreutvikling av administrative systemer og prosesser ved Universitetet i Bergen. Kjell Bernstrøm økonomidirektør

Høringsnotat forskrift om Nasjonal vitnemåls- og karakterportal

Vedlikehold av utdanningsplaner

Økonomisk-administrative fag - masterstudium

MAL FOR EMNEBESKRIVELSE

Kurs Godkjenning og innpassing 6. desember 2016

Repetisjon: Normalformer og SQL

Redegjørelse for samarbeid med NHH om undervisning i japansk

LMS-administrator i går, i dag og i morgen. UiA / SUHS-Trondheim 5/ Claus Wang

Måling av informasjonssikkerhet. Håkon Styri Seniorrådgiver Oslo,

Kontaktforum, november 2016 Marte Holhjem, produkteier ved FSAT

Økonomisk-administrative fag - masterstudium

Beskrivelse av informasjonstyper. Retningslinjer for informasjonsdeling i Mitt UiB

Det juridiske fakultet Universitetet i Oslo

Standarder for Asset management ISO 55000/55001/55002

netsense...making sense of IT

Brukermanual. Trio Visit Web. Trio Enterprise 5.0

Brukerveiledning til studenter for utfylling av Online Learning Agreement (OLA)

Innkjøpsledelse 30 studiepoeng

HA-løsning anno 2010

Oversikt over alle grupper av ansatte er hentet fra rapporter i PAGA og FRIDA

Transkript:

Datavarehus hva er det? Bill Inmon (ca. 1992): a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management's decision making process Ralph Kimball (ca. 1996): a copy of transaction data specifically structured for query and analysis Data mart: ETL: Fact: a simple form of a data warehouse that is focused on a single subject Extract, transform and load a value or measurement Dimension: reference information that gives context to the facts

Datavarehus FSAT (DV) Økonomi-mart: Økonomidata (kilde OA) for UiB og UiO overføres daglig til DV. Dekker hovedtyngden av økonomirapportering. Studie-mart: FS-data overføres ukentlig for samtlige FS-institusjoner. Forsknings-mart: Cristin-data overføres daglig. Hovedvekt på publikasjonspoeng. UiB: Koblede data: Løsning som sammenstiller data fra de 3 martene på stednivå. Presenterer nøkkeltall, f.eks. Kostnader/publikasjonspoeng. UiO: Henter data fra DV til egen løsning i Corporater. Inneholder også data fra de 3 kildene. Teknologi i DV: ETL-verktøy: PowerCenter (Informatica) Database: Oracle Rapportverktøy: Discoverer og Tableau

FS datavarehus/mart FS datavarehus = FS mart = en delmengde av FS tilrettelagt for rapportering og analyse Ca 130 FS-tabeller overføres hver lørdag formiddag til DV fra samtlige FS-databaser, dvs FS01-FS07, UiO, UiB og NHH Testmiljøet henter fra DMO/test-databaser Produksjonsmiljøet henter fra PRD/prod-databaser Tilgang til data i DV/Oracle har tidligere vært håndtert ved hjelp av VPD, slik at brukerne bare får tilgang til egen institusjon Nå ligger de samme dataene i Tableau (i form av ekstrakter), der tilgangen håndteres med en radkontroll-funksjon Tableau-ekstraktene oppdateres hver lørdag kveld

Forskjeller mellom FS og DV FS er et studieadministrativt system normalisert datamodell designet for å registrere studentinformasjon distribuerte databaser inputkontroll/constraints for å sikre datakvalitet helt ferske data komplisert datamodell (> 1000 tabeller og 17.000 kolonner) FS-datavarehus er en løsning for analyse/rapportering stjernemodeller designet for å rapportere/analysere en database alle data er hentet fra FS (kvaliteten er som i FS) ukegamle data (lastes lørdag) enkel datamodell (< 100 tabeller og 2000 kolonner)

fakta Datamodell for gjennomstrømming i FS dimensjoner oppnadd_grad_prot studieniva emne-nivå program-nivå ekstres_i_gradprot person_ekstresultat studprogstud_planlagt_progr studprogstud_planbekreft utvperson innvilget_permisjon student-nivå registerkort emne_dette_sem studentvurdkombprotokoll vurdkombmelding studprogstud_emne studieprogramstudent studieretning ar_arstermin sted studieprogram emne fag eksamenssted sprak tallkarakter vurderingsordning vurdkombenhet vurdresstatus

Når? DIM_Semester Datamodell for gjennomstrømming i DV: Stjerneskjema Hvor mange? FAK_Gjennomstr_StudProg Hvem? DIM_Institusjon DIM_Person DIM_Sted Hvor? Fakta: antall studenter studiepoeng emner studieprogram grader semestre brukt DIM_Grad DIM_Studieniva DIM_Studieprogram DIM_SPprogregeltermin Hva?

Gjennomstrømming: Hva skjer på veien fra FS til DV? Standard-semester: VÅR/HØST (FS har flere semestre) Fra dato til semester (VÅR/HØST) (f.eks. gradoppnåelse) For grader/kvalifikasjoner: Januar = Høst, Juli/August = Vår Utbretting: Fra-til-semester omdannes til flere rader Sammenslåing av tabeller på samme nivå (emne/program/student) Aggregering fra emne til program til student Prioritert program: Grad-/utdplan- eller primærprogram FYLT-felter gir sporbarhet tilbake til kildetabell Noen tabeller er primære (=> insert), andre sekundære (=> update) Helt nye elementer: Semester-tellere: Kalender, brutto og netto (tar hensyn til permisjon/progresjon) Akkumulerte studiepoeng Faktorer for permisjon, utveksling, progresjon

Dataflyt FS-mart: Gjennomstrømming studprogstud_opptaksgrlag (SOG) drkand_arbeidsforhold (DAF) fak_gjennomstr_student (GST) studieprogramstudent (SPS) registerkort (RKO) oppnadd_grad_prot (OGP) ekstres_i_gradprot (EIG) person_ekstresultat (PRE) utvperson (UTP) innvilget_permisjon (IVP) studprogstud_tidskonto (STI ) fak_gjennomstr_startkull (GSK) fak_gjennomstr_studprog_ind (GSI) fak_gjennomstr_studprog (GSP) fak_gjennomstr_studprog_kull (GSK) studprogstud_planlagt_progr (SPP) studprogstud_planbekreft (SPB) studentvurdkombprotokoll (SVP) emne_dette_sem (EDS) fak_gjennomstr_emne (GEM) vurdkombmelding (VKM) studprogstud_emne (SSE) Primærkilde (insert) Sekundærkilde (update)

Tableau Tableau er det nye rapport- og analyse-verktøyet anskaffet for bruk mot FS og FS datavarehus Tableau Desktop er utviklerverktøyet for å lage datakilder og rapporter Tableau Server er fellesløsningen for å distribuere datakilder og rapporter til brukerne Datakilder inneholder dataene. De består gjerne av en kombinasjon av flere databasetabeller, f.eks. et stjerneskjema med en faktatabell og flere dimensjoner. En datakilde har mange felter inndelt i dimensjoner og fakta (measures) En arbeidsbok inneholder et eller flere views og/eller dashbord. Disse utgjør rapportene i Tableau