28.01.15 INF130 Databehandling og analyse Introduksjon Knut Kvaal 28.01.15 1.1 Administrasjon Gruppearbeid og øvinger Du skal registere deg for gruppe etc https://docs.google.com/spreadsheets/d/1n4vqedksrkflh6273wk5zqd852me_mtshunh6dfzzma/edit?usp=sharing Forelesninger Onsdager 8.15-10 Plenumgsgennomgang Fredager 10.15-12 Informasjon på Classfronter og egen hjemmeside http://arken.umb.no/~kkvaal/inf130/rapid/index.html Brukernavn: student, passord: xduts 28.01.15 1.2 Lærebøker Bjørn Kristoffersen: Databaser. ISBN: 978-82-15-01997-0 Utvalgte kapitler Eriksson, Umetrix Academy: Multi- and Megavariate Data Analysis/ Basic principles and applications Part I. ISBN-10: 91-973730-2-8 ISBN-13: 978-91-973730-2-9 Åpen på http://books.google.no/books?id=b-1nnmlloo8c&lpg=pp3&ots=m9lgdapt6i&dq=isbn-10%3a%2091-973730-2-8&hl=no&pg=pr1#v=onepage&q=isbn-10:%2091-973730-2-8&f=false Klassifikasjonsteknikker Visualiseringsteknikker Data Mining Utdelt materiale 28.01.15 1.3 Side 1
28.01.15 Temaer vi skal behandle Hovedtemaer Databaser Visualisering Multivaiat analyse 28.01.15 1.4 A. Databaser Lærebok: Bjørn Kristoffersen. 1. Introduksjon 2. Tabeller og enkle spørringer 3. Tabelldefinisjon og datamanipulering 4. Spørringer mot flere tabeller 5. Avansert bruk av SQL 6. Modellering 28.01.15 1.5 B. Visualisering av data 1. Uttrekk av data fra databaser for visualisering 2. Oppgave vedr værdata etc 28.01.15 1.6 Side 2
28.01.15 C. Dataanalyse Lærebok: Camo/Umetri digitalt. 1. Introduksjon til multivariat analyse 2. PCA (Principal Component Analysis) 3. Regresjon 4 Data mining og Klassifikasjon 28.01.15 1.7 Eksamen Skriftlig eksamen 3 timer Obligatoriske oppgaver (godkjent) 28.01.15 1.8 IT-omgivelser Windows 2012 terminalklient COMET) MySQL database Microsoft Office Apache web server med PHP Orange Data Mining Diverse open source verktøy FORETRUKKET: Du kan installere all nødvendig programvare på din egen datamaskin. Vi anbefaler XAMPP Gjennom kurset vil du benytte ulike programverktøy. Det er viktig at du forstår formålet ved bruk av flere verktøy 28.01.15 1.9 Side 3
28.01.15 Programvare verktøykasse MySQL database PHPMyAdmin administrasjonsverktøy Apache Web server Unscrambler/ConsumerCheck for multivariat analyse Orange for klassifikasjon og visualisering WinPython og Spyder Python for visualisering FREDAG GÅR JEG GJENNOM NOEN AV DISSE INSTALLASJONENE SAMT COMET 28.01.15 1.10 Hvor finner jeg mine data? Du har et eget hjemmeområde på NMBU intranett som du får tilgang til fra terminalserver Du får også et eget område på terminalserver der du kan legge database-applikasjonene Ta backup! Du har tilgang til disse sidene så lenge kurset varer Du vil lære hvordan du kan flytte applikasjonene til en annen server 28.01.15 1.11 Kommunikasjon med Server SERVER HjemmePC VPN Studentnette t COMET Rudolf.tunet.umb.no Data-salene Terminalklienter Terminalklienter benyttes i kommunikasjon mellom PC og server (Rudolf) 28.01.15 1.12 Side 4
28.01.15 Windows Server 2012R2 Vi vil anvende en felles server (Comet) for alle felles programmer og data Du får tilgang til Comet med Microsoft Remote Desktop Øvingsoppgave 1 vil gi deg informasjon om omgivelser 28.01.15 1.13 Windows Server 2012R2 Du kan logge inn på Comet Du vil bli akreditert via innmelding til INF130 Lag din egen profil Programvare er OpenSource Alt kan stort sett installeres på egen maskin Vises i plenumsgjennomgang 28.01.15 1.14 Bruke egen datamaskin Det anbefales at du benytter din egen datamaskin All programvare kan installeres enkelt Open Source Uavhengig av NMBU nettverk 28.01.15 1.15 Side 5
28.01.15 Forelesninger Forelesningene holdes på onsdager Sentralt stoff vil gjennomgås Gjennomgangen er ikke en blåkopi av læreboka Vi følger opp med blogg i etterkant Videopresentasjoner av temaer for å komme i gang 28.01.15 1.16 Plenumsgjennomgang Gjennomgang av stoff som er av felles interesse Forslag til løsninger Demonstrasjoner Analyseteknikker 28.01.15 1.17 Øvingene Øvinger er viktig. Du skal gjennomføre oppgavene fram til neste forelesning Øvinger på datasalen tirsdager Tirsdag 12-14 og 14-16 Noen oppgaver bør løses i grupper Programmeringskunnskaper? Statistikkkunnskaper? INF100 med programmering MERK: Emnet er et modningsemne. Det er ikke mulig å jobbe etter skippertakprinsippet 28.01.15 1.18 Side 6
28.01.15 Obligatoriske oppgaver Noen oppgaver 2-3 er obligatoriske Løsninger besvares ved opplasting til Classfronter Alle må være godkjent for å få gå opp til eksamen En stor prosjektoppgave mot slutten av kurset (etter påske) 28.01.15 1.19 En kort innføring 28.01.15 1.20 Systemet og omgivelsene Virkeligheten registrering påvirkning Oppfatningen av virkeligheten Informasjonssystem Brukere Organisasjonen 28.01.15 1.21 Side 7
28.01.15 Informasjonssystemet Oppfatningen av virkeligheten Modell bygd opp av data og prosesser Idealisert representasjon av interesseområdet D P Data D D P Prosesser P Data Referanseramme! Informasjon Data krever tolkning 28.01.15 1.22 Informasjonssystem med databasehåndteringssystem Metadata Kunde Ordre Brukerdata Database Databasehåndteringssystem (DBMS) Informasjonssystem Brukergrensesnitt Brukere Metadata = data om data 28.01.15 1.23 Datbasesystem 28.01.15 1.24 Side 8
28.01.15 Metadata 28.01.15 1.25 Systemkatalog 28.01.15 1.26 Data i tabell Skjema (metadata) Ansatt bor-i Kommune Per Hansen Bærum Forekomster Gro Nilsen Nittedal Tove Li Skedsmo 28.01.15 1.27 Side 9
28.01.15 Relasjonsdatabaser 28.01.15 1.28 Relasjonsdatabaser 28.01.15 1.29 Relasjonsdatabaser 28.01.15 1.30 Side 10
28.01.15 Integritetskontroll Metadata Integritetsregler Kunde Ordre Brukerdata Database Databasehåndteringssystem (DBMS) Informasjonssystem Brukergrensesnitt Brukere Integritetskontrollen skal forhindre at feilaktige data legges inn i databasen! 28.01.15 1.31 To typer integritetsregler Tilstandsregler: Beskriver lovlige tilstander i databasen Overgangsregler: Beskriver lovlige overganger i databasen En ansatt må alltid tilhøre en avdeling Lønnen til en ansatt kan aldri synke I forbindelse med reglene må vi også angi hva som skal skje dersom de brytes! 28.01.15 1.32 Flerbrukersystem Metadata Integritetsregler Kunde Ordre Brukerdata Database Databasehåndteringssystem (DBMS) Informasjonssystem Brukergrensesnitt Brukergrensesnitt Brukergrensesnitt Brukere Mange brukere skal kunne bruke databasen samtidig! 28.01.15 1.33 Side 11
28.01.15 Automatisk innsamling av data Data fra loggere Værstasjoner GPS data Analyse og visualsering av data fra databaser http://www.weatherlink.com/user/woodbebetter http://www.wunderground.com 28.01.15 1.34 Øvinger Oppgave 1 Gjør deg kjent med Comet Installer programvare på din egen datamaskin 28.01.15 1.35 Side 12