Hva er kommunikasjon en enkel modell. DRI 2010 Internet fra TCP/IP til semantisk web. Hva er datakommunikasjon? Ulike typer datanettverk

Like dokumenter
DRI2001 : Informasjonsinfrastrukturer Forelesning Arild Jansen, AFIN

DRI2001 : Informasjonsinfrastrukturer Forelesning Arild Jansen, AFIN

Hvordan gi veven mening? Semantisk web: W3C, emnekart mm. FINF 4001 Design av nettsider og informasjonsarkitektur Semantisk web, emnekart mm

DRI1002 IKT og Informasjonssøking Våren forelesning 16. Januar Arild Jansen, Avd. for forvaltningsinformatikk, UiO

DRI2001 : Informasjonsinfrastrukturer Forelesning Arild Jansen, AFIN

DRI2010 Databaser, arkiver og fritekst-systemer

TDT4110 IT Grunnkurs: Kommunikasjon og Nettverk. Læringsmål og pensum. Hva er et nettverk? Mål. Pensum

DRI1002-V06 1. forelesning Arild Jansen, AFIN

DRI1002-V05 1. forelesning Arild Jansen, AFIN

Pensum og undervisningens form

FINF4001 H 06: Informasjonsinfrastrukturer Forelesning Arild Jansen, AFIN

Kommunikasjonsnett. Et kommunikasjonsnett er utstyr (maskinvare og programvare) for utveksling av informasjon

Felles grunndata som Informasjons infrastrukturer FINF Arild Jansen, Afin

Felles grunndata som Informasjons infrastrukturer FINF Arild Jansen, Afin

Hva er en infrastruktur?

Kapittel 5 Nettverkslaget

Introduksjon til nettverksteknologi

Litt mer detaljer om: Detaljerte funksjoner i datanett. Fysisk Lag. Multipleksing

Detaljerte funksjoner i datanett

Obligatorisk oppgave nr 2 i datakommunikasjon. Høsten Innleveringsfrist: 04. november 2002 Gjennomgås: 7. november 2002

DRI2001 Infrastrukturer Ofentlig styring eller privat monopol Forelesning , Arild Jansen, AFIN

Kap 3: Anvendelser av Internett

Intro til WWW, HTML5 og CSS

Web fundamentals. Web design. Frontend vs. Backend Webdesign 17. januar Monica Strand

Folloarkivets dagskonferanse 2014

DRI 2001 Systemutviklingsarbeidet og nettsteder Forelesning

Litt kontekst Topic maps er en måte å organisere informasjon på en ISO standard (ISO/IEC 13250:2000) en XML applikasjon et lag oppå XML (gjerne også o

Gjennomgang av kap Kommunikasjonsformer Typer av nettverk Adressering og routing Ytelse Protokoller

Hvordan kan en gjenbrukbar NOARK kjerne bidra til samhandling mellom forvaltningsnivåene?

digital forvaltning Noen viktige egenskaper ved II Infrastrukturer har alltid en installert base Hva kan vi lære av Internet

DRI1002 Våren 2005 Seminar 7. mars IKT og organisering

Datasystemer og informasjonssystemer

EKSAMENSFORSIDE Skriftlig eksamen med tilsyn

DRI Datasystemer og informasjonssystemer

ADDML. Archival Data Description Markup Language. Generell del. Versjon PA 0.07 Sist oppdatert: TPD. ADDML_8_2.doc 03/03/2011 1(12)

HUMIT1731. Tekstkoding. Koding/merking av tekst Uke 35. Tekster som teknologiske produkter. Koding/merking på flere nivå. Utvikling av notesystemet

Oppsummering: Linjesvitsjing kapasiteten er reservert, og svitsjing skjer etter et fast mønster. Linjesvitsj

Hva består Internett av?

MPEG-7. Problemstilling:

2EOLJDWRULVNRSSJDYHQU L GDWDNRPPXQLNDVMRQ + VWHQ.,QQOHYHULQJVIULVWRNWREHU *MHQQRPJnVWRUVGDJRNWREHU

Innhold. Funksjonell virkemåte. Overordnet arkitektur

INF 329: Web-Teknologier. Dataimplementasjon. Fra Kapittel 11 i «Designing Data-Intensive Web Applications» Presentasjonsdato: 17/10/2004

1. Lage og vise et enkelt XML-dokument

DRI 1001 Datasystemer og informasjonssystemer Arild Jansen

Dokumentasjon av XML strukturer for ByggSøk

Forelesning Oppsummering

DRI2001 h04 - Forelesning Systemutvikling og nettsteder

Det matematisk-naturvitenskapelige fakultet

Læringsmål XML. Markering av tekst. SGML-familien. Forstå prinsippene bak XML og XHTML. Forstå hva XML kan brukes til og hvordan.

Introduksjon til fagfeltet

1. SQL server. Beskrivelse og forberedelse til installasjon

6105 Windows Server og datanett

Universell utforming Deltakelse og tilgjengelighet

Detaljerte Funksjoner i Datanett

Digitale bilder. Det er i hovedsak to måter å representere digitale bilder på: rastergrafkk (punkter) og vektorgrafkk (linjer og fater).

EndNote referansehåndteringsprogram. HiVe biblioteket

Tjenester i Internett. E-post, HTTP, FTP, Telnet

Opprinnelig IP-pakke inneholder 4480 Byte data. Dette er inklusiv IPheader. Max nyttelast på EthernetRammen er 1500 oktetter.

Løsningsforslag Gruppeoppgaver mars 2003

the web Introduksjon Lesson

Veileder for harmonisering av geografiske data

Forskrift 25. september 2009 nr om IT-standarder i offentlig forvaltning

Semantikk og Informasjonsarkitektur. Geir Myrind, SITS Planlegging Arkitektur

6107 Operativsystemer og nettverk

Innledende Analyse Del 1: Prosjektbeskrivelse (versjon 2)

Lagene spiller sammen

SOLICARD ARX. Adgangssystemet som gir deg ubegrenset frihet. An ASSA ABLOY Group company

Et forsøk på definisjon

Indeks fra Enhetsregisteret

Høgskolen i Telemark EKSAMEN Operativsystem og nettverk inkludert denne forsiden og vedlegg. Merknader:

Dette er en demonstrasjonsside som vi skal bruke for å se litt nærmere på HTTP protokollen. Eksemplet vil også illustrere et par ting i PHP.

XML og Mobilt Internett

Design og dokumentasjon

Fag: Engelsk 10A/B Faglærer: Annette Solvang / Liza Utheim Vår 2018

Noen lærdommer fra Internetts historie (Hanseth & Lyytinens design-prinsipper for II)

SENSORVEILEDNING. Dato: Eventuelt:

Det samme som World Wide Web Et lokalnett (LAN) Et verdensomspennende nettverk Startsiden til et nettsted. Hva betyr forkortelsen HTML?

IT1101 Informatikk basisfag Dobbeltime 25/9

TDT4105/TDT4110 Informasjonsteknologi grunnkurs:

Introduksjon til programmering og programmeringsspråk. Henrik Lieng Høgskolen i Oslo og Akershus

TTM4175 Hva er kommunikasjonsteknologi?

SERES - status Ressursnettverk for eforvaltning og Norstella Elektronisk Samhandling i Offentlig Sektor 27.august 2009

fleksibilitet når det gjelder geografisk plassering og etablerte arbeidsrutiner. Qubic cms

Kapittel 13 Advanced Hypertext Implementation. Martin Lie Ole Kristian Heggøy

Angivelse av EHF profiler og dokumenttyper

Computer Networks A. Tanenbaum

Modeller for design av Web-Applikasjoner

Kapittel 10 Tema for videre studier

1 INTRODUKSJON SAMMENKOBLING AV ET INTERNETTVERK... 2

Visuell identitet Designmanual. Versjon 2 Forenklet utgave. Kunsthøgskolen i Oslo Fossveien Oslo

Vurdering av standarder fra NOSIP. Oktober 2010

Grunnleggende om websider og HTML-kode

Nasjonal informasjonsinfrastruktur for eforvaltning Hva kan vi lære av Internet?

NorStellas 3 strategiske prosjekter i 2007

Et forsøk på definisjon. Eksempel 1

produktspesifikasjon Eksempel på SOSI

Prosjektoppgave: Bildedatabase. TDT4145 Datamodellering og Databasesystemer. Våren 2007

Forelesning 4: Kommunikasjonssikkerhet

Fra SOSI- til GML-format likheter og forskjeller. X, Y og Z 2019 Geir Myhr Øien, Kartverket

To RDF or not to RDF Fagdag om Noark 5 og RDF

Transkript:

DRI 2010 Internet fra TCP/IP til semantisk web Grunnleggende om Internett Arkitektur prinsipper TCP/IP Litt om utviklingsfilosofien WWW Hva er hemmeligheten Fra databaser til XML og sematisk web Hva er kommunikasjon en enkel modell Sender kommunisere Mottaker Sendt Mottatt Budskap budskap Uttrykke i et språk Må fortolkes Informasjon Informasjon Kode Kode WWW Internett DRI2010 H 08 24092008 Arild Jansen, AFIN 1 Kanal Telekommunikasjon DRI2010 H 08 24092008 Arild Jansen, AFIN 2 Hva er datakommunikasjon? Utveksling av data i digital form mellom 2 eller flere datamaskiner i henhold til en eller annen standard som partene er enige om Dette forutsetter (blant annet) - Felles representasjonsform av data - Felles protokoller for styre kommunikasjonsprosessene - At datamaskinene er knyttes sammen i et (eller flere nettverk) - At to datamaskinprogrammer (applikasjoner) kan snakke sammen (utveksle data ) DRI2010 H 08 24092008 Arild Jansen, AFIN 3 Ulike typer datanettverk Bedrifts-interne datanettverk (lokalnett- LAN&WLAN) Nasjonale og internasjonale nett datanett (f eks for elektronisk pengeformdling, osv ) Internett Ett nett av nettverk som kan kommunisere ved TCP/IPprotokollene, og et felles adresserom definert ved 32-biters IPadresser (som kan angis ved DNS), administret av ICANN Internett benytter seg av flere typer kanaler eller bærere (carriers), f eks Fastnettet (ISDN, ASDL,) Mobilnettene (GSM, GPRS, UMTS,) Satellitt kommunikasjon Andre medier (radioforbindelser, fiberkabler, DRI2010 H 08 24092008 Arild Jansen, AFIN 4 1

Noen begreper Protokoll En protokoll er et sett med regler for utveksling av data mellom samvirkende, uavhengige systemer Eks : IP TCP, SMTP, HTTP,UMTS men ikke HTML, XML (som bare beskriver formater ) Internet baseres seg på pakkeveksling, dvs at all datatrafikk skjer ved oversendelse av datapakker: IP- Pakke (IP-packet), som er en innkaplet sekvens av data med IP-adresser (sender og mottaker) + kontrollinformasjon En kort video om IP/TCP mm Ruter funksjon (router ) En utstyrsenhet/ program som sørger for å sende pakkene til riktig nett og holde lokaltrafikken lokalt DRI2010 H 08 24092008 Arild Jansen, AFIN 5 DRI2010 H 08 24092008 Arild Jansen, AFIN 6 Hva er en IP-pakke frimerke Avsenderadresse Mottakeradress IPv4-protokollen : Struktur og innhold Faste og valgfrie felter : Veldefinert betydning av hvert informasjonselement (Utenfor datadelen) Min lengde 20 tegn (hodet) maksimum er 65535 tegn Struktur: Id<> Avsenderadr Mottakeradr <annet> data Kontroll Hode avsender addr mottaker adresse < innhold = data > DRI2010 H 08 24092008 Arild Jansen, AFIN 7 Se f eks http://nowikipediaorg/wiki/ipv4#ipv4_hode-format Er syntaks viktig? Er formatet viktig? Er innholdet viktig Kan denne brukes til andre formål DRI2010 H 08 24092008 Arild Jansen, AFIN 8 2

Internett modellen TCP/IP tilnærmingen Utgangspunkt i behovet for å knytte sammen ulike nett Basert på lagdeling og horisontal integrasjon Balansere standarder og fleksibilitet Åpenhet og dynamikk Minimale standarder, dvs Løse et problem av gangen Foreløpige, gradvis forbedringer Ende-til-ende prinsippet Overlate mest mulig til brukernes ansvar Gjøre nettverket så enkelt som mulig med minimum av kontroll Men gjør også nettet mer sårbart Noen sentrale prinsipper Lagdeling : Programmene er delt i vertikale lag som bygger på hverandre, men utveksler data gjennom enkle formater Eks E-post (SMTP) bygger på TCP, som bygger på IP, Modularisering Funksjoner og tjenester atskilles i programmer som arbeider selvstendig Eks: e-post, filoverføring og WWW er helt adskilte tjenester Minimumsløsninger Hver tjeneste er så enkel som mulig DRI2010 H 08 24092008 Arild Jansen, AFIN 9 DRI2010 H 08 24092008 Arild Jansen, AFIN 10 Ulike tilnærminger til utvikling av nettverk Ulike lag i en datakommunikasjonsmodellforenkelt Topp-styrt utvikling Målet er den rasjonelle og fullstendige, perfekte løsningen Søker å inkludere alle gode ønsker og behov Spesifikasjonsdrevet: fossefallsmetoden Lukket verden og sentralisert kontroll Monolittisk organisasjon Som regel implementert revolusjonært (alt på en gang) Bruker-orienterte anvendelser (applikasjoner) Ende-til-ende utveksling av data, feilkontroll mm Adressering og ruting Bruker-orienterte anvendelser (applikasjoner) Ende-til-ende utveksling av data, feilkontroll mm Adressering og ruting Nedenfra-opp utvikling eksperimentell og iterativ Involverer flere bruker og miljøer Starter med minimumsløsninger Akseptere kompromisser og søker pragmatiske løsninger Det gode er ikke det bestes fiende DRI2010 H 08 24092008 Arild Jansen, AFIN 11 Kontroll av linjer/forbindelser Kontroll av linjer/forbindelser DRI2010 H 08 24092008 Arild Jansen, AFIN 12 3

Verdensven - World Wide Web Samme grunnleggende prinsipper som IP/TCP, kontrollen ligger hos brukerne Bygger på IP-protokollen adresse struktur : En URL = <IP-adresse > + <fil-adresse> eks : http://wwwafinuiono/om_enheten/omafinhtml, som ligger på fila Z: (afin-www)\om_enheten/omafinhtml Nettet (dvs TCP/IP ++ ) bryr seg ikke noe om hva som ligger på www-filer Nettleserne er kjernen i verdensveven, og forutsetter dokumentene overføres ved HTTP-protokollen Krever at dokumenter lagres på formater som kan gjenkjennes av nettleseren (ved typebetegnelsen) HTTP-protokollen : Struktur og innhold IP-pakke : Id<> Avsenderadr Mottakeradr <annet> data Kontroll HTTP-pakke < Hode > < > Se f eks http://enwikipediaorg/wiki/hypertext_transfer_protocol DRI2010 H 08 24092008 Arild Jansen, AFIN 13 DRI2010 H 08 24092008 Arild Jansen, AFIN 14 Noen ulike binære representasjonsformer Tekstdokumenter Ren, (txt) Word-dokument (doc) RTF :rich text format (rtf) - PDF-format (Portable Document Format ) : pdf - HTML-format (html) - Bilder : - GIF (Graphics Interchange Format) - JPEG (Joint Photographic Experts Group) Semantisk web Hva er problemet? Sematic web is the Web of data (Ivan Herman, W3C) Tilbyr er felles rammeverk for å utveksle data på tvers av applikasjoner Hjelpemidler for å forstå informasjonsinnholdet i data, og derved muliggjøre bruk av felles data En ny AI-bølge : SW gjør datamaskinene smartere (gjennom å kunne fortolke og forstå hva slag informasjon (kunnskap) data representerer? DRI2010 H 08 24092008 Arild Jansen, AFIN 15 DRI2010 H 08 24092008 Arild Jansen, AFIN 16 4

Repetisjon om data, informasjon og kunnskap maskiner 9057 (230808) Mennesker Fortolkning Eksisterende kunnskap Ny OL- rekord i spyd av Andreas Informasjon Thorkildsen Beijing 230808 Hva er metadata her og mangler det noen her? Ny kunnskap integrere DRI2010 H 08 24092008 Arild Jansen, AFIN 17 Hva forstår dere med dette dette? 0110111010111011 OLA HANSEN HANSEN, KARI OLA BJØRN 11032003 031103 11/03/03 13/03/45 Hva kreves for å forstå (få mening ut av dette)? DRI2010 H 08 24092008 Arild Jansen, AFIN 18 Koding, syntaks og innhold Vi må bli enige om Hvor mange bits i en byte (lengde : 6, 8, 16, ) Hvilke byte som representerer hvilke tegn (ASCII, UTF-8, Språket jeg vil bruke (norsk, engelsk, Struktur - organisering Syntaks -grammatikken modellen (skjemaet) Navn eller Fornavn + etternavn Semantikken (hva opplysningene betyr) Hvordan blir vi enige om alt dette? Avtaler (mellom hvem, hvor mange, ) Standarder (hvilke, hvor universelle) Eksempel XML: <?xml version= 10 encoding='utf-8'?> DRI2010 H 08 24092008 Arild Jansen, AFIN 19 Syntaks, semantikk og grammatikk og ontologi Syntaks er læren om hvordan ord settes sammen til større enheter, dvs setninger og fraser Ulike språk har ulike regler for hvordan dette skjer på både med hensyn til ordstilling og syntaktiske avhengigheter Semantikk er den grenen av språkvitenskapen som studerer ordenes betydning, både enkeltvis og i sammenstilte strukturer (setninger) Grammatikk er studiet av reglene som gjelder et språk Reglene som styrer et spesielt språk kalles språkets grammatikk Ontologi En spesifisering av hvordan man presenterer objekter, begreper og andre ting som eksisterer i et interessefelt og relasjonene mellom disse Både W3C (RDF) og emnekart (XMT) kan beskrive ontologier (se f eks http://homehiono/~toreh/blog/arkiv/docs/ontologien%20for%20kulturnett%203doc DRI2010 H 08 24092008 Arild Jansen, AFIN 20 5

Litt om organisering av [lig] informasjon Et lig dokument kan (blant annet) karakteriseres ved: Innhold: Hva en utrykker/formidler, Eks: Roman, dikt, fagstoff, lov, offentlig rundskriv, brosjyre, Struktur :Måten innholdet er organisert, Eks Bind, kapitler, avsnitt, nummerering, referanser, Form/utseende (Layout, design ) Skrifttyper/størrelser, farger/grafikk, sidestørrelse, spalter, bokser, Koding og språk (ikke tema denne ) Disse er ikke uavhengige av hverandre Hva er viktigst av disse for bøker?? DRI2010 H 08 24092008 Arild Jansen, AFIN 21, datadefinisjon og metadata element: Enhet av data som er udelelig, f eks f navn, enavn pnr, telefonnr, definisjon: Type og formatbeskrivelse av et dataelement Metadata: om dataelementer, inkl datadefinisjon, dataeierskap, tilgangsrettigheter, Metadata brukes både i tradisjonelle (relasjons) databaser og andre typer databaser, f eks XML-baserte databaser Metadata omfatter mer enn [rene]datadefinisjoner : Bidrar til å opprette logiske sammenhenger, der de ikke finnes fra før Bidrar til å gi opplysninger entydige egenskaper Bidrar til å knytte informasjon til informasjonens tilhørende sammenheng DRI2010 H 08 24092008 Arild Jansen, AFIN 22 Eksempel på enkel (tabellbasert) database Hvordan representeres dokumenter Poster Poster (record) En linje i tabellen som inneholder verdier i de enkelte feltene Arild Johan Jansen, Hofstadgate, 1384 Asker Dag Wiese Schartum, Felter Harald Løvenskiolds v, 0760 Oslo Pnr 002 001 Etternavn Jansen Primær-nøkkel entydig identifikasjon for alle poster Schartum Fornavn Arild Johan Dag Wiese Gate/veinavn Hofstadgata H Løvenskiold vei Postnr 1384 0760 Poststed Asker Oslo Dokumenter har blant annet En identifikasjon ( navn, kap i en bok, forfatter/dato, Innholdet, dvs en vi er interessert i Utseende formatet eller layout, dvs slik det framstår (presenteres) på skjerm eller papir Et dokument kan ha ulike typer fysisk representasjon, f eks skriftlig, nedkopier på mikrofilm, digital på disk, disketter, Cd-rom, Et dokument kan presenteres (visualiseres) på ulike måter: på papir, på skjermen, på film osv baser kan brukes ves f eks SQL DRI2010 H 08 24092008 Arild Jansen, AFIN 23 DRI2010 H 08 24092008 Arild Jansen, AFIN 24 6

XML Extensible markup language XML kan beskrive struktur og innhold Eks en beskrive struktur i en bok Bok Bok-tittel Forord Indeks Kapittel Tittel Avsnitt DRI2010 H 08 24092008 Arild Jansen, AFIN 25 Eksempel på XML-kode, inkludert HTML-kode <?XML versjon = 10 Encoding = ISO-8859-1?> <book> <desciption> <title> Fra kjernen og ut, fra skallet og inn </title> <author> <first-name> Gerhard </first name>, <Last-name Skagestein</last-name> </author> </description> <body> <Forord > I denne boka vil jeg </forord> <chapter title = Innledning > <p> I dette kapitlet ser vi på </chapter > Chapter title = systemutviklingprosessen </body> <book> DRI2010 H 08 24092008 Arild Jansen, AFIN 26 (fra Skagestein, kap 17 forenklet Fargene er for å synliggjøre en) Noen forskjeller mellom HTML og XML Sammenheng mellom W3C og databaser Trelags arkitektur (fra Skagestein) HTML beskriver bare utseende ikke hva dataene betyr HTML har en løs syntaks (feil oppdages ikke lett) HTML har et begrenset sett av fast definerte markeringer og tilhørende attributter (egenskaper) XML kan beskrive både struktur og utseende XML har en strengere syntaks Dette gjør at feil kan oppdages før et program brukes XML tillater egendefinerte markeringer og attributtnavn DRI2010 H 08 24092008 Arild Jansen, AFIN 27 Kilde: http://wwwifiuiono/~inf1050/foiler/innledningpdf DRI2010 H 08 24092008 Arild Jansen, AFIN 28 7