Text Encoding Initiative ( , ) XML, summa summarum. I dag: Neste gang: Kort repetisjon: Tekstkoding og SGML
|
|
- Asbjørn Nilsen
- 7 år siden
- Visninger:
Transkript
1 DASP107 Innføring i språk og data DASP108 Språk og data Tekstkoding Claus Huitfeldt I dag: Kort repetisjon SGML, HTML, XML TEI Kap 2: Tekstkodingens problemer Neste gang: Øving Epost: Claus.Huitfeldt@fof.uib.no Kort repetisjon: Tekstkoding og SGML HTML, summa summarum Tekstkoding Hva? - Metainformasjon Hvordan? - Reserverte tegnstrenger Hvorfor standardisere? - Gjenbruk av tekster - Gjenbruk av programvare SGML: Et sett av regler for formulering av regler for dokumentstruktur SGML Document = SGML Declaration + Document Type Definition (DTD) + Document Instance Viktig i SGML: -Alle dokumenter må ha en DTD - <a> : punkt eller start? - forenkling og utelatelse av tagger - Alle dokumenter må være gyldige - Alle dokumenter må være hierarkiske (overlapping ulovlig) En suksess for SGML eller verdens største samling ugyldige SGML-dokumenter? Vanligvis ingen validering Nettlesere tolererer feil Andre svakheter: hver nettleser sin dialekt brukeren bindes til nettleseren bare HTML aksepteres (bare <B> eller <H1>, ikke <overskrift> eller <tittel>) Men: Enkelt, lett å lære XML, summa summarum Et subsett av SGML Ønsker å kombinere: HTMLs enkelhet SGMLs fleksibilitet og styrke Forskjeller fra SGML: Forkorting eller utelatelse av tagger er ikke tillatt Tomme elementer er syntaktisk distinkte SGML-deklarasjonen kan ikke endres Konsekvenser: Enklere syntaks Dokumenter kan parses uten DTD Skille mellom gyldighet og velformethet Text Encoding Initiative ( , ) Guidelines for Electronic Text Encoding and Interchange
2 TEIs målsetting En standard for koding og utveksling av tekst Plattformuavhengig Dekke et stort utvalg tekster ( alle teksttyper) Fleksibelt: Modulært, modifiserbart, utvidbart Utviklet av brukermiljøene ACH, ALLC, ACL m.fl. TEI består av: TEI Guidelines en omfattende veiledning Et sett av TEI DTD-moduler (evt. schemas) En organisasjon (TEI-C) for vedlikehold og videreutvikling The TEI Guidelines forslag om hva som bør kodes forslag til hvordan dette bør kodes Oppbyggingen av en TEI DTD Core tag set + ett base tag set + 0 eller flere additional tag sets TEI P TEI P2 TEI P (1999) TEI P (første XML-versjon) TEI P TEI Lite (SGML/XML) Core tag set: TEI header, samt noen få generelle elementer og attributter Base tag sets: prose, verse, drama transcribed speech dictionaries terminological databases Additional tag sets: Linking and alignment Analysis Feature structures Certainty Physical transcription Textual criticism Names and dates Graphs and trees Figures and tables Language corpora Forholdet mellom SGML, XML, HTML og TEI SGML er en metagrammatikk ("et sett av regler for formulering av regler") XML er en delmengde av reglene i SGML. Også XML er altså en metagramatikk. Mens alt som er lov i XML også er lov i SGML, gjelder det omvendte ikke: Ikke alt som er lov i SGML er lov i XML. HTML og TEI er anvendelser av denne grammatikken, dvs. kodesystemer bestående av regler definert i samsvar med SGML. (Resten av) dagens tekst Kap 2, Tekstkodingens problemer: 2.1 Definisjoner av tekstkoding 2.3 Er all tekst kodet? 2.5 Overlapp (Det finnes XML-versjoner av både HTML og TEI (hhv. XHTML og TEI P4+).)
3 1. Definisjoner av tekstkoding ISO markup: text that is added to the data of a document in order to convey information about it. text: characters data: the characters of a document that represent the inherent information content; characters that are not recognized as markup document: a collection of information that is processed as a unit character: atom of information with an individual meaning markup: [[atom{s} of information with an individual meaning]] that {are} added to the [[atom{s} of information with an individual meaning] of a [collection of information that is processed as a unit] that represents the inherent information content] of a [collection of information that is processed as a unit] in order to convey information about it. markup: atoms of information that are added to a collection of information in order to convey information about it. markup: information that is added to information in order to convey information about it. Konklusjon: Koding er meta-informasjon Er all tekst egentlig kodet? Sperberg-McQueen definerer "markup" som...all the information in a document other than the "contents" of the document itself, viewed as a stream of characters. Any information present about formatting... All structural information... All analytic or interpretive information to be included in an electronic text is by definition expressed as markup. Lou Burnard: we define markup, or (synonymously) "encoding", as any means of making explicit an interpretation of a text. Sperberg-McQueen: no text is entirely free of markup... with the possible exceptions of some older Hebrew and Greek manuscripts written in "scriptio continua". Scriptio continua: Scriptio continua finnes først og fremst i gamle greske og hebraiske tekster, der det ikke finnes setningstegn eller ordmellomrom, og linjer skrives helt ut uten hensyn til orddeling. scriptiocontinuafinnesførstogfremstigamlegreskeoghebraisketeks terderdetikkefinnessetningstegnellerordmellomromoglinjerskrivesh eltututenhensyntilorddeling Scriptio continua Burnard: at a banal level, all printed texts are encoded... Encoding a text for computer processing is, in principle, like transcribing a manuscript from "scriptio continua", a process of making explicit what is conjectural or implicit, of directing the user as to how the contents of the text should be interpreted. 4-5 årh., Vatikanbiblioteket I så fall er alle disse kodet, Per sa at klokken er ti. Per sa: "klokken er ti". Per sa at <q type=is>klokken er ti</q>. Per sa: <q type=ds>"klokken er ti"</q>. Per sa <q type=ds>klokken er ti</q>. mens persaatklokkenerti ikke er kodet
4 2.5 Overlapp (Har alle tekster hierarkisk struktur?) Eksempel på overlappende elementer DeRose, Durand, Mylonas, Renear 1990: "What is Text, Really?" Renear, Durand, Mylonas 1996: "Overlapping Hierarchies of Text Objects: Refining Our Notion of What Text really is OHCO-tesen I Alle tekster er OHCOs (OHCO = Ordered Hierarchy of Content Objects) Contra: Sider, kollonner, linjer vs. kapitler, avsnitt, setninger OHCO-tesen II OHCO-tesen gjelder bare den logiske strukturen, ikke den fysiske. At to elementer overlapper, er et kriterium på at det ene av dem hører til den logiske og det andre til den fysiske strukturen. (Jfr. skillet mellom dybdestruktur og overflatestruktur.) Contra: Drama på verseform. (Replikker og scenehenvisninger vs. metriske linjer og setninger.) OHCO-tesen III Tekster kan ha flere sameksisterende hierarkier. Til hvert hierarki svarer forskjellige og uavhengige analytiske eller teoretiske perspektiver. At to elementer overlapper, er et kriterium på at de tilhører forskjellige analytiske perspektiver. Contra: Enjambment. Metrisk og narrativ struktur ikke uavhengige OHCO-tesen IV Teoretiske perspektiver kan ha subperspektiver. At to elementer fra samme analytiske perspektiv overlapper, er et kriterium på at de tilhører forskjellige analytiske sub-perspektiver Contra: Elementer av samme type kan overlappe. (Overstrykninger, setninger, ankere/pekere)
5 OHCO-tesen V I de fleste tekster er det en eller flere hierarkiske strukturer. Contra: Intet å anføre. Motstrategi: "Overlapping kan kodes i SGML" * <d> ord1 <u> ord2 </d> ord3 </u> Dette er ikke lovlig i SGML. Men det finnes mange andre måter å håndtere overlapping på i SGML! CONCUR <(d-dtd)d> ord1 <(u-dtd)u> ord2 </(d-dtd)d> ord3 </(u-dtd)u> Milepæler <d> ord1 <u-start> ord2 </d> ord3 <u-slutt> Fragmentering <d> ord1 <u> ord2 </u></d><u> ord3 </u> Lenkede milepæler <d> ord1 <u id=u1> ord2 </d> ord3 <u id=u2>... <u-span from=u1 to=u2> Lenkede fragmenter (virtuelle elementer ) <d> ord1 <u id=u1 next=u2> ord2 </u></d>... <u id=u2 prev=u1> ord3 </u> Det finnes altså mange måter å kode overlapping på i SGML. Så hva er problemet? 1. Nettopp metodenes antall 2. Samtlige er tungvinte og indirekte 3. Samtlige * bryter en-til-en-forholdet mellom objekt (egenskap) og element. 4. Samtlige * metoder "lyver til parseren": Standard SGML-programvare kan ikke behandle virtuelle elementer, milepæler etc. som elementer. Følgelig: samme ulemper som med MECS ingen datastruktur eller kontrollmekanismene kan håndtere disse mekanismene i samsvar med hensikten med bruken av dem. * unntatt CONCUR - men CONCUR er problematisk og støttes ikke av vanlig SGMLprogramvare MECS (Multi-Element Code System)
6 MECS (Multi-Element Code System) Forskjeller fra SGML: Utelatelse av tagger er ikke tillatt. Tomme elementer er syntaktisk distinkte. Ingen DTD. Diverse andre forenklinger. Et MECS-dokument: < > < / / > [ / \ / / ] { " \ } <text/ <front/... /front> <body/ <title/... /title> <p/.../p> <p/.../p> /body> <back/... /back> /text> Overlapp er tillatt i MECS: <a/... <b/... /a>... /b> Tilsvarende i SGML ville være: <a>... <b>...</a>...</b> men i SGML er dette altså ikke tillatt. Hvorfor ikke? Hvorfor tillater ikke SGML overlapp? Dersom SGML tillot overlappende elementer, måtte man gi slipp både på den enkle datastrukturen og den kraftige kontrollmekanismen. SGML baserer seg på en kontekstfri grammatikk, som er vel forstått og enkel å implementere. Overlappende strukturer lar seg ikke representere med kontekstfrie grammatikker. Til slike formål kreves kontekstsensitive grammatikker, som ikke er like godt forstått. Det vil dermed bli vanskeligere å oppnå en like effektiv kontrollmekanisme Hvilken pris betaler MECS for overlapp? MECS har: En enkel notasjon MECS har ikke: noe som tilsvarer SGML/XMLs enkle datastruktur» (Dokumenter må leses fra start for parsing) Ingen kraftig kontrollmekanisme på linje med SGML/XMLs DTD. (Men det arbeides med sakene )
I dag: Neste gang: Hva er tekstkoding? Hva er en tekstfil? DASP107 Innføring i språk og data DASP108 Språk og data
DASP107 Innføring i språk og data DASP108 Språk og data Tekstkoding 28.08.08 Claus Huitfeldt Epost: Claus.Huitfeldt@fof.uib.no I dag: Kort repetisjon hva tekstkoding er SGML Neste gang: HTML XML TEI (fortsatt
DetaljerHva er tekstkoding? I dag. Hva er datalingvistikk? Uke 35, 36 og 37. Pensum. DASP107 Innføring i språk og data DASP108 Språk og data
DASP107 Innføring i språk og data DASP108 Språk og data Tekstkoding 26.08.08 Claus Huitfeldt Epost: Claus.Huitfeldt@fof.uib.no Uke 35, 36 og 37 Tirsdager 10.15-12.00 Torsdager 10.15-11.00 HF 123 Mest forelesninger,
DetaljerHUMIT1731. Tekstkoding. Koding/merking av tekst Uke 35. Tekster som teknologiske produkter. Koding/merking på flere nivå. Utvikling av notesystemet
HUMIT1731 Koding/merking av tekst Uke 35 Tekstkoding Representasjon av info, om visse aspekter ved tekster, så som Typografi Innhold Struktur Annet på en eksplisitt, systematisk og formalisert måte HUMIT1731
DetaljerE-bøker. Ellen Wiger, bokselskap.no. Workshop: Bibliotek- og informasjonsvitenskap, HIOA, januar-februar økt: om Bokselskap og tekstkoding
E-bøker Workshop: Bibliotek- og informasjonsvitenskap, HIOA, januar-februar 2015 1. økt: om Bokselskap og tekstkoding Ellen Wiger, bokselskap.no bokselskap.no bokselskap = ebokportal, et paraplynettsted
DetaljerHva er terminologi og fagspråk, og hva skal vi med det?
Hva er terminologi og fagspråk, og hva skal vi med det? Håvard Hjulstad Standard Norge 2010-04-22 - Håvard Hjulstad 1 Definisjoner 1 fagspråk : språk som blir nyttet av en yrkesgruppe, ofte kjennetegnet
Detaljer1. Lage og vise et enkelt XML-dokument
Avdeling for informatikk og e-læring, Høgskolen i Sør-Trøndelag Lage og vise et enkelt XML-dokument Lene Hoff (revidert av Tore Mallaug) 1.9.2013 Lærestoffet er utviklet for faget XML Teknologi 1. Lage
DetaljerMPEG-7. Problemstilling:
MPEG-7 Knut Holmqvist Problemstilling: Hva tilsvarer fritekstsøk i video- og audiodatabaser? Må kunne Indeksere Spørre Søke Se gjennom Levere Multimedia Informasjon om data Metadata Dublin Core Resource
DetaljerLæringsmål XML. Markering av tekst. SGML-familien. Forstå prinsippene bak XML og XHTML. Forstå hva XML kan brukes til og hvordan.
Markeringsspråk og XML Læringsmål XML Forstå prinsippene bak XML og XHTML. Forstå hva XML kan brukes til og hvordan.
DetaljerCSS. Aud Marie Hauge ekspert i brukskvalitet og universell utforming i Epinova AS
CSS Aud Marie Hauge ekspert i brukskvalitet og universell utforming i Epinova AS CSS står for Cascading Style Sheets CSS blir brukt til å bestemme hvordan HTML-elementene skal se ut (farge, størrelse,
Detaljerof color printers at university); helps in learning GIS.
Making a Home Page Why a Web Page? Easier to submit labs electronically (lack of color printers at university); Easier to grade many labs; Provides additional computer experience that helps in learning
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerGrunnleggende om websider og HTML-kode
Grunnleggende om websider og HTML-kode Html er et språk / en standard som brukes for å gi instrukser til nettlesere om hvordan ulike elementer på en webside skal fortolkes og presenteres for en sluttbruker.
DetaljerRetningslinjer forholdet objektkatalog og produktspesifikasjon
Dokument tittel: Retningslinjer forholdet objektkatalog/produktspesifikasjon Side 1 av 4 Retningslinjer forholdet objektkatalog og produktspesifikasjon Det har i lengre tid vært uenighet og forvirring
DetaljerForelesning IMT mars 2011
Forelesning IMT2243 17.mars 2011 Dagens : Kvalitetssikring i systemutviklingsprosjekter Konfigurasjonsstyring Teorigjennomgang Demonstrasjon av Subversion SVN v/jon Langseth Pensum : Sommerville kap. 24.1
DetaljerNCE TOURISM FJORD NORWAY. FJORDNETT INTERNETTFORUM 2012 Bergen, 12./13. juni 2012
NCE TOURISM FJORD NORWAY FJORDNETT INTERNETTFORUM 2012 Bergen, 12./13. juni 2012 HACKERS HOUR Hvor langt kommer vi med FjordNett rammeverket? Html CSS Javascript Hva er bestanddelene av en nettside? Html
DetaljerXML og JDOM. Helge Furuseth
XML og JDOM Helge Furuseth furuseth@idi.ntnu.no XML XML = Extensible Markup Language Basert på SGML Standard Generalized Markup Language HTML = Hypertext Markup Language Også basert på SGML Mange likheter
DetaljerINF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme, del 2
INF2810: Funksjonell Programmering En Scheme-evaluator i Scheme, del 2 Erik Velldal Universitetet i Oslo 4. mai 2017 Tema 2 Forrige uke SICP 4.1. Structure and interpretation of computer programs Metacircular
DetaljerINF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme, del 2
INF2810: Funksjonell Programmering En Scheme-evaluator i Scheme, del 2 Erik Velldal Universitetet i Oslo 4. mai 2017 Tema 2 Forrige uke SICP 4.1. Structure and interpretation of computer programs Metacircular
DetaljerSyntax/semantics - I INF 3110/ /29/2005 1
Syntax/semantics - I Program program execution Compiling/interpretation Syntax Classes of langauges Regular langauges Context-free langauges Scanning/Parsing Meta models INF 3/4-25 8/29/25 Program
DetaljerReading Grey Literature as Texts. - Semantic Mark-up of Museum Documents
Reading Grey Literature as Texts. - Semantic Mark-up of Museum Documents Jon Holmen & Øyvind Eide Unit for Digital Documentation, University of Oslo Databases 1992: * Mainly simple Inventory Lists. * Single
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 SAMMENHENGER FSA OG REGULÆRE UTTRYKK 31. januar
DetaljerINF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning
INF2820 Datalingvistikk V2015 14. Gang 4.5 Jan Tore Lønning CHART PARSING 2 I dag Svakheter ved tidligere parsere RD og SR: ineffektivitet CKY: CNF Chart parsing,,dotted items og fundamentalregelen Algoritmer:
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2012 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 17. januar 2012 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerHvorfor ikke bruke Word?
XML-basert dokumentasjon Erfaringer med innføring av xmlbasert dokumentasjonsverktøy hos Kongsberg Seatex Sissel Kolvik Tidligere IBRUK as nå SK Teknisk Dokumentasjon sissel@kolvik.priv.no 1 Hvorfor ikke
DetaljerEN Skriving for kommunikasjon og tenkning
EN-435 1 Skriving for kommunikasjon og tenkning Oppgaver Oppgavetype Vurdering 1 EN-435 16/12-15 Introduction Flervalg Automatisk poengsum 2 EN-435 16/12-15 Task 1 Skriveoppgave Manuell poengsum 3 EN-435
DetaljerIntro til WWW, HTML5 og CSS
Intro til WWW, HTML5 og CSS Håkon Tolsby 20.08.2015 Håkon Tolsby 1 World Wide Web Webserver: Programvare som distribuerer websider og/eller maskin hvor programmet kjører Webbrowser (nettleser): Program
DetaljerEKSAMEN Web-publisering
EKSAMEN 6101 Web-publisering 02.06.2016 Tid: Målform: Sidetall: 3 timer Bokmål 5 (inkludert denne) Hjelpemiddel: Ingen Merknader: Vedlegg: Alle oppgavene er vektet, pass på å fordele tiden du bruker mellom
DetaljerForsvunnet katt webside
Lesson 3 Forsvunnet katt webside All Code Clubs must be registered. Registered clubs appear on the map at codeclubworld.org - if your club is not on the map then visit jumpto.cc/18cplpy to find out what
DetaljerINF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme, del 2
INF2810: Funksjonell programmering INF2810: Funksjonell Programmering En Scheme-evaluator i Scheme, del 2 Erik Velldal Universitetet i Oslo 7. mai 2015 Tema Forrige uke SICP 4.1. Structure and interpretation
DetaljerEr arketype-metodikken aktuell å benytte på nasjonalt plan i Norge? Jostein Ven, seniorrådgiver, Helsedirektoratet
Er arketype-metodikken aktuell å benytte på nasjonalt plan i Norge? Jostein Ven, seniorrådgiver, Helsedirektoratet Mål / Visjon Felles språk for strukturerte pasientjournaler: For å dele, utveksle, gjenbruke,
DetaljerPrinsipper for å lage definisjoner (ISO704:2000) Principles for definition writing (ISO 704:2000)
Dokument tittel: Prinsipper for definisjoner jfr ISO704:2000 Side 1 av 4 Prinsipper for å lage definisjoner (ISO704:2000) Principles for definition writing (ISO 704:2000) A.1 Grunnprinsipper (Basic principles)
Detaljerbuildingsmart Norge seminar Gardermoen 2. september 2010 IFD sett i sammenheng med BIM og varedata
buildingsmart Norge seminar Gardermoen 2. september 2010 IFD sett i sammenheng med BIM og varedata IFD International Framework for Dictionaries Hvordan bygges en BIM? Hva kan hentes ut av BIM? Hvordan
DetaljerDRI2001 : Informasjonsinfrastrukturer Forelesning Arild Jansen, AFIN
Forelesning 11107 Arild Jansen, AFIN Oppsummering Litt om styring, arkitektur, sematiske teknologier mm Temaer: Overblikk over pensum Lit tom styring, arkitektur med mer Litt om semantiske teknologier,
DetaljerINF2810: Funksjonell Programmering. Tilstand og verditilordning
INF2810: Funksjonell programmering INF2810: Funksjonell Programmering Tilstand og verditilordning Erik Velldal Universitetet i Oslo 26. februar 2015 Forrige gang 2 I dag Vi blar om til kapittel 3 i SICP.
DetaljerINF2820 V2017 Oppgavesett 5 Gruppe 21.2
INF2820 V2017 Oppgavesett 5 Gruppe 21.2 Denne uka er det først noen teoretiske oppgaver. Deretter er det en del praktiske arbeidsoppgaver som vil forberede deg til arbeidet med innleveringsoppgavesett
Detaljerpnvdb Documentation Release Jan Tore Kyrdalen
pnvdb Documentation Release 0.1.0 Jan Tore Kyrdalen Oct 31, 2017 Contents 1 Installation 3 2 Getting started 5 3 Methods 7 3.1 status................................................... 7 3.2 objekt...................................................
Detaljer3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerFeilmelding Årsak Løsning
Request for the permission of type 'System.Security.Permissions.EnvironmentPermission, mscorlib, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089' failed Feil oppstod i Window.DialogWindow:
DetaljerINF2810: Funksjonell Programmering. Mer om strømmer
INF2810: Funksjonell Programmering Mer om strømmer Stephan Oepen & Erik Velldal Universitetet i Oslo 19. april 2013 Tema 2 Forrige uke Repetisjon: parallelitet Noe helt nytt: strømmer Noe quizzaktivitet
DetaljerINF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme
INF2810: Funksjonell Programmering En Scheme-evaluator i Scheme Erik Velldal Universitetet i Oslo 19. april 2016 Tema 2 Forrige uke Strømmer og utsatt evaluering Kort om makroer I dag Kap. 4 Metasirkulær
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En
Detaljer1. Mer om oppbyning av XML-dokument
Avdeling for informatikk og e-læring, Høgskolen i Sør-Trøndelag Mer om oppbyning av XML-dokument Lene Hoff 2.9.2013 Lærestoffet er utviklet for faget XML Teknologi 1. Mer om oppbyning av XML-dokument Resymé:
DetaljerDigitization of archaeology is it worth while?
Digitization of archaeology is it worth while? Results from a survey among Norwegian archaeologists. Jon Holmen & Christian-Emil re Unit for Digital Documentation, University of slo Major digitization
DetaljerSemistrukturerte data og XML
UNIVERSITETET I OSLO Semistrukturerte data og XML Where is the Life we have lost in living? Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information? -- T. S. Eliot
Detaljer1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 Regulære språk Følgende er ekvivalente: a) L kan
DetaljerINF2810: Funksjonell Programmering. Mer om strømmer
INF2810: Funksjonell Programmering Mer om strømmer Stephan Oepen & Erik Velldal Universitetet i Oslo 19. april 2013 Tema 2 Forrige uke Repetisjon: parallelitet Noe helt nytt: strømmer Noe quizzaktivitet
DetaljerINF2810: Funksjonell Programmering. Tilstand og verditilordning
INF2810: Funksjonell Programmering Tilstand og verditilordning Erik Velldal Universitetet i Oslo 1. mars 2018 Forrige gang 2 Kode som trær 3 Ved evaluering oversettes kildekoden i et språk først til et
DetaljerFrom a table based Feature Catalogue to GML Application schemas
From a table based Feature Catalogue to GML Application schemas 05/ 09/ 2015 EuroSDR Data modelling workshop, Copenhagen 28.-30.1.2015 Knut Jetlund Norwegian Public Roads Administration knut.jetlund@vegvesen.no
Detaljer1 User guide for the uioletter package
1 User guide for the uioletter package The uioletter is used almost like the standard LATEX document classes. The main differences are: The letter is placed in a \begin{letter}... \end{letter} environment;
DetaljerINF2810: Funksjonell Programmering. Tilstand og verditilordning
INF2810: Funksjonell Programmering Tilstand og verditilordning Stephan Oepen Universitetet i Oslo 2. mars 2017 Forrige gang 2 I dag 3 Vi blar om til kapittel 3 i SICP. Tilstand og verditilordning. Destruktive
DetaljerNKKN typeforslag versjon 2.0.1. Definisjon av grunntypene
NKKN typeforslag versjon 2.0.1 For å lette innsamling av typedata er det laget en importrutine i NKKN som muliggjør automatisering. Foreløpig kan en kun sende forslag via email, en webservice er planlagt
DetaljerHvem jeg er Lars Marius Garshol Hovedfag informatikk på Blindern Jobbet et par år med XML i STEP Infotek, før jeg og noen andre startet Ontopia Har sk
Hvem jeg er Lars Marius Garshol Hovedfag informatikk på Blindern Jobbet et par år med XML i STEP Infotek, før jeg og noen andre startet Ontopia Har skrevet en XML parser i Python, vedlikeholder Free XML
DetaljerØvingsforelesning 2. Mengdelære, funksjoner, rekurrenser, osv. TMA4140 Diskret Matematikk. 10. og 12. september 2018
Mengdelære, funksjoner, rekurrenser, osv. Øvingsforelesning 2 TMA4140 Diskret Matematikk 10. og 12. september 2018 Dagens øvingsforelesning Spørsmål til emnene i forrige uke Oppgaver fra midtsemesterprøver
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 8. gang, 6.3.2014 Jan Tore Lønning I dag Chart parsing Implementasjon CKY og Chart: Parsing vs anerkjenning 2 Chart alternativ datastruktur (S, [0, 1]) (VP, [0,1]) (Det, [1,2])
Detaljercase forts. Alternativ 1 Alternativer Sammensetning Objekt-interaktor med valg
Objekt-interaktor med valg AMS- case forts. Eksemplifisering av modellbasert tilnærming til design av brukergrensesnitt Relatert objekt velges ofte blant mange kandidater Output av kandidat-sett Input
DetaljerDIGITALE MODELLER OG MENTALE MODELLER
DIGITALE MODELLER OG MENTALE MODELLER (standarder og standardisering) Formidlet 2013-04-24 på VIANOVA Brukerkonferanse i Oslo av Eilif Hjelseth, Digitale UMB E-post: eilif.hjelseth@umb.no DIGITALE MODELLER
DetaljerMarkeringsspråk og XML
Rå tekst vs. formatert tekst Markeringsspråk og XML Det var en gang og snipp, snapp, snute, så var det eventyret ute. Standarder som ASCII, ISO 8859-x og Unicode gjelder rå tekst (
DetaljerNavngivning av XML elementer
Navngivning av XML elementer Versjon 1.0 En anbefaling fra Norsk EDIPRO August 2002 Norsk EDIPRO Tel. 22 12 83 90 Postboks 2526 Soll Fax. 22 12 83 97 0202 Oslo Internet: www.edipro.no Forord Språket XML,
DetaljerINF2810: Funksjonell Programmering. Tilstand og verditilordning
INF2810: Funksjonell Programmering Tilstand og verditilordning Stephan Oepen Universitetet i Oslo 8. mars 2016 Forrige gang 2 I dag 3 Vi blar om til kapittel 3 i SICP. Tilstand og verditilordning. Destruktive
DetaljerOpprette local electronic collection med local portfolios manuelt
Opprette local electronic collection med local portfolios manuelt Dato: 2017-03-24 Hvis du ikke finner en e-ressurspakke (e-bok, tidsskrift eller database) i Community zone (CZ), oppretter du en local
DetaljerPublic roadmap for information management, governance and exchange. 2015-09-15 SINTEF david.norheim@brreg.no
Public roadmap for information management, governance and exchange 2015-09-15 SINTEF david.norheim@brreg.no Skate Skate (governance and coordination of services in egovernment) is a strategic cooperation
DetaljerPraktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy. v/sigve Espeland
Praktisk bevaringsmetodikk - prosesser, rutiner, metoder, verktøy v/sigve Espeland OAIS Open Archival Information System (ISO 14721) Publisert i 2002. Utviklet av The Consultative Committee for Space Data
DetaljerOblig 1. Oppgave 1. Gå gjennom nettsiden arngren.net og list opp alle problemene du ser. Både i funksjonalitet/bruk og i koden bak.
Oblig 1 Oppgave 1 Gå gjennom nettsiden arngren.net og list opp alle problemene du ser. Både i funksjonalitet/bruk og i koden bak. Problemer med arngren.net: 1. Nettsiden er SYKT uoversiktlig! 2. Det er
DetaljerInformation search for the research protocol in IIC/IID
Information search for the research protocol in IIC/IID 1 Medical Library, 2013 Library services for students working with the research protocol and thesis (hovedoppgaven) Open library courses: http://www.ntnu.no/ub/fagside/medisin/medbiblkurs
DetaljerHUIN100 Essay nr. 2. Skrevet av: Morten Sørreime Studentnr.: Antall ord: 947. Side 1 av 5
HUIN100 Essay nr. 2 Skrevet av: Morten Sørreime Studentnr.: Antall ord: 947 Side 1 av 5 Om markeringsspråk og RSS Jeg starter med en kort beskrivelse av HTML/XHTML og XML og deres innbyrdes forskjeller.
DetaljerINF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme
INF2810: Funksjonell Programmering En Scheme-evaluator i Scheme Erik Velldal Universitetet i Oslo 27. april 2017 Tema 2 Forrige forelesning Strømmer og utsatt evaluering Kort om makroer I dag Kap. 4 Metasirkulær
DetaljerWeb Services. Olav Lysne
Web Services Olav Lysne Til nå har dere hørt om Mellomvare for objektbasert kommunikasjon brukes vanligvis i anvendelser som er innen én organisasjon, eller innen et tett konsortium av samarbeidende organisasjoner
DetaljerFra SOSI- til GML-format likheter og forskjeller. X, Y og Z 2019 Geir Myhr Øien, Kartverket
Fra SOSI- til GML-format likheter og forskjeller X, Y og Z 2019 Geir Myhr Øien, Kartverket Hva er SOSI? SOSI = Samordnet Opplegg for Stedfestet Informasjon Arbeidet med SOSI-standardisering har som mål
DetaljerWeb fundamentals. Web design. Frontend vs. Backend 17.01.2008. Webdesign 17. januar 2008 3. Monica Strand
Web fundamentals Webdesign 17. januar 2008 Monica Strand Webdesign 17. januar 2008 1 Web design Fagområdet Web design inneholder flere disipliner Grafisk design Informasjonsdesign Brukergrensesnittdesign
DetaljerAMS-case forts. Eksemplifisering av modellbasert. tilnærming til design av brukergrensesnitt
AMS-case forts. Eksemplifisering av modellbasert tilnærming til design av brukergrensesnitt Objekt-interaktor med valg Relatert objekt velges ofte blant mange kandidater Output av kandidat-sett Input av
Detaljer(X)HTML, CSS og JavaScript HTML. Det første dokumentet 26.11.2007. Grunnleggende programmering i Java Monica Strand 26.
(X)HTML, CSS og JavaScript Grunnleggende programmering i Java Monica Strand 26. november 2007 Gr. leggende Java 26. november 2007 1 HTML HTML = Hyper Text Markup Language Strukturerer tekstinnhold HTML
DetaljerForelesning 23/9-08 Webprog 1. Tom Heine Nätt
Forelesning 23/9-08 Webprog 1 Tom Heine Nätt Kursinfo Tom Heine Nätt E-post: tom.h.natt@hiof.no Mobil: 92012120 MSN: thnatt@hotmail.com All nødvendig info (forhåpentligvis) finnes på kursets webside: http://www.it.hiof.no/webprog1
Detaljer1. XML Grunnlag
Avdeling for informatikk og e-læring, Høgskolen i Sør-Trøndelag XML Mildrid Ljosland 4.2.2008 Lærestoffet er utviklet for faget LO701D Interaktive Webtjenester med Java og XML 1. XML Resymé: Webtjeneste-teknologien
DetaljerHøringsnotat ny delversjon av Referansekatalog for anbefalte og obligatoriske IT-standarder i offentlig sektor, våren 2015
Høringsnotat ny delversjon av Referansekatalog for anbefalte og obligatoriske IT-standarder i offentlig sektor, våren 2015 1 Innhold 1. Bakgrunn og innledning... 3 2. Standarder for publisering av nettleserbaserte
DetaljerReferansemodell for arkiv
Referansemodell for arkiv Innhold: Grunnkonsept Konsept 1 - arkiv som generell tjeneste Konsept 2 - arkiv som et sett av tjenester Konsept 3 - arkiv som data knyttet til en prosess Konsept 4 - arkiv som
DetaljerINF2820 V2017 Oppgavesett 5 arbeidsoppgaver
INF2820 V2017 Oppgavesett 5 arbeidsoppgaver Dette er oppgaver du kan arbeide med på egen hånd. Du kan også arbeide med dem i gruppa 28.2 (hvis du har innleveringsoppgave 2 under kontroll) og spørre gruppelæreren
DetaljerMicrosoft Dynamics C5 Version 2008 Oversigt over Microsoft Reporting Services rapporter
Reporting Services - oversigt Microsoft Dynamics C5 Version 2008 Oversigt over Microsoft Reporting Services rapporter Summary Efterfølgende vises en oversigt over de rapporter som er indeholdt i Microsoft
DetaljerAvtaleGiro beskrivelse av feilmeldinger for oppdrag og transaksjoner for KID bytte kvitteringsliste L02625 levert i CSV format
AvtaleGiro beskrivelse av feilmeldinger for oppdrag og transaksjoner for KID bytte kvitteringsliste L02625 levert i CSV format Kvitteringsliste L02625 for avviste oppdrag, transaksjoner og informasjonsmeldinger
DetaljerMarkeringsspråk og XML Nettsider og XHTML
Markeringsspråk og XML Nettsider og XHTML Det var en gang og snipp, snapp, snute, så var det eventyret ute. Læreboka kapittel 3 og 4 5. september 2007 XML og XHTML XML = EXtensible
DetaljerMMT105 Internettprogrammering Uke 44, høst 2007
MMT105 Internettprogrammering Uke 44, høst 2007 Introduksjon til CSS MMT105 HiNT 2007 1 HTML-elementenes strukturerende egenskaper HTML-elementene skal markere strukturen i et webdokument, dvs. at de forskjellige
DetaljerPython: Løkker. TDT4110 IT Grunnkurs Professor Guttorm Sindre
Python: Løkker TDT4110 IT Grunnkurs Professor Guttorm Sindre Læringsmål og pensum Mål Forstå hvorfor vi trenger løkker i programmering Ha kjennskap to ulike typer løkker (while-løkke, for-løkke) Og vite
DetaljerINF2810: Funksjonell Programmering. En metasirkulær evaluator
INF2810: Funksjonell Programmering En metasirkulær evaluator Stephan Oepen & Erik Velldal Universitetet i Oslo 26. april 2013 Tema 2 Forrige uke Strømmer og utsatt evaluering Memoisering Kort om makroer
DetaljerDatabases 1. Extended Relational Algebra
Databases 1 Extended Relational Algebra Relational Algebra What is an Algebra? Mathematical system consisting of: Operands --- variables or values from which new values can be constructed. Operators ---
DetaljerTo RDF or not to RDF Fagdag om Noark 5 og RDF
Ragnar Sturtzel 2014-06-17 To RDF or not to RDF Fagdag om Noark 5 og RDF Diskusjonstemaer Først en kort oppsummering av dagen Så noen spørsmål jeg har satt opp Til slutt åpen debatt 2 Oppsummering 1 Graham
Detaljer1. Definisjoner Forholdet mellom SOSI fagområdestandard og SOSI produktspesifikasjon SOSI fagområdestandard... 4
Gjelder for: Geomatikkbransjen i Norge Retningslinjer for forholdet mellom fagområdestandarder og produktspesifikasjoner, og deres objektkataloger Dokumentansvarlig: IT-standarder og teknologiutviklingsseksjonen
DetaljerINF2820 Datalingvistikk V2012
INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 24. februar 2012 2 1 I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Parsing: ovenifra og ned
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 23. februar 2012 2 I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Parsing: ovenifra og ned
DetaljerDynamic Programming Longest Common Subsequence. Class 27
Dynamic Programming Longest Common Subsequence Class 27 Protein a protein is a complex molecule composed of long single-strand chains of amino acid molecules there are 20 amino acids that make up proteins
DetaljerINF2810: Funksjonell Programmering. En metasirkulær evaluator, del 2
INF2810: Funksjonell Programmering En metasirkulær evaluator, del 2 Stephan Oepen & Erik Velldal Universitetet i Oslo 03. mai 2013 Tema 2 Forrige uke SICP 4.1. Structure and interpretation of computer
DetaljerADDML. Archival Data Description Markup Language. Generell del. Versjon PA 0.07 Sist oppdatert: TPD. ADDML_8_2.doc 03/03/2011 1(12)
ADDML Archival Data Description Markup Language Generell del Versjon PA 0.07 Sist oppdatert: 2010-09-16 TPD ADDML_8_2.doc 03/03/2011 1(12) Innledning... 4 Mål... 4 Historie... 4 Hvordan benytte ADDML...
DetaljerForeløpig resultat fra utredning om universell utforming av dokumenter i filformatene PDF og ODF
Fakultet for teknologi og realfag Serviceboks 509 NO-4898 Grimtad Tel. 37 25 30 00 Fax. 37 25 30 01 Dr. Mikael Snaprud Tel. 37 25 33 23 Epost: mikael.snaprud@uia.no Kristian Bergem Fornyings- og administrasjonsdepartementet
DetaljerINF2810: Funksjonell Programmering. En metasirkulær evaluator, del 2
INF2810: Funksjonell Programmering En metasirkulær evaluator, del 2 Stephan Oepen & Erik Velldal Universitetet i Oslo 03. mai 2013 Tema 2 Forrige uke SICP 4.1. Structure and interpretation of computer
DetaljerHvordan komme i gang med ArchiMate? Det første modelleringsspråket som gjør TOGAF Praktisk
Hvordan komme i gang med ArchiMate? Det første modelleringsspråket som gjør TOGAF Praktisk Logica 2012. All rights reserved No. 3 Logica 2012. All rights reserved No. 4 Logica 2012. All rights reserved
DetaljerSoftware Requirements and Design (SRD) 1 Generelt om dokumenter
Software Requirements and Design (SRD) Vi må ha en standard tittelside (Side 1) på alle dokumenter. I tillegg til tittel, kan vi ha med firmanavn, logo, m.m. Innholdsfortegnelse bør også være med på side
DetaljerTDT4117 Information Retrieval - Autumn 2014
TDT4117 Information Retrieval - Autumn 2014 Assignment 1 Task 1 : Basic Definitions Explain the main differences between: Information Retrieval vs Data Retrieval En samling av data er en godt strukturert
DetaljerSlides til 12.1 Formelt språk og formell grammatikk
Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen
DetaljerFolloarkivets dagskonferanse 2014
Folloarkivets dagskonferanse 2014 Filer som varer Tony Lærdahl, tony.lardahl@ciber.com 4/10/2014 1 2014 Ciber Filer som varer Elektroniske dokumenter Filformater Standarder Utfordringer på lang sikt 4/10/2014
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF5110 Eksamensdag : Tirsdag 6. juni 2006 Tid for eksamen : 09.00-12.00 Oppgavesettet er på : 5 sider Vedlegg : Intet Tillatte
DetaljerAvtaleGiro beskrivelse av feilmeldinger for oppdrag og transaksjoner kvitteringsliste L00202 levert i CSV fil
AvtaleGiro beskrivelse av feilmeldinger for oppdrag og transaksjoner kvitteringsliste L00202 levert i CSV fil Kvitteringsliste L00202 for avviste oppdrag, transaksjoner og informasjonsmeldinger CSV Format:
Detaljer