INF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione
|
|
- Arve Bjerke
- 6 år siden
- Visninger:
Transkript
1 Arne Skjærholt Terza lezione Arne Skjærholt Terza lezione
2
3 Regulære uttrykk Regex Regulære uttrykk (regular expressions) er et godt eksempel på det som kalles finite-state methods (hvorfor det heter det kommer vi til om litt). Dette er en klasse metoder som har veldig gode effektivitetsegenskaper. Å behandle en streng kan gjøres i lineær tid (O(n)) og krever konstant minne (O(1)). Regex Foruten å være praktiske i datalingvistikk er regexer generelt nyttige i datasammenheng, og brukes mye i forskjellige verktøy, særlig i UNIX-systemer.
4 Regulære uttrykk Literal vs. meta-character Engelsk terminologi, for det er stort sett engelsk i dokumentasjon. På norsk: bokstavelig og meta-tegn. Bokstavelige tegn angir bokstaven selv, mens meta-tegn modifiserer betydningen til andre tegn. Den varianten regulære uttrykk vi skal se på kalles Perl-kompatible regexer, men det finnes flere andre varianter (selv om dette er den beste av dem). Literal vs. meta-character
5 Regulære uttrykk /foo/ De fleste bokstaver står bare for seg selv. /foo/
6 Regulære uttrykk /baaa*!/ /*/ er en kvantor, og angir at bokstaven foran kan forekomme 0 eller flere ganger. Den kalles gjerne for Kleene star. /baaa*!/
7 Regulære uttrykk /baa+!/ Kleene plus er en annen kvantor, som angir 1 eller flere ganger. /x+/ er det samme som /xx*/. /baa+!/
8 Regulære uttrykk /woodchucks?/ Null eller en. /woodchucks?/
9 Regulære uttrykk /(ab)+/ Av og til vil vi at større grupper enn en og en bokstav skal repetere. Da må vi bruke parenteser til å lage en gruppe som så skal repetere. /(ab)+/
10 Regulære uttrykk /a b/ /[abc]/ /[ˆaeiouyæøå]/ /[a-z]/ Enten eller. Hvis det bare er forskjellige tegn kan vi bruke /[...]/, og /[ˆ...]/ matcher enhver bokstan unntatt de inni. /a b/ /[abc]/ /[ˆaeiouyæøå]/ /[a-z]/
11 Regulære uttrykk /a.c/ Hvilken som helst bokstav. /a.c/
12 Regulære uttrykk /ˆLorem/ /amet\.$/ Matche bare på begynnelsen av strengen eller slutten av strengen. /ˆLorem/ /amet\.$/
13 Regulære uttrykk /\d/ = /[0-9]/ /\w/ = /[0-9a-zA-Z ]/ /\s/ = /[ \t\n]/ Noen innebygde tegnklasser. /\d/ = /[0-9]/ /\w/ = /[0-9a-zA-Z ]/ /\s/ = /[ \t\n]/
14 Regulære uttrykk /\D/ = /[ˆ0-9]/ /\W/ = /[ˆ0-9a-zA-Z ]/ /\S/ = /[ˆ\t\n]/ Stor forbokstav matcher alt unntatt de innebygde klassene. /\D/ = /[ˆ0-9]/ /\W/ = /[ˆ0-9a-zA-Z ]/ /\S/ = /[ˆ\t\n]/
15 Regulære uttrykk ELIZA (Weizenbaum 1966): User: Men are all alike ELIZA: in what way? User: They re always bugging us about something ELIZA: can you think of an example? User: Well, my boyfriend made me come here ELIZA: your boyfriend made you come here. User: He says I m depressed much of the time ELIZA: i m sorry to hear that you are depressed. ELIZA (Weizenbaum 1966): User: Men are all alike ELIZA: in what way? User: They re always bugging us about something ELIZA: can you think of an example? User: Well, my boyfriend made me come here ELIZA: your boyfriend made you come here. User: He says I m depressed much of the time ELIZA: i m sorry to hear that you are depressed.
16 Regulære uttrykk ELIZA (Weizenbaum 1966): User: Men are all alike ELIZA: in what way? User: They re always bugging us about something ELIZA: can you think of an example? User: Well, my boyfriend made me come here ELIZA: your boyfriend made you come here. User: He says I m depressed much of the time ELIZA: i m sorry to hear that you are depressed. s/.* I am (depressed sad).* / I am sorry to hear that you are \1/ s/.* always.* / Can you think of a specific example / ELIZA (Weizenbaum 1966): User: Men are all alike ELIZA: in what way? User: They re always bugging us about something ELIZA: can you think of an example? User: Well, my boyfriend made me come here ELIZA: your boyfriend made you come here. User: He says I m depressed much of the time ELIZA: i m sorry to hear that you are depressed. s/.* I am (depressed sad).* / I am sorry to hear that you are \1/ s/.* always.* / Can you think of a specific example /
17 Formelle språk Språk L over alfabet Σ Språk L over alfabet Σ
18 Formelle språk αβγδεζηθικλμ νξοπρστυφχψω αβγδεζηθικλμ νξοπρστυφχψω
19 Formelle språk ΑΒΓΔΕΖΗΘΙΚΛΜ ΝΞΟΠΡΣΤΥΦΧΨΩ ΑΒΓΔΕΖΗΘΙΚΛΜ ΝΞΟΠΡΣΤΥΦΧΨΩ
20 Formelle språk Ubegrensede Kontekstsensitive Kontekstfrie Regulære Ubegrensede Chomskyhierarkiet. Regulære språk kan parses i lineær tid, konteksfrie i polynomisk (O(n 3 )), kontekstsensitive krever eksponensiell tid (PSPACE-complete), og ubegrensede språk krever en full Turing-maskin. Kontekstsensitive Kontekstfrie Regulære
21 Formelle språk L Σ Det formelle språket L er en delmengde av mengden strenger man kan lage med tegn fra alfabetet Σ L Σ
22 Formelle språk 1. Det tomme språket er regulært 2. a Σ er singleton-språket {a} regulært 3. Gitt A og B regulære språk er også A B, A B og A regulære Dette konstruerer nøyaktig de regulære språkene. Det vil si alle de regulære språkene, og ingen andre. 1. Det tomme språket er regulært 2. a Σ er singleton-språket {a} regulært 3. Gitt A og B regulære språk er også A B, A B og A regulære
23 Formelle språk Lukket under: Union (A B også regulært) Snitt (A B også regulært) Komplement (Ā også regulært) Mengdedifferanse (A B også regulært) Lukket under X vil si at hvis du putter en A og en B som har egenskapen inn i operasjon X, vil resulatet ha samme egenskap som A og B hadde. Den siste egenskapen følger fra to og tre siden A B = A B Lukket under: Union (A B også regulært) Snitt (A B også regulært) Komplement (Ā også regulært) Mengdedifferanse (A B også regulært)
24 Formelle språk {w der w er... } Et formelt språk er en mengde (husk L Σ ), så vi bruker gjerne mengdenotasjon med litt vanlig tekst i for å definere språkene våre. {w der w er... }
25 Tilstandsmaskiner Σ,S,s 0,δ,F Formelt definerer vi en endelig tilstandsmaskin som en fem-tuppel, der hvert element angir forskjellige deler av maskinen. Σ,S,s 0,δ,F
26 Tilstandsmaskiner Σ Σ er alfabetet til språket vi snakker om, akkurat som i definisjonen av et formelt språk. Σ
27 Tilstandsmaskiner S S er mengden tilstander. S
28 Tilstandsmaskiner s 0 S s 0 er starttilstanden; der maskinen starter å behandle data. s 0 S
29 Tilstandsmaskiner δ : S Σ S δ er transisjonsfunksjonen. For hver tilstand maskinen kan være i pluss alle mulige bokstaver som kan være den neste å behandle (S Σ) angir den ( ) hva neste tilstand er (S). δ : S Σ S
30 Tilstandsmaskiner F S F er sluttilstandene, en delmengde av S. Hvis maskinen ender opp i en av disse tilstandene er strengen i språket. I alle andre tilfeller forkastes strengen. F S
31 Tilstandsmaskiner Σ,S,s 0,δ,F Formelt definerer vi en endelig tilstandsmaskin som en fem-tuppel, der hvert element angir forskjellige deler av maskinen. Σ,S,s 0,δ,F
32 Tilstandsmaskiner b a! q 0 q 1 q 2 q 3 a a En naturlig måte å studere FSAer på er en grafisk representasjon. Pila angir starttilstanden, pilene sier hvor du skal gå når du ser en bokstav, og tilstander med to ringer er slutttilstander. En annen måte å representere maskinen på, som er nyttig for datamaskiner som skal kjøre en maskin, er transisjonstabellen. q b 0 q a 1 q! 2 q 3 Femtuppelet som angir maskinen for sauespråket er dermed de fem punktene her.
33 Tilstandsmaskiner b a! q 0 q 1 q 2 q 3 a a b! q 1 q 0 q 1 q 2 q 2 q 2 q 3 q 3 a En naturlig måte å studere FSAer på er en grafisk representasjon. Pila angir starttilstanden, pilene sier hvor du skal gå når du ser en bokstav, og tilstander med to ringer er slutttilstander. En annen måte å representere maskinen på, som er nyttig for datamaskiner som skal kjøre en maskin, er transisjonstabellen. Femtuppelet som angir maskinen for sauespråket er dermed de fem punktene her. q b 0 q a 1 q! 2 q 3 a b! q 0 q 1 q 1 q 2 q 2 q 2 q 3 q 3
34 Tilstandsmaskiner Σ = {a,b,!} S = {q 0,q 1,q 2,q 3} s 0 = q 0 b a! q 0 q 1 q 2 q 3 δ(q,σ) fra transisjonstabellen F = {q 3} a a b! q 1 q 0 q 1 q 2 q 2 q 2 q 3 q 3 a En naturlig måte å studere FSAer på er en grafisk representasjon. Pila angir starttilstanden, pilene sier hvor du skal gå når du ser en bokstav, og tilstander med to ringer er slutttilstander. En annen måte å representere maskinen på, som er nyttig for datamaskiner som skal kjøre en maskin, er transisjonstabellen. Femtuppelet som angir maskinen for sauespråket er dermed de fem punktene her. Σ = {a,b,!} S = {q 0,q 1,q 2,q 3 } s 0 = q 0 q b 0 q a 1 q! 2 q 3 δ(q,σ) fra transisjonstabellen F = {q 3 } a b! q 0 q 1 q 1 q 2 q 2 q 2 q 3 q 3
35 Tilstandsmaskiner Determinisme En maskin er deterministisk hvis man i alle tilstander alltid vil vite hva den neste tilstanden må være, for alle mulige inputbokstaver. Det vil si at maskinen i alle tilstander aldri har to forskjellige kanter med samme bokstav på. I en ikke-deterministisk maskin kan vi også ha ɛ-kanter, som går til en annen tilstand uten å behandle en bokstav. Determinisme I en ikke-deterministisk maskin vil transisjonsfunksjonen være δ : S Σ P (S), siden det er mer enn én mulig tilstand.
INF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #4
IN1140: Introduksjon til språkteknologi Forelesning #4 Samia Touileb Universitetet i Oslo 13. september 2018 Tema for i dag 2 Regulære uttrykk Endelige tilstandsmaskiner ( Finite State Automata, FSA) Definisjon
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 06 februar, 2012 OVERSIKT Finite-state -teknologi er kjapp og effektiv nyttig for et antall språkteknologiske
DetaljerINF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK 19. januar 2017 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En
DetaljerFølger Sipsers bok tett både i stoff og oppgaver.
1 - hrj 1 Følger Sipsers bok tett både i stoff og oppgaver. Tirsdag forelesninger, nytt stoff Onsdag eksempler og utfyllende stoff Torsdag oppgaver fra uka før Start: kapittel 1 (2uker), 2 (2uker),3 (2uker),4
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerINF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK, DEL 2 19. januar 2017 2 Sist uke: FSA Brukes om hverandre: Finite state automaton - FSA
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 26. januar 2015 2 ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 26. januar 2015
DetaljerINF2820 Datalingvistikk V2016. Jan Tore Lønning
INF2820 Datalingvistikk V2016 Jan Tore Lønning ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 25. januar 2016 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En innretning som
DetaljerINF2820 Datalingvistikk V2016. Jan Tore Lønning
INF2820 Datalingvistikk V2016 Jan Tore Lønning ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 3. februar 2016 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En innretning som
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 22. januar 2015 2 ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 23. januar 2015
DetaljerIN2080. Oppgave 1. Oppgave 2. Eksamen. Vår Den nondeterministiske endelige automaten A er gitt ved (Q, Σ, δ, q 0, F ) der
IN2080 Eksamen Vår 2019 Oppgave 1 Den nondeterministiske endelige automaten A er gitt ved (Q, Σ, δ, q 0, F ) der Q = {q 0, q 1, q 2 } er mengden av tilstander Σ = {a, b} er inputalfabetet q 0 er starttilstanden
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2012 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 17. januar 2012 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 19. januar 2014 2 Naturlige språk En mann kjøpte en bil av en mann som hadde eid bilen i
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 26. januar 2011 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerINF1820 INF Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon Previously... Alle rare ordene Alle rare morfene Previously... Coming up... Morfologi med datamaskin (computational morphology) Hvordan analysere
DetaljerINF2080 Logikk og beregninger
INF2080 Logikk og beregninger Forelesning 4: Regulære uttrykk Sist oppdatert: 2012-01-24 12:05 4.1 Regulære uttrykk Beskrive aksepterte ord 4.1 Regulære uttrykk Beskrive aksepterte ord INF2080 Logikk og
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 20. januar 2012 2 Non-Determinism Speech and Language Processing - Jurafsky and Martin
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 22. januar 2014 2 DFA deterministisk endelig maskin Q = {q0, q1, q2,, qn-1} Strengt
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational
DetaljerINF1820: Oppsummering
Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til
DetaljerHva er syntaks? En overskrift i en norsk avis: Dagens tema Grundig repetisjon og utdyping:
Hva er syntaks? En overskrift i en norsk avis: Fanger krabber så lenge de orker Dagens tema Grundig repetisjon og utdyping: Er det i C lov å skrive for (;;) { while () { Syntaks kontra semantikk for å
DetaljerDagens tema Grundig repetisjon og utdyping: Syntaks kontra semantikk
Dagens tema Grundig repetisjon og utdyping: Syntaks kontra semantikk Regulære uttrykk og automataer Ulike typer språk Ulike representasjoner av regulære språk Endelige tilstandsmaskiner (FSM-er) Deterministiske
DetaljerINF2820 Datalingvistikk V2018 Forelesning 3, 29. jan. Jan Tore Lønning
INF2820 Datalingvistikk V2018 Forelesning 3, 29. jan. Jan Tore Lønning Hva her vi lært? A. Deterministiske endelige tilstandsmaskiner (DFA) og hvordan de kan definer et (formelt) språk. B. Ikke-deterministiske
DetaljerInf1000 (Uke 10) HashMap og ArrayList
Inf1000 (Uke 10) HashMap og ArrayList Grunnkurs i programmering Institutt for Informatikk Universitetet i Oslo Anja Bråthen Kristoffersen og Are Magnus Bruaset Bibliotekpakker i Java Det er laget mange
DetaljerViktige begrep i kapittel 1.
Viktige begrep i kapittel 1. 1. Egenskaper ved relasjoner. La R A A være en binær relasjon. (a) At R er refleksiv betyr at x (x, x) R. (b) At R er symmetrisk betyr at x y ((x, y) R (y, x) R ). (c) At R
DetaljerDagens tema: Regulære språk og uttrykk
IN 2 Programmeringsspråk Dagens tema: Regulære språk og uttrykk Ulike typer språk (Kompendium 47: 23) Hvorfor er regulære uttrykk så interessante? Ulike representasjoner av regulære språk (Kompendium 47:
DetaljerTuringmaskiner en kortfattet introduksjon. Christian F Heide
7. november 016 Turingmaskiner en kortfattet introduksjon Christian F Heide En turingmaskin er ikke en fysisk datamaskin, men et konsept eller en tankekonstruksjon laget for å kunne resonnere omkring blant
DetaljerTuringmaskiner en kortfattet introduksjon. Christian F Heide
13. november 2014 Turingmaskiner en kortfattet introduksjon Christian F Heide En turingmaskin er ikke en fysisk datamaskin, men et konsept eller en tankekonstruksjon laget for å kunne resonnere omkring
DetaljerINF2820 Datalingvistikk V2017 Forelesning 3, 30.1 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 3, 30.1 Jan Tore Lønning I dag Regulære språk og endelige tilstandsmaskiner oppsummering Reg.ex. i praksis, særlig i Python Litt Python Algoritme for DFA med Python-implementasjon
DetaljerTMA4140 Diskret Matematikk Høst 2016
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag TMA44 Diskret Matematikk Høst 26 Seksjon 3. Husk at w = λ, den tomme strengen, for enhver streng w. 4 a) Følgende utledning/derivasjon
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 SAMMENHENGER FSA OG REGULÆRE UTTRYKK 31. januar
DetaljerINF2820 V2017 Oppgavesett 6 Gruppe 7.3
INF2820 V2017 Oppgavesett 6 Gruppe 7.3 Oppgave 1: Lag en kontekstfri grammatikk som beskriver samme språk som nettverket under. S a S S c S S b A1 A1 a S A1 c S A1 b A2 A2 c S A2 a S A2 b A3 A3 a A3 A3
DetaljerSyntax/semantics - I INF 3110/ /29/2005 1
Syntax/semantics - I Program program execution Compiling/interpretation Syntax Classes of langauges Regular langauges Context-free langauges Scanning/Parsing Meta models INF 3/4-25 8/29/25 Program
Detaljer1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 Regulære språk Følgende er ekvivalente: a) L kan
DetaljerMer om mengder: Tillegg til Kapittel 1. 1 Regneregler for Booleske operasjoner
MAT1140, H-16 Mer om mengder: Tillegg til Kapittel 1 Vi trenger å vite litt mer om mengder enn det som omtales i første kapittel av læreboken. I dette tillegget skal vi først se på regneregler for Booleske
DetaljerRepetisjon. 1 binærtall. INF3110 Programmeringsspråk. Sist så vi ulike notasjoner for syntaks: Jernbanediagrammer. BNF-grammatikker.
INF3 Programmeringsspråk INF3 Programmeringsspråk Dagens tema Syntaks (Komp 47, kap 3 (og noe 4)) Repetisjon Regulære språk i klassisk NF Regulære språk i utvidet NF Regulære språk i jerbanediagrammer
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En
DetaljerINF1800 Forelesning 2
INF1800 Forelesning 2 Mengdelære Roger Antonsen - 20. august 2008 (Sist oppdatert: 2008-09-03 12:36) Mengdelære Læreboken Det meste av det vi gjør her kan leses uavhengig av boken. Følgende avsnitt i boken
DetaljerINF3110 Programmeringsspråk
INF3 Programmeringsspråk Dagens tema Syntaks (Komp 47, kap 3 (og noe 4)) Repetisjon Regulære språk i klassisk BNF Regulære språk i utvidet BNF Regulære språk i jerbanediagrammer Regulære språk og automater
DetaljerSkanning del I INF /01/15 1
Skanning del I INF 5110-2015 21/01/15 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: Programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.
DetaljerINF2220: Time 8 og 9 - Kompleksitet, beregnbarhet og kombinatorisk søk
INF0: Time 8 og 9 - Kompleksitet, beregnbarhet og kombinatorisk søk Mathias Lohne mathialo Rekursjonseksempel Eksempel Finn kjøretid for følgende program: (Ex11 b) 1 float foo(a) { n = Alength; 3 4 if
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 1
INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 15. gang, 8.5.2014 Jan Tore Lønning Språk og grammatikk Språk (formelt): En endelig mengde A Ø En undermengde L A* Grammatikk: En endelig innretning som definerer L Klasser
Detaljer3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerMengdelære INF1800 LOGIKK OG BEREGNBARHET FORELESNING 2: MENGDELÆRE. Læreboken. Mengder. Definisjon (Mengde) Roger Antonsen
INF1800 LOGIKK OG BEREGNBARHET FORELESNING 2: MENGDELÆRE Roger Antonsen Mengdelære Institutt for informatikk Universitetet i Oslo 20. august 2008 (Sist oppdatert: 2008-09-03 12:36) Læreboken Mengder Definisjon
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerINF1800 LOGIKK OG BEREGNBARHET
INF1800 LOGIKK OG BEREGNBARHET FORELESNING 2: MENGDELÆRE Roger Antonsen Institutt for informatikk Universitetet i Oslo 20. august 2008 (Sist oppdatert: 2008-09-03 12:36) Mengdelære Læreboken Det meste
DetaljerSkanning del I. Kapittel 2 INF 3110/ INF
Skanning del I Kapittel 2 18.01.2013 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF1080 Logiske metoder for informatikk Eksamensdag: 28. november 2014 Tid for eksamen: 08.15 12.15 Oppgave 1 Mengdelære (10 poeng)
DetaljerTypisk: Kan det være både nøkkelord og navn, så skal det ansees som nøkkelord
Scanning-I Kap. 2 Hovedmål Gå ut fra en beskrivelse av de enkelte leksemer (tokens), og hvordan de skal deles opp i klasser Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med
DetaljerTypisk: Kan det være både nøkkelord og navn, så skal det ansees som nøkkelord
Scanning - I Kap. 2 Hovedmål Gå ut fra en beskrivelse av de enkelte tokens, og hvordan de skal deles opp i klasser Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med all nødvendig
DetaljerAksiom 3.1 (Likhet av mengder). La A og B være mengder. Da er A og B like hvis og bare hvis de har akkurat de samme elementene.
Notat 3 for MAT1140 3 Mengder 3.1 Mengder definert ved en egenskap Det matematiske begrepet mengde har sin opprinnelse i vår intuisjon om samlinger. Objekter kan samles sammen til et nytt objekt kalt mengde.
DetaljerAvgjørbarhet / Uavgjørbarhet
Avgjørbarhet / Uavgjørbarhet For å kunne snakke om avgjørbarhet/uavgjørbarhet trenger vi Turingmaskiner og for å snakke om Turingmaskiner trenger vi formelle språk, og strenger og alfabeter. Pluss litt
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det mtemtisk-nturvitenskpelige fkultet Eksmen i INF2080 Logikk og eregninger Eksmensdg: 6. juni 2016 Tid for eksmen: 14.30 18.30 Oppgvesettet er på 5 sider. Vedlegg: Ingen Tilltte
Detaljer1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.
INF2820 Datalingvistikk V2012 Jan Tore Lønning LITT PYTHON 2 Hvorfor Pyhton Python syntaks NLTK Natural Language Tool Kit: Omgivelser for å eksperimentere med datalingvistikk Diverse datalingvistiske algoritmer
DetaljerITSLP1100 Introduksjon til kognitive vitenskaper. Erik Velldal 15/01/2008
ITSLP1100 Introduksjon til kognitive vitenskaper Erik Velldal 15/01/2008 1 Praktisk Pensum: Copeland (1993): Artificial Intelligence Flere gjesteforelesninger av andre fra LNS, basert på egne tilleggsartikler.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i Eksamensdag: 28. november 2014 Tid for eksamen: 08.15 12.15 Oppgavesettet er på 6 sider. Vedlegg: Tillatte hjelpemidler: INF1080
DetaljerINF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning
INF2820 Datalingvistikk V2015 Forelesning 4, 9.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Begrensninger ved regulære språk Regulære uttrykk: teoretiske og praktiske Noen egenskaper
Detaljer(a) R n defineres som mengden av kolonnevektorer. a 1 a 2. a n. (b) R n defineres som mengden av radvektorer
5 Vektorrom Et vektorrom er en mengde V med tre algebraiske operasjoner (addisjon, negasjon og skalærmultiplikasjon) som tilfredsstiller de 10 betingelsene fra Def. 4.1.1. Jeg vil ikke gi en eksamensoppgave
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning Idag Automater og regulære uttrykk Litt Python Implementasjon av DFA i Python Naiv NFA-algoritme Smart NFA-algoritme Pythonimplementasjon 30. januar 2015
DetaljerUNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF1080 Logiske metoder for informatikk Eksamensdag: 10. desember 2013 Tid for eksamen: 09.00 13.00 Oppgave 1 Mengdelære (10 poeng)
DetaljerUNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet. INF1080 Logiske metoder for informatikk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i Eksamensdag:. desember Tid for eksamen:.. INF Logiske metoder for informatikk Oppgave Mengdelære ( poeng) La A = {,, {}}, B =
DetaljerKapittel 5: Mengdelære
MAT1030 Diskret Matematikk Forelesning 9: Mengdelære Roger Antonsen Institutt for informatikk, Universitetet i Oslo Kapittel 5: Mengdelære 17. februar 2009 (Sist oppdatert: 2009-02-17 15:56) MAT1030 Diskret
DetaljerRepetisjonsforelesning - INF1080
Repetisjonsforelesning - INF1080 Mengder, relasjoner og funksjoner 18. november 2015 1 Grunnleggende mengdelære 1.1 Elementært om mengder 1.1.1 Hva er en mengde? Definisjon 1.1 (Mengde). En mengde er en
DetaljerINF Algoritmer: Design og effektivitet
INF 4130 Algoritmer: Design og effektivitet Velkommen Forelesere: Stein Krogdahl, steinkr at ifi.uio.no Petter Kristiansen pettkr at ifi.uio.no Lærebok: Algorithms: Sequential, Parallel, and Distributed,
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning LITT PYTHON 2 Hvorfor Pyhton NLTK Natural Language Tool Kit: Omgivelser for å eksperimentere med datalingvistikk Diverse datalingvistiske algoritmer Inkluderte
DetaljerLinux-programmer som bruker regulæruttrykk: grep, sed, awk
Linux-programmer som bruker regulæruttrykk: grep, sed, awk grep * søking i tekstlige data grep [OPTIONS] REGEX [FILE...] Verktøy som finnes i alle Unix-lignende OS Leser en eller flere tekstfiler, eller
DetaljerHjemmeeksamen 1 i INF3110/4110
Hjemmeeksamen i INF30/40 Innleveringsfrist: fredag 24. oktober kl. 500 Innlevering Hele besvarelsen skal leveres skriftlig på papir i IFI-ekspedisjonen innen fredag 24. oktober kl. 500. Merk besvarelsen
DetaljerPlenumsregning 10. Diverse ukeoppgaver. Roger Antonsen april Vi øver oss litt på løse rekurrenslikninger.
Plenumsregning 10 Diverse ukeoppgaver Roger Antonsen - 17. april 2008 Vi øver oss litt på løse rekurrenslikninger. Oppgave 7.23 Løs følgende rekurrenslikning (c) t(n) 6t(n 1) + 9t(n 2) = 0, t(1) = 3, t(2)
DetaljerScanning - I Kap. 2. Hva scanneren gjør
Scanning - I Kap. 2!! Hovedmål! Gå ut fra en beskrivelse av de enkelte tokens, og hvordan de skal deles opp i klasser! Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med all
DetaljerTo mengder S og T er like, S = T, hvis de inneholder de samme elementene. Notasjon. Mengden med elementene a, b, c og d skrives ofte {a, b, c, d}.
Forelesning 0: Mengdelære, Induksjon Martin Giese - 23. januar 2008 1 Mengdelære 1.1 Mengder Mengder Definisjon 1.1. En mengde er en endelig eller uendelig samling objekter der innbyrdes rekkefølge og
Detaljer3/5/2012. Chart alternativ datastruktur. Fundamentalregelen. Chart-parsing. Bottom-up FORMELL SPRÅKTEORI. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning CHART-PARSING FORMELL SPRÅKTEORI 5. mars 2012 2 Chart alternativ datastruktur NP Det Nom Fundamentalregelen NP Det Nom Nom Nom PP Nom Nom PP NP PP P NP Det
DetaljerINF2820 Datalingvistikk V forelesning, 30.1 Jan Tore Lønning
INF2820 Datalingvistikk V2014 3. forelesning, 30.1 Jan Tore Lønning Idag Noen ord om Python Implementasjon av DFA J&Ms algoritme Oversatt til Python Rekursiv vs. Iterativ implementasjon Naiv NFA-algoritme
DetaljerINF1820: Ordklassetagging
NF1820: Ordklassetagging NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Ordklassetagging Never gonna give you up Never gonna let
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning CHART-PARSING FORMELL SPRÅKTEORI 5. mars 2012 2 Chart alternativ datastruktur NP Det Nom Nom Nom PP NP PP P NP Det Nom, N P NP, PN 0 book 1 the 2 flight 3
DetaljerMAT1030 Diskret matematikk
MAT1030 Diskret matematikk Plenumsregning 10: Diverse ukeoppgaver Roger Antonsen Matematisk Institutt, Universitetet i Oslo 17. april 2008 Vi øver oss litt på løse rekurrenslikninger. Oppgave 7.23 Løs
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF Logiske metoder for informatikk Eksamensdag:. desember Tid for eksamen:.. Oppgavesettet er på sider. Vedlegg: Ingen Tillatte
DetaljerDagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2)
Dagens tema Syntaks (kapittel 2.1 + Komp. 47, kap. 1 og 2) 1/19 Forelesning 6 1.10.2003 Litt om kompilering og interpretering En kompilator oversetter et program til et annet språk, for eksempel maskinspråk.
DetaljerKONTINUASJONSEKSAMEN I TMA4140 LØSNINGSFORSLAG
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side av 6 KONTINUASJONSEKSAMEN I TMA440 LØSNINGSFORSLAG Oppgave Sannhetsverditabell for det logiske utsagnet ( (p q) ) ( q r
DetaljerLitt om kompilering og interpretering. Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Syntaks og semantikk
Litt om kompilering og interpretering Dagens tema Syntaks (kapittel 2. + Komp. 47, kap. og 2) En kompilator oversetter et program til et annet språk, for eksempel maskinspråk. Et program interpreteres
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
DetaljerTema. Informasjonsarkitektur Brukervennlighet/Usability Kommunikasjon som treffer målrettet kommunikasjon
Tema Informasjonsarkitektur Brukervennlighet/Usability Kommunikasjon som treffer målrettet kommunikasjon Ooops, sorry. I puked all over your web site. h"p://www.dokimos.org/ajff/ Unnskyld meg, men hva
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i Eksamensdag: 9. desember 2015 Tid for eksamen: 09.00 13.00 (Fortsettes på side 2.) INF1080 Logiske metoder for informatikk Oppgave
DetaljerLøsningsforslag til obligatorisk oppgave 3 INF1800 Logikk og beregnbarhet, høsten 2009
Løsningsforslag til obligatorisk oppgave 3 INF1800 Logikk og beregnbarhet, høsten 2009 Torgeir Lebesbye torgeirl@ifi.uio.no Universitetet i Oslo Lars-Erik Bruce larsereb@ifi.uio.no Universitetet i Oslo
DetaljerDagens plan. INF3170 Logikk. Mengder. Definisjon. Notasjon. Forelesning 0: Mengdelære, Induksjon. Martin Giese. 23. januar 2008.
INF3170 Logikk Dagens plan Forelesning 0:, Induksjon Martin Giese 1 Institutt for informatikk, Universitetet i Oslo 2 23. januar 2008 Institutt for informatikk (UiO) INF3170 Logikk 23.01.2008 2 / 47 1
DetaljerINF2820 V2017 Oppgavesett 5 Gruppe 21.2
INF2820 V2017 Oppgavesett 5 Gruppe 21.2 Denne uka er det først noen teoretiske oppgaver. Deretter er det en del praktiske arbeidsoppgaver som vil forberede deg til arbeidet med innleveringsoppgavesett
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2015 5. Gang - 16.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker
DetaljerForelesning 9. Mengdelære. Dag Normann februar Mengder. Mengder. Mengder. Mengder OVER TIL KAPITTEL 5
Forelesning 9 Mengdelære Dag Normann - 11. februar 2008 OVER TIL KAPITTEL 5 De fleste som tar MAT1030 har vært borti mengder i en eller annen form tidligere. I statistikk og sannsynlighetsteori på VGS
DetaljerOppgave 1. La G1 være grammatikken med hovedsymbol S og følgende regler:
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er indikert. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerEn repetisjon hrj høst 2009
En repetisjon hrj høst 2009 Data Maskin Data Syntaktiske objekter - endelige Mengde { } Multimengde [ ] Liste < > Symbol String = Liste av symboler Vi kan alltid finne ut om to syntaktiske objekter er
DetaljerMA3301 Beregnbarhets- og kompleksitetsteori Høsten
MA3301 Beregnbarhets- og kompleksitetsteori Høsten 2012 1 Notat 2 Om den kanoniske automaten til et språk og minimalisering. Vi vil si at en automat M = Q, Σ, q 0, A, δ er redusert enhver tilstand q Q
DetaljerINF1820: Introduksjon til spra k-og kommunikasjonsteknologi
INF1820: Introduksjon til spra k-og kommunikasjonsteknologi Tredje forelesning Lilja Øvrelid 30 januar, 2014 D ATA I Ra data: uprosesserte tall, tegn, bilder I Kvantitative vs kvalitative data D ATA I
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk
DetaljerVekeplan 4. Trinn. Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD. Norsk Matte Symjing Ute Norsk Matte M&H Norsk
Vekeplan 4. Trinn Veke 39 40 Namn: Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD Norsk Engelsk M& Mitt val Engelsk Matte Norsk Matte felles Engelsk M& Mitt val Engelsk Norsk M& Matte
DetaljerRekker (eng: series, summations)
Rekker (eng: series, summations) En rekke er summen av leddene i en følge. Gitt følgen a 0, a 1, a,, a n,, a N Da blir den tilsvarende rekken a 0 + a 1 + a + + a n + + a N Bokstaven n er en summasjonsindeks.
DetaljerEt lite oppdrag i bakgrunnen
Et lite oppdrag i bakgrunnen Under pultene på bakerste rad er det klistret post-it lapper med to tall skrevet på Regn ut summen av to nederste tall, skriv denne summen under de andre tallene, og send lappen
Detaljer