INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

Størrelse: px
Begynne med side:

Download "INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les"

Transkript

1 Arne Skjærholt egende les Arne Skjærholt egende les

2 σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer en teori for syntaks, men moderne syntaks går tilbake til Chomskys teorier fra 50-tallet. σύνταξις

3 Chomsky beskriver språket som en mengde setninger. Setninger (det vil si sekvenser av ord) er enten med i mengden eller ikke. De som er i mengden kaller vi grammatiske og de som ikke er med er ugrammatiske. Syntaksens oppgaver er så å eksplisitt beskrive denne mengden. Som vi har sett tidligere er det potensielt uendelig mange setninger i språket, så en oppramsing av alle grammatiske setninger (en såkalt ekstensjonell beskrivelse) er umulig, og vi trenger mer sofistikerte verktøy.

4 Struktur Et annet problem med en ekstensjonell beskrivelse av syntaks er at setninger har en struktur som ikke er åpenbar og går utover den lineære rekkefølgen til ordene i setningen, og syntaks kan defineres som studiet av hvordan setninger bygges opp av ord og fraser. Den syntaktiske beskrivelsen er så en mengde med regler som beskriver hvordan ord settes sammen til fraser, hvordan fraser kan kombineres med andre fraser, og til slutt hvilke fraser som kan settes sammen til en setning. Rekkefølgen reglene brukes i definerer så strukturen. Struktur

5 CC Adj og kvinner gamle menn Adj gamle CC menn og kvinner Det er dette som er syntaktisk (eller strukturell) flertydighet. En setning kan ha mange forskjellige strukturer, og de forskjellige strukturene betyr forskjellige ting. Struktur og betydning henger med andre ord sammen, på et eller annet vis. CC Adj Adj og kvinner gamle CC gamle menn menn og kvinner

6 Grammatikalitet En grammatisk setning er en setning som vi kan tildele en struktur til, som kan analyseres. Men setningen må ikke nødvendigvis være meningsfylt. Det mest berømte eksempelet på dette kommer (igjen) fra Chomsky: Colourless green ideas sleep furiously. Denne setningen er grammatisk (altså syntaktisk velformet) engelsk, men fullstendig meningsløs. Setningen Furiously green sleep ideas colourless er ikke grammatisk, og kan altså heller ikke tilordnes noen betydning. Syntaks og semantikk er med andre ord ikke det samme. Den generative grammatikken som Chomsky presenterte har som mål at den syntaktiske beskrivelsen skal være slik at den genererer alle setningene i språket og ingen andre setninger. Metoden som brukes er hypotetisk-deduktiv, og hypotesene testes mot språklig intuisjon. Grammatikalitet

7 Konstituenter En konstituent er en del av setningen som fungerer som en enhet. Hvis vi tar som eksempel Hunden spiste leksene mine kan vi se tre konstituenter: hunden, spiste leksene mine, og leksene mine. Samme del av setningen kan altså være del av flere konstituenter på en gang. På samme måte som med ordklasser har vi forskjellige kriterier vi bruker for å avgjøre hva som er en konstituent og ikke. Konstituenter

8 Stå alene Kan delen av setningen stå alene: Hva spiste hunden? leksene mine *mine Stå alene

9 Pronomen Kan delen av setningen erstattes med pronomen: Hvor er leksene dine? Hunden spiste dem Hunden spiste leksene mine, og det gjorde katten også Pronomen

10 Flyttes som enhet Kan hele delen av setningen flyttes til et annet sted i setningen? Det var leksene mine hunden spiste Leksene mine ble spist av hunden Flyttes som enhet

11 Fraser Hva er en frase? Ett enkelt ord kan utvides til en gruppe ord, der gruppen har samme funksjon som ordet, og de kan erstattes av hverandre. En frase består av et hode som bestemmer typen til hele frasen, og null eller flere adledd rundt hodet. I setningen den deilige kaka til Kari er kaka hodet, og den, deilige og til Kari adledd. Hva er en frase?

12 Fraser

13 Fraser PP PP

14 Fraser AdjP AdjP

15 Fraser VP VP

16 Trær og regler Her har vi to typer kategorier. De frasale kategoriene:, VP, AdjP; og de leksikalske kategoriene: Det,, V, Adj. Denne typen tre kalles et frasestrukturtre (phrase structure tree), og beskrives med ord relatert til trær. Treet er bygd opp av noder som er knyttet sammen av grener. Rotnoden er den øverste noden, og løvene (leaves) er noder som ikke har noen barn (barn kalles også for døtre). TODO: Dominans Det Den AdjP Adj store S hunden V spiste VP leksene Det Den AdjP Adj S hunden V spiste VP store leksene

17 Trær og regler Regler Strukturen til treet viser rekkefølgen de forskjellige syntaktiske reglene er blitt anvendt. Det er også egenskaper ved reglene som gjør at språket er uendelig. Det er rekursive regler som gjør dette. Enkelte kategorier kombinerer en X med et annet element for å lage en ny, større X. For eksempel kan en og en PP kombineres til en ny, som i setningen bilen til Per med spoiler. Dette gjør at vi kan lage vilkårlig lange fraser av typen. Vi skal se nærmere på regler og hvordan de er knyttet sammen med treet neste forelesning, når vi skal snakke om kontekstfrie grammatikker. Regler

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2 Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #7

IN1140: Introduksjon til språkteknologi. Forelesning #7 IN1140: Introduksjon til språkteknologi Forelesning #7 Lilja Øvrelid Universitetet i Oslo 11 oktober 2018 Tema for i dag 2 Forrige uke Ordklasser Ordklassetagging Oblig2a: språkmodeller (frist: 17/9) I

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2 Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse

Detaljer

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 19 mars, 2012 SYNTAKS Lingvistikk: studiet av prinsipper og regler for setningsdannelse Beskrivelse av naturlige

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 13 mars, 2014 SYNTAKS studiet av prinsipper og regler for setningsdannelse gammel disiplin Pãṇini: sanskrit grammatiker

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 13 mars, 2014 SYNTAKS studiet av prinsipper og regler for setningsdannelse gammel disiplin Pãṇini: sanskrit grammatiker

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #8

IN1140: Introduksjon til språkteknologi. Forelesning #8 IN1140: Introduksjon til språkteknologi Forelesning #8 Samia Touileb Universitetet i Oslo 17. oktober 2017 Tema for i dag 2 Fra forrige uke: HMM og FSA Evaluering Syntaks HMM og FSA 3 HMM er er en utvidelse

Detaljer

LF - Eksamen i INF1820

LF - Eksamen i INF1820 LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning BEGRENSNINGER VED REGULÆRE SPRÅK OG KONTEKSTFRIE GRAMMATIKKER 2 I dag 1. Begrensninger ved regulære språk 2. Noen egenskaper ved naturlige språk 3. Kontekstfrie

Detaljer

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER. INF2820 Datalingvistikk V2012 Jan Tore Lønning Begrensninger ved regulære Regulære er ikke ideelle modeller for naturlige, dvs Verken regulære uttrykk eller NFA er ideelle for å beskrive naturlige fordi:

Detaljer

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 1 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 11. gang, 27.3.2014 Jan Tore Lønning I dag Repetere en del begreper: Trekkstrukturer Unifikasjon og subsumpsjon Trekkbaserte grammatikker Form: to alternative format Tolkning

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 6. juni 2014 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0

Detaljer

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj

Detaljer

INF1820: Oppsummering

INF1820: Oppsummering Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk

Detaljer

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF 2820 V2016: Innleveringsoppgave 3 del 1 INF 2820 V2016: Innleveringsoppgave 3 del 1 Pga tekniske problemer er oppgaveteksten delt i to. Dette er første del. Andre del legges ut mandag 13.3! Besvarelsene skal leveres i devilry innen fredag 24.3

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 51 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning INF2820 Datalingvistikk V2015 11. Gang 13.4 Jan Tore Lønning I dag Unifikasjonsgrammatikker Repetisjon og overblikk: Formalisme Lingvistisk anvendelse Utvidelse av lingvistisk anvendelse NLTKs implementering

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #8

IN1140: Introduksjon til språkteknologi. Forelesning #8 IN1140: Introduksjon til språkteknologi Forelesning #8 Samia Touileb Universitetet i Oslo 18. oktober 2017 Forrige uke 2 Syntaks Tema for i dag 3 Midtveisevaluering IN1140, høst 2018 Kontekstfrie grammatikker

Detaljer

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF 2820 V2015: Obligatorisk innleveringsoppgave 3 INF 2820 V2015: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 17.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Del 1 RD Parsing Oppgave 1:

Detaljer

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo .. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk Sverre Stausland Johnsen Universitetet i Oslo stausland.johnsen@iln.uio.no Universitetet i Stavanger 15. januar

Detaljer

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2015 5. Gang - 16.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker

Detaljer

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket. 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

INF 2820 V2016: Innleveringsoppgave 3 hele

INF 2820 V2016: Innleveringsoppgave 3 hele INF 2820 V2016: Innleveringsoppgave 3 hele Dette er det komplette settet! Besvarelsene skal leveres i devilry innen fredag 24.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil

Detaljer

Slides til 12.1 Formelt språk og formell grammatikk

Slides til 12.1 Formelt språk og formell grammatikk Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen

Detaljer

Forelesning 2: Induktive definisjoner, utsagnslogikk og sekventkalkyle Christian Mahesh Hansen januar 2007

Forelesning 2: Induktive definisjoner, utsagnslogikk og sekventkalkyle Christian Mahesh Hansen januar 2007 Forelesning 2: Induktive definisjoner, utsagnslogikk og sekventkalkyle Christian Mahesh Hansen - 29. januar 2007 1 Induktive definisjoner Induktive definisjoner Definisjon 1.1 (Induktiv definisjon). Å

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 26 mars, 2012 1 / 48 FORMELLE MODELLER Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

Dagens plan. INF3170 Logikk. Induktive definisjoner. Eksempel. Definisjon (Induktiv definisjon) Eksempel

Dagens plan. INF3170 Logikk. Induktive definisjoner. Eksempel. Definisjon (Induktiv definisjon) Eksempel INF3170 Logikk Dagens plan Forelesning 2: Induktive definisjoner, utsagnslogikk og sekventkalkyle Christian Mahesh Hansen Institutt for informatikk, Universitetet i Oslo 1 Induktive definisjoner 2 29.

Detaljer

Leksikalsk semantikk II

Leksikalsk semantikk II Leksikalsk semantikk II Lars Nygaard leksikalsk semantikk II Leksikalske relasjoner Relasjoner mellom leksikalske enheter. Det finnes uendelig mange: «hav» HAR FARGEN «blå» «tribune» INNEHOLDER «publikum»

Detaljer

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

INF2820 V2017 Oppgavesett 5 Gruppe 21.2 INF2820 V2017 Oppgavesett 5 Gruppe 21.2 Denne uka er det først noen teoretiske oppgaver. Deretter er det en del praktiske arbeidsoppgaver som vil forberede deg til arbeidet med innleveringsoppgavesett

Detaljer

INF 2820 V2016: Obligatorisk innleveringsoppgave 3

INF 2820 V2016: Obligatorisk innleveringsoppgave 3 INF 2820 V2016: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen torsdag 21.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Oppgave 1: Shift-reduce-effektivisering

Detaljer

Norsyg en syntaksbasert dyp parser for norsk

Norsyg en syntaksbasert dyp parser for norsk en syntaksbasert dyp parser for norsk Petter Haugereid petterha@hf.ntnu.no Institutt for språk- og kommunikasjonsstudier NTNU Språkteknologi ved NTNU, seminar VI, 30. november 2006 Oversikt 1 2 Oversikt

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 12. gang, 3.4.2014 Jan Tore Lønning I dag Trekkbaserte grammatikker (unifikasjonsgrammatikker) for naturlige språk NLTKs implementering av slike Litt om lingvistiske modeller

Detaljer

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver INF2820 V2017 Oppgavesett 5 arbeidsoppgaver Dette er oppgaver du kan arbeide med på egen hånd. Du kan også arbeide med dem i gruppa 28.2 (hvis du har innleveringsoppgave 2 under kontroll) og spørre gruppelæreren

Detaljer

Grunnleggende Grafalgoritmer II

Grunnleggende Grafalgoritmer II Grunnleggende Grafalgoritmer II Lars Vidar Magnusson March 17, 2015 Kapittel 22 Dybde-først søk Topologisk sortering Relasjonen til backtracking Dybde-Først Søk Dybde-først søk i motsetning til et bredde-først

Detaljer

0. Innledning. Et grunnleggende spørsmål i semantikk er:

0. Innledning. Et grunnleggende spørsmål i semantikk er: 0. Innledning Et grunnleggende spørsmål i semantikk er: Hvordan bestemmes en setnings mening ut i fra meningen til dens deler? Hvordan bestemmes en setnings mening ut i fra meningen til ordene som inngår

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2017 5. Gang - 13.2 Jan Tore Lønning I dag Tekstnormalisering: lemmatisering og «stemming» Tagget tekst og tagging Begrensninger ved regulære språk Frasestruktur og kontekstfrie

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #2

IN1140: Introduksjon til språkteknologi. Forelesning #2 IN1140: Introduksjon til språkteknologi Forelesning #2 Samia Touileb Universitetet i Oslo 30. august 2018 Tema forrige uke 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Tema for

Detaljer

INF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning

INF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning INF2820 Datalingvistikk V2014 Forelesning 4, 6.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Regulære uttrykk: teoretiske og praktiske Begrensninger ved regulære språk Noen egenskaper

Detaljer

INF2820 V2017 Oppgavesett 6 Gruppe 7.3

INF2820 V2017 Oppgavesett 6 Gruppe 7.3 INF2820 V2017 Oppgavesett 6 Gruppe 7.3 Oppgave 1: Lag en kontekstfri grammatikk som beskriver samme språk som nettverket under. S a S S c S S b A1 A1 a S A1 c S A1 b A2 A2 c S A2 a S A2 b A3 A3 a A3 A3

Detaljer

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk : Eksempelspørsmål Spørsmål av denne typen kan forventes til eksamen, men kanskje ikke så mange. I hvert fall ville dette pluss spørsmål fra første del av pensum blitt for mye for en tretimers eksamen. Oppgave

Detaljer

Hjemmeeksamen 1 i INF3110/4110

Hjemmeeksamen 1 i INF3110/4110 Hjemmeeksamen i INF30/40 Innleveringsfrist: fredag 24. oktober kl. 500 Innlevering Hele besvarelsen skal leveres skriftlig på papir i IFI-ekspedisjonen innen fredag 24. oktober kl. 500. Merk besvarelsen

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2012 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Chill Arbeidsmengde: 37,5 /

Detaljer

Merk: kopieringen av hovedformelen i γ-reglene medfører at bevissøk i førsteordens logikk ikke nødvendigvis behøver å terminere!

Merk: kopieringen av hovedformelen i γ-reglene medfører at bevissøk i førsteordens logikk ikke nødvendigvis behøver å terminere! Forelesning 8: Førsteordens logikk kompletthet Martin Giese - 10. mars 2008 1 Repetisjon: Kalkyle og Sunnhet av LK 1.1 Sekventkalkyleregler Definisjon 1.1 (γ-regler). γ-reglene i sekventkalkylen LK er:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 14. juni 2016 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0

Detaljer

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning INF2820 Datalingvistikk V2018 10. Gang 19.3 del 1 Jan Tore Lønning I dag: to deler A. Active chart-parsing Fortsatt fra sist B. Tekstklassifisering 2 CHART-PARSING 3 I dag chart-parsing Chart-parsing:

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

MAT1030 Forelesning 25

MAT1030 Forelesning 25 MAT1030 Forelesning 25 Trær Dag Normann - 27. april 2010 (Sist oppdatert: 2010-04-27 14:16) Forelesning 25 Litt repetisjon Vi har snakket om grafer og trær. Av begreper vi så på var følgende: Eulerstier

Detaljer

INF1800 Forelesning 15

INF1800 Forelesning 15 INF1800 Forelesning 15 Utsagnslogikk Roger Antonsen - 7. oktober 2008 (Sist oppdatert: 2008-10-07 20:59) Sekventkalkyle for utsagnslogikk Introduksjonseksempel Hvordan finne ut om en gitt formel er en

Detaljer

Forelesning 25. MAT1030 Diskret Matematikk. Litt repetisjon. Litt repetisjon. Forelesning 25: Trær. Dag Normann

Forelesning 25. MAT1030 Diskret Matematikk. Litt repetisjon. Litt repetisjon. Forelesning 25: Trær. Dag Normann MAT1030 Diskret Matematikk Forelesning 25: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo Forelesning 25 27. april 2010 (Sist oppdatert: 2010-04-27 14:16) MAT1030 Diskret Matematikk 27. april

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 25: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 27. april 2010 (Sist oppdatert: 2010-04-27 14:15) Forelesning 25 MAT1030 Diskret Matematikk 27. april

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen

2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen KONTEKSTFRIE GRAMMATIKKER OG PARSING 22. februar 2011 2 Høyre- og venstreavledninger Til hvert tre svarer det mange avledninger. For kontekstfrie

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 15: UTSAGNSLOGIKK Roger Antonsen Institutt for informatikk Universitetet i Oslo 7. oktober 2008 (Sist oppdatert: 2008-10-07 20:59) Sekventkalkyle for utsagnslogikk

Detaljer

Sekventkalkyle for utsagnslogikk

Sekventkalkyle for utsagnslogikk INF1800 LOGIKK OG BEREGNBARHET FORELESNING 15: UTSAGNSLOGIKK Roger Antonsen Sekventkalkyle for utsagnslogikk Institutt for informatikk Universitetet i Oslo 7. oktober 2008 (Sist oppdatert: 2008-10-07 20:59)

Detaljer

INF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY

INF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY INF5830, H2009, Obigatorisk innlevering 2 Innleveringsfrist 4.11 1 Oppgave: Unære produksjoner i CKY For bottom-up parsere, som CKY, har vi forutsatt at grammatikken er på CNF. For de ikke-leksikalske

Detaljer

INF3170 Logikk. Forelesning 3: Utsagnslogikk, semantikk, sekventkalkyle. Roger Antonsen. Institutt for informatikk, Universitetet i Oslo

INF3170 Logikk. Forelesning 3: Utsagnslogikk, semantikk, sekventkalkyle. Roger Antonsen. Institutt for informatikk, Universitetet i Oslo INF3170 Logikk Forelesning 3: Utsagnslogikk, semantikk, sekventkalkyle Roger Antonsen Institutt for informatikk, Universitetet i Oslo 9. februar 2010 (Sist oppdatert: 2010-02-09 15:10) Utsagnslogikk INF3170

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2017 6. Gang - 20.2 Jan Tore Lønning I dag Kontekstfrie grammatikker og naturlige språk (fortsatt fra sist) Kontekstfrie grammatikker og regulære språk Grammatikker og trær i NLTK

Detaljer

INF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning

INF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning INF2820 Datalingvistikk V2015 Forelesning 4, 9.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Begrensninger ved regulære språk Regulære uttrykk: teoretiske og praktiske Noen egenskaper

Detaljer

Parsing basert på LFG: Et MlT/Xerox-system applisert på norsk

Parsing basert på LFG: Et MlT/Xerox-system applisert på norsk Helge Dyvik Institutt for fonetikk og lingvistikk Universitetet i Bergen Sydnesplass 9 5000 Bergen Knut Hofland NA VFs EDB-senter fo r humanistisk forskning Postboks 53 5014 Bergen-Universitet Parsing

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen KONTEKSTFRIE GRAMMATIKKER OG PARSING 22. februar 2011 2 I dag Avledninger og normalformer Parsing: ovenifra og ned (top-down) Parsing: nedenifra

Detaljer

Oppgave 1 (samlet 40%)

Oppgave 1 (samlet 40%) 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

Dagens Tema: Grammatikker Kap. 3 i K. C. Louden

Dagens Tema: Grammatikker Kap. 3 i K. C. Louden INF 5110, 29. januar 2015 Stein Krogdahl Dagens Tema: Grammatikker Kap. 3 i K. C. Louden Min Foil-stil: Ofte mer tekst enn man helt kan få med seg på forelesningen, for at de skal være gode til repetisjon

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #12

IN1140: Introduksjon til språkteknologi. Forelesning #12 IN1140: Introduksjon til språkteknologi Forelesning #12 Lilja Øvrelid Universitetet i Oslo 15 november 2018 Tema for i dag 2 I dag Repetisjon Digital prøveeksamen Neste uke Gjennomgang av eksamensoppgave

Detaljer

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen

Detaljer

Forelesning 3-6. februar 2006 Utsagnslogikk sekventkalkyle og sunnhet. 1 Mengdelære III. 2 Utsagnslogikk. 1.1 Multimengder. 2.

Forelesning 3-6. februar 2006 Utsagnslogikk sekventkalkyle og sunnhet. 1 Mengdelære III. 2 Utsagnslogikk. 1.1 Multimengder. 2. Forelesning 3-6. februar 2006 Utsagnslogikk sekventkalkyle og sunnhet 1 Mengdelære III 1.1 Multimengder Multimengder Mengder der antall forekomster av hvert element teller Definisjon (Multimengde). En

Detaljer

Oppgave 1. La G1 være grammatikken med hovedsymbol S og følgende regler:

Oppgave 1. La G1 være grammatikken med hovedsymbol S og følgende regler: 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er indikert. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

Kompletthet av LK. INF3170 Logikk. Overblikk. Forelesning 9: Mer sekventkalkyle og kompletthet. Roger Antonsen

Kompletthet av LK. INF3170 Logikk. Overblikk. Forelesning 9: Mer sekventkalkyle og kompletthet. Roger Antonsen INF370 Logikk Forelesning 9: Mer sekventkalkyle og kompletthet Roger Antonsen Institutt for informatikk, Universitetet i Oslo Kompletthet av LK 3. april 200 (Sist oppdatert: 200-04-3 2:04) INF370 Logikk

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 26: Trær Roger Antonsen Institutt for informatikk, Universitetet i Oslo 5. mai 2009 (Sist oppdatert: 2009-05-06 22:27) Forelesning 26 MAT1030 Diskret Matematikk 5.

Detaljer

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning INF2820 Datalingvistikk V2017 9. Gang 13.3 Jan Tore Lønning I dag chart-parsing Fortsatt fra sist: Chart-parsing: hovedideer BU chart-parsing: algoritmen NLTKs ChartParser Enkel Python-implementasjon av

Detaljer

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo. Setningsledd Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo http://www.hf.uio.no/tekstlab Hvorfor lære setningsanalyse? Økt forståelse for hvordan man bygger opp setninger i skriftlige arbeider

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen

Detaljer

INF2810: Funksjonell Programmering. Lokale variabler. Og trær.

INF2810: Funksjonell Programmering. Lokale variabler. Og trær. INF2810: Funksjonell Programmering Lokale variabler. Og trær. Erik Velldal Universitetet i Oslo 11. september 2019 Tema forrige uke 2 Lister som datastruktur quote Rekursjon på lister Høyereordens prosedyrer

Detaljer

INF2810: Funksjonell Programmering. Lokale variabler. Og trær.

INF2810: Funksjonell Programmering. Lokale variabler. Og trær. INF2810: Funksjonell Programmering Lokale variabler. Og trær. Erik Velldal Universitetet i Oslo 11. september 2019 Tema forrige uke 2 Lister som datastruktur quote Rekursjon på lister Høyereordens prosedyrer

Detaljer

Dagens Tema: Grammatikker Kap. 3 i K. C. Louden

Dagens Tema: Grammatikker Kap. 3 i K. C. Louden INF 5110, 31. januar 2014 Stein Krogdahl Dagens Tema: Grammatikker Kap. 3 i K. C. Louden Min Foil-stil: Ofte mer tekst enn man helt kan få med seg på forelesningen, for at de skal være gode til repetisjon

Detaljer

Dagens Tema: Grammatikker

Dagens Tema: Grammatikker INF 5110, 9. februar 2010 Stein Krogdahl Dagens Tema: Grammatikker Kap. 3 i K. C. Louden Min Foil-stil: Ofte mer tekst enn man helt kan få med seg på forelesningen, for at de skal være gode til repetisjon

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 14. juni 2016 Tid for eksamen: 1430-1830 Oppgåvesettet er på 5 side(r) Vedlegg: 0

Detaljer

INF4170 { Logikk. Forelesning 1: Utsagnslogikk. Arild Waaler. 20. august Institutt for informatikk, Universitetet i Oslo

INF4170 { Logikk. Forelesning 1: Utsagnslogikk. Arild Waaler. 20. august Institutt for informatikk, Universitetet i Oslo INF4170 { Logikk Forelesning 1: Utsagnslogikk Arild Waaler Institutt for informatikk, Universitetet i Oslo 20. august 2013 Dagens plan 1 Utsagnslogikk 2 Sekventkalkyle 3 Sunnhet 4 Kompletthet Institutt

Detaljer

EXFAC EURA Syntaks2 1

EXFAC EURA Syntaks2 1 EXFAC EURA Syntaks2 1 Språk Noen avvik fra og tillegg til kap. 12 (som ikke skal leses i sin helhet), bedre tilpasset ILOS-fagenes terminologi og språk Mest om form i dag og om verbet Feil i eksemplene?

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 15. gang, 8.5.2014 Jan Tore Lønning Språk og grammatikk Språk (formelt): En endelig mengde A Ø En undermengde L A* Grammatikk: En endelig innretning som definerer L Klasser

Detaljer

Dagens Tema: Grammatikker

Dagens Tema: Grammatikker INF 5110, 8. februar 2011 Stein Krogdahl Dagens Tema: Grammatikker Kap. 3 i K. C. Louden Min Foil-stil: Ofte mer tekst enn man helt kan få med seg på forelesningen, for at de skal være gode til repetisjon

Detaljer

INF 5110, 3. februar Dette foilheftet: Kapittel 3

INF 5110, 3. februar Dette foilheftet: Kapittel 3 INF 5110, 3. februar 2009 Stein Krogdahl Min Foil-stil: Ofte mer tekst enn man helt kan få med seg på forelesningen, for at de skal være gode til repetisjon De kommende ca. 4 forelesninger: Kontekstfrie

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2016 6. Gang - 24.2 Jan Tore Lønning PARSING DEL 1 2 I dag Hva er parsing? Høyre- og venstreavledninger Recursive-Descent parser (top-down) Shift-Reduce parser (bottom-up) Pythonimplementasjon:

Detaljer

Forelesning 1: Introduksjon. Utsagnslogikk og sekventkalkyle Arild Waaler januar 2008

Forelesning 1: Introduksjon. Utsagnslogikk og sekventkalkyle Arild Waaler januar 2008 Forelesning 1: Introduksjon. Utsagnslogikk og sekventkalkyle Arild Waaler - 21. januar 2008 1 Praktisk informasjon 1.1 Forelesere og tid/sted Forelesere: Martin Giese (martingi@ifi.uio.no) Arild Waaler

Detaljer

INF2820 Datalingvistikk V Gang 16.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 16.3 Jan Tore Lønning INF2820 Datalingvistikk V2015 9. Gang 16.3 Jan Tore Lønning I dag Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj

Detaljer

INF januar Forelesninger fremover:

INF januar Forelesninger fremover: Kontekstfrie grammatikker og syntaksanalyse (parsering) Kap. 3, 4 og 5 i Louden Kan også lese om dette i notat delvis brukt i INF 3/4110 Se kursets hjemmeside (foreløpig 2007): Pensum/læringskrav INF 5110

Detaljer

INF 2820 V2018: Innleveringsoppgave 2

INF 2820 V2018: Innleveringsoppgave 2 INF 2820 V2018: Innleveringsoppgave 2 Besvarelsene skal leveres i devilry innen fredag 2.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil

Detaljer

Forelesning 9: Frsteordens logikk { kompletthet Roger Antonsen mars 2006

Forelesning 9: Frsteordens logikk { kompletthet Roger Antonsen mars 2006 Forelesning 9: Frsteordens logikk { kompletthet Roger Antonsen - 27. mars 2006 1 Kompletthet av LK 1.1 Overblikk Vi skal na bevise at LK er komplett. Ikke bare er LK sunn, den kan ogsa vise alle gyldige

Detaljer

Dagens Tema: Grammatikker Kap. 3 i K. C. Louden

Dagens Tema: Grammatikker Kap. 3 i K. C. Louden INF 5110, 1. februar 2012 Stein Krogdahl Dagens Tema: Grammatikker Kap. 3 i K. C. Louden Min Foil-stil: Ofte mer tekst enn man helt kan få med seg på forelesningen, for at de skal være gode til repetisjon

Detaljer

MAT1030 Forelesning 25

MAT1030 Forelesning 25 MAT1030 Forelesning 25 Trær Roger Antonsen - 29. april 2009 (Sist oppdatert: 2009-04-29 00:28) Forelesning 25 Litt repetisjon Vi har snakket om grafer og trær. Av begreper vi så på var følgende. Eulerstier

Detaljer

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon OBS: Lov å stille spørsmål underveis Forelesninger

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2015 6. Gang - 23.2 Jan Tore Lønning PARSING DEL 1 2 I dag Høyre- og venstreavledninger Recursive-descent parser (top-down) Begynne Shift-reduce parser (bottom-up) 25. februar

Detaljer