INF1820: Oppsummering

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Begynne med side:

Download "INF1820: Oppsummering"

Transkript

1 Arne Skjærholt 8. mai Arne Skjærholt 8. mai

2 Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til praksis. Vi vil ta for oss morfologisk, syntaktisk, samt noe semantisk analyse av naturlige språk, formell språkteori og korpusbaserte metoder. Studentene vil få et første møte med noen datalingvistiske applikasjonsområder. Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til praksis. Vi vil ta for oss morfologisk, syntaktisk, samt noe semantisk analyse av naturlige språk, formell språkteori og korpusbaserte metoder. Studentene vil få et første møte med noen datalingvistiske applikasjonsområder.

3 Lingvistikk er det vitenskapelige studiet av språk. Ganske mange nivåer, men vi har fokusert på morfologi og syntaks, pluss litt syntaks. Vitenskapelig studie i den forstand at vi studerer regler, systemer og prinsipper i menneskelige språk. Morfologi er studiet av ord og byggesteinene for ord, syntaks ser på hvordan ord settes sammen til setninger, og semantikk er studiet av mening og betydning.

4 Tvetydighet Et av de helt grunnleggende problemene i språkteknologi er tvetydighet, noe som dukker opp på alle nivåene i systemet. Tvetydighet

5 Korpora Korpora er helt sentralt i stort sett alle språkteknologiske applikasjoner og bruksområder. Korpora

6 Lingvistikk Morfologi Morfologi Handler om oppbygningen til ord og dannelsen av nye ord. To grunnleggende fenomener vi studerer: bøyning og avledning. Bøyning er dannelsen av nye former av samme ord, mens avledning danner nye ord fra andre ord. Morfologi

7 Lingvistikk Morfologi Morfemer Morfemet er den minste meningsbærende lingvistiske enheten (finnes mindre enheter i fonetikken og fonologien, men de er ikke selvstendige meningsbærere). Morfemene kan deles inn i to kategorier: frie og bundne. Frie morfer er de som kan forekomme alene, mens bundne morfemer bare forekommer i komplekse ord. Morfemer

8 Substantiv Adjektiv Verb Adverb Lingvistikk Morfologi 1. Morfologiske/formelle kriterier 2. Syntaktiske/funksjonelle 3. Semantiske/betydningsmessige Vi snakker om åpne og lukkede ordklasser, og innholdsord kontra funksjonsord. Omtrent det samme, men ikke helt en-til-en. Åpne ordklasser er de ordklassene som tar opp nye medlemmer, men de som ikke gjør det er lukkede klasser. Innholdsord er ord med semantisk innhold, mens funksjonsord kun har lingvistisk funksjon. Substantiv Verb Adverb 1. Morfologiske/formelle kriterier 2. Syntaktiske/funksjonelle 3. Semantiske/betydningsmessige Adjektiv

9 Lingvistikk Syntaks Syntaks Hvordan vi setter ord sammen til fraser og fraser sammen til setninger. Vi snakker både om syntaktssk form (hvilke ordklasser og fraser brukes) og funksjon (subjekt, direkte objekt, osv.). Syntaks

10 Lingvistikk Syntaks Konstituenter En konstituent er en gruppe ord som fungerer som en syntaktisk enhet. Vi har tre typer tester vi bruker for å avgjøre om en gruppe er en konstituent. Stå alene: Kan ordene stå alene, f.eks. som svar på et spørsmål? Kan ordene flyttes som en enhet til et annet sted i setningen? Kan ordene erstattes med et pronomen? Konstituenter

11 Lingvistikk Syntaks NP NP CC NP Adj N og kvinner gamle menn NP Adj N gamle N CC N menn og kvinner Det er dette som er syntaktisk (eller strukturell flertydighet): Rekkefølgen vi anvender de syntaktiske reglene på (se også CFGer), avgjør hvordan strukturen til setningen ser ut, som igjen kan bestemme setningens betydning. NP NP CC NP Adj NP N Adj N og kvinner gamle N CC N gamle menn menn og kvinner

12 Lingvistikk Syntaks Funksjonell analyse Noen fraser har en særskilt rolle i setningen, og fyller spesifikke roller: De viktigste setningsleddene er subjekt, predikat, direkte objekt og indirekte objekt. Predikativ og forskjellige typer adverbialer kan også forekomme. Funksjonell analyse

13 Lingvistikk Semantikk Semantikk Semantikk er studiet av betydning og hvordan vi uttrykker det gjennom språk. Vi kan tildele betydning til morfemer, ord, fraser og setninger. I dette kurset har vi sett på leksikalsk semantikk og setningssemantikk. I tillegg har vi felt som pragmatikk: Hvordan påvirker konteksten betydning? Semantikk

14 Lingvistikk Semantikk Leksikalsk semantikk Leksikalsk semantikk er hvordan vi representerer betydningene til ord, og forholdene som finnes mellom forskjellige ords betydninger. Ord kan ha forskjellige semantiske trekk (female, human, etc.). Vi har forskjellige typer relasjoner mellom ord. Homonymi vs. polysemi (viktig og skille mellom de to) Synonymi Antonymi Hyponymi Leksikalsk semantikk

15 Lingvistikk Semantikk Komposisjonell semantikk Hva er sannhetsverdien til en setning? Vi bygger opp logiske uttrykk som kan evalueres for å gi sannhetsverdien, predikatene er mengder og de er sanne hvis argumentene er en del av mengden. Komposisjonell semantikk

16 Lingvistikk Semantikk Semantiske roller Et annet aspekt av setningsbetydning. Verbet krever forskjellige roller; hvilke deltagere tar de forskjellige rollene? Visse paralleler med setningsleddene her, men ikke trivielt å gå mellom de to. Se for eksempel passiver. PropBank og FrameNet er ressurser for semantiske roller (korpus og leksikon, hhv). Semantiske roller

17 Formelle modeller Literaler: /b/, /INF1820/ Disjunksjon: /penge(r ne)/, /[A-Z]/ Negasjon av tegnklasser: /[ˆ0-9A-Z]/ Kvantorer: /a?/, /a*/, /a+/ Hva-som-helst: /./ Formell språkteori. Lukket under union og snitt, komplement, mengdedifferanse. Literaler: /b/, /INF1820/ Disjunksjon: /penge(r ne)/, /[A-Z]/ Negasjon av tegnklasser: /[ˆ0-9A-Z]/ Kvantorer: /a?/, /a*/, /a+/ Hva-som-helst: /./

18 Formelle modeller hσ, S, s0, δ, Fi a q0 I b q1 Σ = {a, b,!} I S = {q0, q1, q2, q3 } I s0 = q0 I δ(q, σ ) fra transisjonstabellen I F = {q3 } a! q2 q0 q1 q2 q3 Det er en viktig dualitet mellom regulære spra k og tilstandsmaskiner: Regexen beskriver spra ket vi er interessert i, mens FSAen beskriver algoritmen vi bruker for a gjenkjenne strengene i spra ket. Maskinen er deterministisk hvis det ikke finnes en tilstand der det er to kanter ut med samme bokstav pa (ekvivalent: alle tilstandene har maks en pil ut for hver bokstav). Hvis den ikke er deterministisk er den ikke-deterministisk. NFAer kan ogsa ha epsilon-kanter, som lar maskinen bevege seg mellom to tilstander uten a spise en bokstav fra input. q3 a q2 q2 b q1! q3 hσ, S, s0, δ, Fi a q0 I b q1 Σ = {a, b,!} I S = {q0, q1, q2, q3 } I s0 = q0 I δ(q, σ ) fra transisjonstabellen I F = {q3 } a! q2 q0 q1 q2 q3 q3 a q2 q2 b q1! q3

19 Formelle modeller A og B uavhengige: P (A B) = P (A)P (B) P (A B) Betinget sannsynlighet: P (A B) = P (B) P (A B) = P (A B)P (B) = P (B A)P (A) A og B uavhengige: P (A B) = P (A)P (B) P (A B) Betinget sannsynlighet: P (A B) = P (B) P (A B) = P (A B)P (B) = P (B A)P (A)

20 Formelle modeller P (B A)P (A) P (A B) = P (B) P (A B) = P (A B)/P (B), P (B A) = P (A B)/P (A) og da følger Bayes trivielt. P (A B) = P (B A)P (A) P (B)

21 Formelle modeller n P (w1 n ) = P (w i w i 1 ) Språkmodell. Vi antar at ordene er uavhengige av resten av ordene, gitt ordet før. i=1 n P (w1 n ) = P (w i w i 1 ) i=1

22 Formelle modeller n P (t1 n wn 1 ) = P (t i t i 1 )P (w i t i ) i=1 HMM. Starter med P (t w), Bayes-invertering og stryker under brøkstreken fordi vi argmaxer. n P (t1 n wn 1 ) = P (t i t i 1 )P (w i t i ) i=1

23 Formelle modeller N,Σ,R,S N = {S,NP,N,N,DT,V P V } Σ = {et,fly,ankom} R = {S NP V P, NP DT N, N N, V P V, N fly, DT et, V ankom} S = S N,Σ,R,S CFGer. Her er det mest samspillet mellom reglene som er interessant. Rekursjon i reglene er en viktig kilde til ubegrensetheten i naturlige språk. N = {S,NP,N,N,DT,V P V } Σ = {et,fly,ankom} R = {S NP V P, NP DT N, N N, V P V, N fly, DT et, V ankom} S = S

24 Formelle modeller Samme opplegget som HMM. Starter med P (s f ), Bayes og stryk under streken fordi vi argmaxer. n P (s f1 n ) P (f i s) i=1 P (s f n 1 ) n i=1 P (f i s)

25 Formelle modeller Vektorrommodellen Vi representerer dokumenter og søkestrenger som vektorer, og finner de likeste dokumentene ved å finne de som har likest vektor. For å unngå å gi vanlige ord for høy vekt bruker vi vekting av termfrekvensene (tf), som regel med inverse document frequency (idf): idf = log N n t der n t er antall dokumenter som inneholder termen og N antall dokumenter totalt. Vektorrommodellen

26 Metoder og applikasjoner bilen: bil+subst+m+ent+best hoppet: hoppe+verb+pret hoppet: hoppe+verb+perfpart hoppet: hopp+subst+n+ent+best Komputasjonell morfologi: Hente ut og representere morfologisk informasjon for senere bruk av andre prosesseringssteg. bilen: bil+subst+m+ent+best hoppet: hoppe+verb+pret hoppet: hoppe+verb+perfpart hoppet: hopp+subst+n+ent+best

27 Metoder og applikasjoner Ordklassetagging For hvert ord i en setning: Er det substantiv, verb, preposisjon, etc... Ordklassetagging

28 Metoder og applikasjoner Chunking Markere opp ikke-rekursive blokker i en setning, som regel NP-konstituenter. Chunking

29 Metoder og applikasjoner WSD Mange ord har flere betydninger. Hvordan kan vi automatisk entydiggjøre betydningene? WSD

30 Metoder og applikasjoner Information extraction Her har vi snakket mest om Named Entity Recognition (NER), som handler om å finne deler av teksten som refererer til et navngitt objekt: Personer, land, byer, etc. Information extraction

31 Metoder og applikasjoner Information retrieval Hente de mest relevante dokumentene for en søkestreng. INF3800. Information retrieval

32 Metoder og applikasjoner Moderne statistisk maskinoversettelse er basert på to hovedkomponenter. En oversettelsesmodell som lager en halvdårlig ord-for-ord-oversettelse og en språkmodell som passer på at en oversettelse som ser ut som en god setning i målspråket blir foretrukket.

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer

Detaljer

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UIVERSITETET I OSLO et matematisk-naturvitskapelige fakultet Eksam i: IF1820 Introduksjon til språk- og kommunikasjonsteknologi Eksamsdag: 17. juni 2016 Tid for eksam: 14.30 18.30 Oppgavesettet er på 6

Detaljer

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags

Detaljer

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer

Detaljer

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon Previously... Alle rare ordene Alle rare morfene Previously... Coming up... Morfologi med datamaskin (computational morphology) Hvordan analysere

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller

Detaljer

INF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione

INF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione Arne Skjærholt Terza lezione Arne Skjærholt Terza lezione Regulære uttrykk Regex Regulære uttrykk (regular expressions) er et godt eksempel på det som kalles finite-state methods (hvorfor det heter det

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager

Detaljer

Ordklasser Inndelingen ORDKLASSEINNDELINGEN

Ordklasser Inndelingen ORDKLASSEINNDELINGEN Ordklasser Inndelingen ORDKLASSEINNDELINGEN Hvorfor lære om ordklasser? Viktig del av den grammatiske språkbeskrivelsen Forstå bøyningsmåter skrive korrekt Innsikt i hvordan norsk skiller seg fra andre

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager

Detaljer

INF1820: Applikasjoner

INF1820: Applikasjoner Arne Skjærholt 24. april Arne Skjærholt 24. april Information extraction Information extraction Grovt sett: Hente ut en eller annen type informasjon fra en tekst. Chunking er et eksempel på dette, men

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 1 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF1820 INF1820 2013-02-22. Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt

INF1820 INF1820 2013-02-22. Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt dairoku: del 6, kougi: forelesning Arne Skjærholt 第 六 講 義 Arne Skjærholt 第 六 講 義 Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 51 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 26 mars, 2012 1 / 48 FORMELLE MODELLER Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2012 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Chill Arbeidsmengde: 37,5 /

Detaljer

INF1820: Ordklassetagging

INF1820: Ordklassetagging NF1820: Ordklassetagging NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Ordklassetagging Never gonna give you up Never gonna let

Detaljer

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo .. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk Sverre Stausland Johnsen Universitetet i Oslo stausland.johnsen@iln.uio.no Universitetet i Stavanger 15. januar

Detaljer

Slides til 12.1 Formelt språk og formell grammatikk

Slides til 12.1 Formelt språk og formell grammatikk Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen

Detaljer

INF 2820 V2016: Obligatorisk innleverinsoppgave 1

INF 2820 V2016: Obligatorisk innleverinsoppgave 1 INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa

Detaljer

Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2)

Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Dagens tema Syntaks (kapittel 2.1 + Komp. 47, kap. 1 og 2) 1/19 Forelesning 6 1.10.2003 Litt om kompilering og interpretering En kompilator oversetter et program til et annet språk, for eksempel maskinspråk.

Detaljer

Litt om kompilering og interpretering. Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Syntaks og semantikk

Litt om kompilering og interpretering. Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Syntaks og semantikk Litt om kompilering og interpretering Dagens tema Syntaks (kapittel 2. + Komp. 47, kap. og 2) En kompilator oversetter et program til et annet språk, for eksempel maskinspråk. Et program interpreteres

Detaljer

INF1820 INF1820 2013-02-14. Arne Skjærholt INF1820. Arne Skjærholt

INF1820 INF1820 2013-02-14. Arne Skjærholt INF1820. Arne Skjærholt Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon µορφή - form λόγος - lære Morfologi er det laveste meningsbærende nivået i språk. Fonologi og fonetikk er lavere nivåer, men de er ikke meningsbærende

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 17 januar, 2011 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Modula OJD Tidspunkt: Mandag

Detaljer

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt NF1820 NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ Her kan jeg godt si litt om meg selv NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ NF1820 Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists

Detaljer

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1 Morfologi Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting EXFAC EURA 2. Morfologi1 1 Setninger består av ord (grupper av ord) Ord har struktur: les-te, en god les-er -te: bøyning

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 13. gang, 10.4.2014 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2016 13. gang, 20.4.2016 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

Kristian Emil Kristoffersen, Hanne Gram Simonsen og Andreas Sveen (red.) Språk. En grunnbok. Universitetsforlaget

Kristian Emil Kristoffersen, Hanne Gram Simonsen og Andreas Sveen (red.) Språk. En grunnbok. Universitetsforlaget Kristian Emil Kristoffersen, Hanne Gram Simonsen og Andreas Sveen (red.) Språk En grunnbok Universitetsforlaget Innhold Forord 13 1 Hva er språk? 17 Av Kristian Emil Kristoffersen 1.1 Innledning 17 1.2

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 13 april, 2015 LINGVISTISKE NIVÅER SEMANTIKK studiet av betydning slik det uttrykkes gjennom språk betydning til morfemer, ord,

Detaljer

Ivar Utne, ; RETTA ; forslag om oppg. II (tekstslingvistikk) FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F

Ivar Utne, ; RETTA ; forslag om oppg. II (tekstslingvistikk) FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F Ivar Utne, 30.11.2015; RETTA 1.12.15; forslag om oppg. II (tekstslingvistikk) 8.12.15 FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F 30.11.2015 Nedafor er det forslag til svar for oppgave III om synstaktisk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 24 april, 2017 1 Semantisk språkteknologi Lingvistiske nivåer 2 Semantikk studiet av betydning slik det uttrykkes

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 24 april, 2017 1 Semantisk språkteknologi Lingvistiske nivåer 2 Semantikk studiet av betydning slik det uttrykkes

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjortende forelesning Lilja Øvrelid 7 mai, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 8 mai, 2017 1 Språkteknologiske applikasjoner Mange språkteknologiske applikasjoner kombinerer teknikker vi har

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 8 mai, 2017 1 Språkteknologiske applikasjoner Mange språkteknologiske applikasjoner kombinerer teknikker vi har

Detaljer

MAT1030 Diskret matematikk

MAT1030 Diskret matematikk MAT1030 Diskret matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 30. april 2008 Oppsummering Mandag så vi på hvordan vi kan finne uttrykk og termer på infiks form,

Detaljer

EXFAC EURA Syntaks2 1

EXFAC EURA Syntaks2 1 EXFAC EURA Syntaks2 1 Språk Noen avvik fra og tillegg til kap. 12 (som ikke skal leses i sin helhet), bedre tilpasset ILOS-fagenes terminologi og språk Mest om form i dag og om verbet Feil i eksemplene?

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk

Detaljer

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1 NORSK ANDRESPRÅKSKORPUS KURSHEFTE ASK, kurshefte Hilde Johansen (2011) 1 KURSHEFTETS INNHOLD 1. Antall ord i ulike delkorpus (testnivå og morsmål) 2. Persondata 3. Feilkoder 4. Oslo-Bergen-taggerens taggsett

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #8

IN1140: Introduksjon til språkteknologi. Forelesning #8 IN1140: Introduksjon til språkteknologi Forelesning #8 Samia Touileb Universitetet i Oslo 17. oktober 2017 Tema for i dag 2 Fra forrige uke: HMM og FSA Evaluering Syntaks HMM og FSA 3 HMM er er en utvidelse

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 4. mai 2010 (Sist oppdatert: 2010-05-04 14:11) Forelesning 27 MAT1030 Diskret Matematikk 4. mai 2010

Detaljer

Samspillet mellom leksikon og syntaks

Samspillet mellom leksikon og syntaks Samspillet mellom leksikon og syntaks Victoria Rosén Universitetet i Bergen og Uni Research 12. konferanse om leksikografi i Norden Oslo, 16. august 2013 Bakgrunn som syntaktiker Introduksjon Arbeidet

Detaljer

Forelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28)

Forelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28) MAT1030 Diskret Matematikk Forelesning 27: Trær Roger Antonsen Institutt for informatikk, Universitetet i Oslo Forelesning 27 6. mai 2009 (Sist oppdatert: 2009-05-06 22:28) MAT1030 Diskret Matematikk 6.

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 27 april, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker vi har sett på

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2016 14. gang, 27.4.2016 Jan Tore Lønning I dag Formell setningssemantikk: Systematisk oversettelse fra naturlig språk til logisk språk Utvidelser av det logiske språket To trinn

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning Lilja Øvrelid 23 april, 2012 SEMANTIKK Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,

Detaljer

INF1800 Forelesning 6

INF1800 Forelesning 6 INF1800 Forelesning 6 Utsagnslogikk Roger Antonsen - 3. september 2008 (Sist oppdatert: 2008-09-03 12:49) Mer om bruk av utsagnslogikk Hvordan fange inn utsagn? Jeg spiser det hvis det er godt. Jeg spiser

Detaljer

INNHOLD. Innledning 12. Kapittel 1: Kommunikasjon 14. Kapittel 2: Sjanger 20. Kapittel 3: Med språket som verktøy 26

INNHOLD. Innledning 12. Kapittel 1: Kommunikasjon 14. Kapittel 2: Sjanger 20. Kapittel 3: Med språket som verktøy 26 INNHOLD Innledning 12 Kapittel 1: Kommunikasjon 14 Hva er kommunikasjon? 15 Kommunikativ kompetanse 15 Kommunikasjon har alltid et formål 16 Retorikk: læren om målrettet kommunikasjon 17 Konvensjoner 17

Detaljer

Skanning del I INF /01/15 1

Skanning del I INF /01/15 1 Skanning del I INF 5110-2015 21/01/15 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: Programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.

Detaljer

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF1080 Logiske metoder for informatikk Eksamensdag: 10. desember 2013 Tid for eksamen: 09.00 13.00 Oppgave 1 Mengdelære (10 poeng)

Detaljer

Grammatikk En innføring av Anne Lene Berge

Grammatikk En innføring av Anne Lene Berge Grammatikk En innføring av Anne Lene Berge Det er vanlig å dele et språksystem inn i fire hoveddeler: fonologien, som beskriver lydsystemet, morfologien, som gjør greie for hvordan ord er bygd opp og hvordan

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2 Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2 Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse

Detaljer

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo. Setningsledd Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo http://www.hf.uio.no/tekstlab Hvorfor lære setningsanalyse? Økt forståelse for hvordan man bygger opp setninger i skriftlige arbeider

Detaljer

FAGPLAN I NORSK FOR 7. TRINN HØSTEN 2016

FAGPLAN I NORSK FOR 7. TRINN HØSTEN 2016 FAGPLAN I NORSK FOR 7. TRINN HØSTEN 06 a Kap Side a 5 6 Vite hvordan språket ble til 8 9 Rettskriving Og/å Lydlike ord 0 5 Rettskriving og 8 9 0 46 59 5 4 + 6 60 7 4 Vite hva språk er og hvordan det har

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Semantikk II Gordana Ilić Holen (basert på Lilja Øvrelids slides) 26 april 2012 SEMANTIKK Forrige gang: Introduksjon Ordsemantikk (Leksikal semantikk)

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 13 april, 2015 LINGVISTISKE NIVÅER SEMANTIKK studiet av betydning slik det uttrykkes gjennom språk betydning til morfemer, ord,

Detaljer

INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 2 Naturlige språk som

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 27 mars, 2017 1 Semantikk Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 6: UTSAGNSLOGIKK Roger Antonsen Institutt for informatikk Universitetet i Oslo 3. september 2008 (Sist oppdatert: 2008-09-03 12:49) Mer om bruk av utsagnslogikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 27 mars, 2017 1 Semantikk Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,

Detaljer

Setningsledd. Norsk som fremmedspråk Side 131

Setningsledd. Norsk som fremmedspråk Side 131 Setningsledd Norsk som fremmedspråk Side 131 VERBAL er det viktigste leddet i en setning Det forteller om handlingen, og det sier noe om tiden når den skjer Verbalet kan være et enkelt ord, eller det kan

Detaljer

Parsing basert på LFG: Et MlT/Xerox-system applisert på norsk

Parsing basert på LFG: Et MlT/Xerox-system applisert på norsk Helge Dyvik Institutt for fonetikk og lingvistikk Universitetet i Bergen Sydnesplass 9 5000 Bergen Knut Hofland NA VFs EDB-senter fo r humanistisk forskning Postboks 53 5014 Bergen-Universitet Parsing

Detaljer

FOL: syntaks og representasjon. 15. og 16. forelesning

FOL: syntaks og representasjon. 15. og 16. forelesning FOL: syntaks og representasjon 15. og 16. forelesning Førsteordens logikk Førsteordens logikk: et formelt system som man bruker til å representere og studere argumenter. Som utsagnslogikk, men mer uttrykkskraftig,

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femte forelesning Arne Skjærholt 25 januar, 2012 MORFOLOGI µορφή (morph ē) - form λόγος (lógos) - lære MORFOLOGI µορφή (morph ē) - form λόγος

Detaljer

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper. INF2820 Datalingvistikk V2012 Jan Tore Lønning LITT PYTHON 2 Hvorfor Pyhton Python syntaks NLTK Natural Language Tool Kit: Omgivelser for å eksperimentere med datalingvistikk Diverse datalingvistiske algoritmer

Detaljer

Informasjonsgjenfinning

Informasjonsgjenfinning INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 18. september Outline 1 Hva er IR? Tradisjonell evaluering Invertert indeks 2 Rangering Evaluering av rangering 3 Grunnleggende egenskaper Vektorer

Detaljer

Sammendrag INF5820 H2008. Jan Tore Lønning. 1. oktober. Institutt for Informatikk Universitetet i Oslo

Sammendrag INF5820 H2008. Jan Tore Lønning. 1. oktober. Institutt for Informatikk Universitetet i Oslo INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 1. oktober Outline 1 2 3 4 5 Outline 1 2 3 4 5 Hva? En forkortet versjon Få med det viktigste Tilpasset: Brukere Formål Varianter Ulike formål

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 06 februar, 2012 OVERSIKT Finite-state -teknologi er kjapp og effektiv nyttig for et antall språkteknologiske

Detaljer

Forelesning 33. Repetisjon. Dag Normann mai Innledning. Kapittel 11

Forelesning 33. Repetisjon. Dag Normann mai Innledning. Kapittel 11 Forelesning 33 Repetisjon Dag Normann - 26. mai 2008 Innledning Onsdag 21/5 gjorde vi oss ferdige med det meste av den systematiske repetisjonen av MAT1030. Det som gjensto var kapitlene 11 om trær og

Detaljer

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon OBS: Lov å stille spørsmål underveis Forelesninger

Detaljer

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda Arne Skjærholt Lectio secunda Arne Skjærholt Lectio secunda Python/NLTK En del grunner til at vi foretrekker Python over Java For det første er NLTK i Python, ikke Java Det er en ganske viktig grunn =)

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 16 april, 2012 SEMANTIKK Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord, fraser

Detaljer

Skanning del I. Kapittel 2 INF 3110/ INF

Skanning del I. Kapittel 2 INF 3110/ INF Skanning del I Kapittel 2 18.01.2013 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 13 mars, 2014 SYNTAKS studiet av prinsipper og regler for setningsdannelse gammel disiplin Pãṇini: sanskrit grammatiker

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv

Detaljer

MAT1030 Diskret matematikk

MAT1030 Diskret matematikk MAT1030 Diskret matematikk Forelesning 33: Repetisjon Dag Normann Matematisk Institutt, Universitetet i Oslo 26. mai 2008 Innledning Onsdag 21/5 gjorde vi oss ferdige med det meste av den systematiske

Detaljer

Innledning. MAT1030 Diskret matematikk. Kapittel 11. Kapittel 11. Forelesning 33: Repetisjon

Innledning. MAT1030 Diskret matematikk. Kapittel 11. Kapittel 11. Forelesning 33: Repetisjon Innledning MAT1030 Diskret matematikk Forelesning 33: Repetisjon Dag Normann Matematisk Institutt, Universitetet i Oslo 26. mai 2008 Onsdag 21/5 gjorde vi oss ferdige med det meste av den systematiske

Detaljer

Ifis forslag til reviderte studieprogrammer

Ifis forslag til reviderte studieprogrammer Ifis forslag til reviderte studieprogrammer Andre utkast 10. desember 2015 Innledning Dette er andre versjon («β-versjonen») av Ifis forslag til våre nye bachelorprogrammer. Det skal behandles i UU 17.

Detaljer

Semantikk, pragmatikk og kontekst

Semantikk, pragmatikk og kontekst Tesaurus-mapping prosjektmøte 10. nov2014 Are Gulbrandsen Semantikk, pragmatikk og kontekst - Bruk av vektorromsmodellen for å ta hensyn til kontekst ved mapping Vi mapper begreper, ikke termer Noen vanlige

Detaljer

Uke 7: Små barn, små setninger I

Uke 7: Små barn, små setninger I LIN-1013: Språktilenelse, Våren 2003 Uke 7: Små barn, små setniner I 1. Litt om syntaks Sett slike trær før? IP qp NP I'! John I VP has Spec V' V DP! eaten an apple CP qp DP C'! et eple i C IP har k NP

Detaljer