INF1820: Oppsummering
|
|
- Lars-Erik Austad
- 7 år siden
- Visninger:
Transkript
1 Arne Skjærholt 8. mai Arne Skjærholt 8. mai
2 Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til praksis. Vi vil ta for oss morfologisk, syntaktisk, samt noe semantisk analyse av naturlige språk, formell språkteori og korpusbaserte metoder. Studentene vil få et første møte med noen datalingvistiske applikasjonsområder. Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til praksis. Vi vil ta for oss morfologisk, syntaktisk, samt noe semantisk analyse av naturlige språk, formell språkteori og korpusbaserte metoder. Studentene vil få et første møte med noen datalingvistiske applikasjonsområder.
3 Lingvistikk er det vitenskapelige studiet av språk. Ganske mange nivåer, men vi har fokusert på morfologi og syntaks, pluss litt syntaks. Vitenskapelig studie i den forstand at vi studerer regler, systemer og prinsipper i menneskelige språk. Morfologi er studiet av ord og byggesteinene for ord, syntaks ser på hvordan ord settes sammen til setninger, og semantikk er studiet av mening og betydning.
4 Tvetydighet Et av de helt grunnleggende problemene i språkteknologi er tvetydighet, noe som dukker opp på alle nivåene i systemet. Tvetydighet
5 Korpora Korpora er helt sentralt i stort sett alle språkteknologiske applikasjoner og bruksområder. Korpora
6 Lingvistikk Morfologi Morfologi Handler om oppbygningen til ord og dannelsen av nye ord. To grunnleggende fenomener vi studerer: bøyning og avledning. Bøyning er dannelsen av nye former av samme ord, mens avledning danner nye ord fra andre ord. Morfologi
7 Lingvistikk Morfologi Morfemer Morfemet er den minste meningsbærende lingvistiske enheten (finnes mindre enheter i fonetikken og fonologien, men de er ikke selvstendige meningsbærere). Morfemene kan deles inn i to kategorier: frie og bundne. Frie morfer er de som kan forekomme alene, mens bundne morfemer bare forekommer i komplekse ord. Morfemer
8 Substantiv Adjektiv Verb Adverb Lingvistikk Morfologi 1. Morfologiske/formelle kriterier 2. Syntaktiske/funksjonelle 3. Semantiske/betydningsmessige Vi snakker om åpne og lukkede ordklasser, og innholdsord kontra funksjonsord. Omtrent det samme, men ikke helt en-til-en. Åpne ordklasser er de ordklassene som tar opp nye medlemmer, men de som ikke gjør det er lukkede klasser. Innholdsord er ord med semantisk innhold, mens funksjonsord kun har lingvistisk funksjon. Substantiv Verb Adverb 1. Morfologiske/formelle kriterier 2. Syntaktiske/funksjonelle 3. Semantiske/betydningsmessige Adjektiv
9 Lingvistikk Syntaks Syntaks Hvordan vi setter ord sammen til fraser og fraser sammen til setninger. Vi snakker både om syntaktssk form (hvilke ordklasser og fraser brukes) og funksjon (subjekt, direkte objekt, osv.). Syntaks
10 Lingvistikk Syntaks Konstituenter En konstituent er en gruppe ord som fungerer som en syntaktisk enhet. Vi har tre typer tester vi bruker for å avgjøre om en gruppe er en konstituent. Stå alene: Kan ordene stå alene, f.eks. som svar på et spørsmål? Kan ordene flyttes som en enhet til et annet sted i setningen? Kan ordene erstattes med et pronomen? Konstituenter
11 Lingvistikk Syntaks NP NP CC NP Adj N og kvinner gamle menn NP Adj N gamle N CC N menn og kvinner Det er dette som er syntaktisk (eller strukturell flertydighet): Rekkefølgen vi anvender de syntaktiske reglene på (se også CFGer), avgjør hvordan strukturen til setningen ser ut, som igjen kan bestemme setningens betydning. NP NP CC NP Adj NP N Adj N og kvinner gamle N CC N gamle menn menn og kvinner
12 Lingvistikk Syntaks Funksjonell analyse Noen fraser har en særskilt rolle i setningen, og fyller spesifikke roller: De viktigste setningsleddene er subjekt, predikat, direkte objekt og indirekte objekt. Predikativ og forskjellige typer adverbialer kan også forekomme. Funksjonell analyse
13 Lingvistikk Semantikk Semantikk Semantikk er studiet av betydning og hvordan vi uttrykker det gjennom språk. Vi kan tildele betydning til morfemer, ord, fraser og setninger. I dette kurset har vi sett på leksikalsk semantikk og setningssemantikk. I tillegg har vi felt som pragmatikk: Hvordan påvirker konteksten betydning? Semantikk
14 Lingvistikk Semantikk Leksikalsk semantikk Leksikalsk semantikk er hvordan vi representerer betydningene til ord, og forholdene som finnes mellom forskjellige ords betydninger. Ord kan ha forskjellige semantiske trekk (female, human, etc.). Vi har forskjellige typer relasjoner mellom ord. Homonymi vs. polysemi (viktig og skille mellom de to) Synonymi Antonymi Hyponymi Leksikalsk semantikk
15 Lingvistikk Semantikk Komposisjonell semantikk Hva er sannhetsverdien til en setning? Vi bygger opp logiske uttrykk som kan evalueres for å gi sannhetsverdien, predikatene er mengder og de er sanne hvis argumentene er en del av mengden. Komposisjonell semantikk
16 Lingvistikk Semantikk Semantiske roller Et annet aspekt av setningsbetydning. Verbet krever forskjellige roller; hvilke deltagere tar de forskjellige rollene? Visse paralleler med setningsleddene her, men ikke trivielt å gå mellom de to. Se for eksempel passiver. PropBank og FrameNet er ressurser for semantiske roller (korpus og leksikon, hhv). Semantiske roller
17 Formelle modeller Literaler: /b/, /INF1820/ Disjunksjon: /penge(r ne)/, /[A-Z]/ Negasjon av tegnklasser: /[ˆ0-9A-Z]/ Kvantorer: /a?/, /a*/, /a+/ Hva-som-helst: /./ Formell språkteori. Lukket under union og snitt, komplement, mengdedifferanse. Literaler: /b/, /INF1820/ Disjunksjon: /penge(r ne)/, /[A-Z]/ Negasjon av tegnklasser: /[ˆ0-9A-Z]/ Kvantorer: /a?/, /a*/, /a+/ Hva-som-helst: /./
18 Formelle modeller hσ, S, s0, δ, Fi a q0 I b q1 Σ = {a, b,!} I S = {q0, q1, q2, q3 } I s0 = q0 I δ(q, σ ) fra transisjonstabellen I F = {q3 } a! q2 q0 q1 q2 q3 Det er en viktig dualitet mellom regulære spra k og tilstandsmaskiner: Regexen beskriver spra ket vi er interessert i, mens FSAen beskriver algoritmen vi bruker for a gjenkjenne strengene i spra ket. Maskinen er deterministisk hvis det ikke finnes en tilstand der det er to kanter ut med samme bokstav pa (ekvivalent: alle tilstandene har maks en pil ut for hver bokstav). Hvis den ikke er deterministisk er den ikke-deterministisk. NFAer kan ogsa ha epsilon-kanter, som lar maskinen bevege seg mellom to tilstander uten a spise en bokstav fra input. q3 a q2 q2 b q1! q3 hσ, S, s0, δ, Fi a q0 I b q1 Σ = {a, b,!} I S = {q0, q1, q2, q3 } I s0 = q0 I δ(q, σ ) fra transisjonstabellen I F = {q3 } a! q2 q0 q1 q2 q3 q3 a q2 q2 b q1! q3
19 Formelle modeller A og B uavhengige: P (A B) = P (A)P (B) P (A B) Betinget sannsynlighet: P (A B) = P (B) P (A B) = P (A B)P (B) = P (B A)P (A) A og B uavhengige: P (A B) = P (A)P (B) P (A B) Betinget sannsynlighet: P (A B) = P (B) P (A B) = P (A B)P (B) = P (B A)P (A)
20 Formelle modeller P (B A)P (A) P (A B) = P (B) P (A B) = P (A B)/P (B), P (B A) = P (A B)/P (A) og da følger Bayes trivielt. P (A B) = P (B A)P (A) P (B)
21 Formelle modeller n P (w1 n ) = P (w i w i 1 ) Språkmodell. Vi antar at ordene er uavhengige av resten av ordene, gitt ordet før. i=1 n P (w1 n ) = P (w i w i 1 ) i=1
22 Formelle modeller n P (t1 n wn 1 ) = P (t i t i 1 )P (w i t i ) i=1 HMM. Starter med P (t w), Bayes-invertering og stryker under brøkstreken fordi vi argmaxer. n P (t1 n wn 1 ) = P (t i t i 1 )P (w i t i ) i=1
23 Formelle modeller N,Σ,R,S N = {S,NP,N,N,DT,V P V } Σ = {et,fly,ankom} R = {S NP V P, NP DT N, N N, V P V, N fly, DT et, V ankom} S = S N,Σ,R,S CFGer. Her er det mest samspillet mellom reglene som er interessant. Rekursjon i reglene er en viktig kilde til ubegrensetheten i naturlige språk. N = {S,NP,N,N,DT,V P V } Σ = {et,fly,ankom} R = {S NP V P, NP DT N, N N, V P V, N fly, DT et, V ankom} S = S
24 Formelle modeller Samme opplegget som HMM. Starter med P (s f ), Bayes og stryk under streken fordi vi argmaxer. n P (s f1 n ) P (f i s) i=1 P (s f n 1 ) n i=1 P (f i s)
25 Formelle modeller Vektorrommodellen Vi representerer dokumenter og søkestrenger som vektorer, og finner de likeste dokumentene ved å finne de som har likest vektor. For å unngå å gi vanlige ord for høy vekt bruker vi vekting av termfrekvensene (tf), som regel med inverse document frequency (idf): idf = log N n t der n t er antall dokumenter som inneholder termen og N antall dokumenter totalt. Vektorrommodellen
26 Metoder og applikasjoner bilen: bil+subst+m+ent+best hoppet: hoppe+verb+pret hoppet: hoppe+verb+perfpart hoppet: hopp+subst+n+ent+best Komputasjonell morfologi: Hente ut og representere morfologisk informasjon for senere bruk av andre prosesseringssteg. bilen: bil+subst+m+ent+best hoppet: hoppe+verb+pret hoppet: hoppe+verb+perfpart hoppet: hopp+subst+n+ent+best
27 Metoder og applikasjoner Ordklassetagging For hvert ord i en setning: Er det substantiv, verb, preposisjon, etc... Ordklassetagging
28 Metoder og applikasjoner Chunking Markere opp ikke-rekursive blokker i en setning, som regel NP-konstituenter. Chunking
29 Metoder og applikasjoner WSD Mange ord har flere betydninger. Hvordan kan vi automatisk entydiggjøre betydningene? WSD
30 Metoder og applikasjoner Information extraction Her har vi snakket mest om Named Entity Recognition (NER), som handler om å finne deler av teksten som refererer til et navngitt objekt: Personer, land, byer, etc. Information extraction
31 Metoder og applikasjoner Information retrieval Hente de mest relevante dokumentene for en søkestreng. INF3800. Information retrieval
32 Metoder og applikasjoner Moderne statistisk maskinoversettelse er basert på to hovedkomponenter. En oversettelsesmodell som lager en halvdårlig ord-for-ord-oversettelse og en språkmodell som passer på at en oversettelse som ser ut som en god setning i målspråket blir foretrukket.
INF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer
DetaljerLF - Eksamen i INF1820
LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #12
IN1140: Introduksjon til språkteknologi Forelesning #12 Lilja Øvrelid Universitetet i Oslo 15 november 2018 Tema for i dag 2 I dag Repetisjon Digital prøveeksamen Neste uke Gjennomgang av eksamensoppgave
DetaljerINF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция
Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk
DetaljerINF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar
Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags
DetaljerUNIVERSITETET I OSLO
UIVERSITETET I OSLO et matematisk-naturvitskapelige fakultet Eksam i: IF1820 Introduksjon til språk- og kommunikasjonsteknologi Eksamsdag: 17. juni 2016 Tid for eksam: 14.30 18.30 Oppgavesettet er på 6
DetaljerINF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les
Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer
DetaljerINF1820 INF Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon Previously... Alle rare ordene Alle rare morfene Previously... Coming up... Morfologi med datamaskin (computational morphology) Hvordan analysere
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #13
IN1140: Introduksjon til språkteknologi Forelesning #13 Samia Touileb Universitetet i Oslo 22. november 2018 Vinnerne av obligkonkurransen 2 De har scoret flest oblig-poeng igjennom semesteret (av maksimalt
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller
DetaljerINF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione
Arne Skjærholt Terza lezione Arne Skjærholt Terza lezione Regulære uttrykk Regex Regulære uttrykk (regular expressions) er et godt eksempel på det som kalles finite-state methods (hvorfor det heter det
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #2
IN1140: Introduksjon til språkteknologi Forelesning #2 Samia Touileb Universitetet i Oslo 30. august 2018 Tema forrige uke 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Tema for
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager
DetaljerOrdklasser Inndelingen ORDKLASSEINNDELINGEN
Ordklasser Inndelingen ORDKLASSEINNDELINGEN Hvorfor lære om ordklasser? Viktig del av den grammatiske språkbeskrivelsen Forstå bøyningsmåter skrive korrekt Innsikt i hvordan norsk skiller seg fra andre
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16
DetaljerINF1820 INF1820 2013-02-22. Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt
dairoku: del 6, kougi: forelesning Arne Skjærholt 第 六 講 義 Arne Skjærholt 第 六 講 義 Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 26 mars, 2012 1 / 48 FORMELLE MODELLER Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 1 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle
DetaljerINF1820: Applikasjoner
Arne Skjærholt 24. april Arne Skjærholt 24. april Information extraction Information extraction Grovt sett: Hente ut en eller annen type informasjon fra en tekst. Chunking er et eksempel på dette, men
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 51 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle
DetaljerINF1820: Ordklassetagging
NF1820: Ordklassetagging NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Ordklassetagging Never gonna give you up Never gonna let
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerSlides til 12.1 Formelt språk og formell grammatikk
Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2012 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Chill Arbeidsmengde: 37,5 /
Detaljer. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo
.. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk Sverre Stausland Johnsen Universitetet i Oslo stausland.johnsen@iln.uio.no Universitetet i Stavanger 15. januar
DetaljerInnhold. 1 Innledning Semantikk Talespråk og skriftspråk 47. Forkortelser Språket som kodesystem 17 1.
7 Innhold Forkortelser 15 1 Innledning 17 1.1 Språket som kodesystem 17 1.2 Grammatikk 18 1.2.1 Semantikk 19 1.2.2 Fonologi og ortografi 19 1.2.3 Morfologi 20 1.2.4 Syntaks 20 1.3 Kart og terreng 21 1.4
DetaljerINF1820 INF1820 2013-02-14. Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon µορφή - form λόγος - lære Morfologi er det laveste meningsbærende nivået i språk. Fonologi og fonetikk er lavere nivåer, men de er ikke meningsbærende
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 1
INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa
DetaljerDagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2)
Dagens tema Syntaks (kapittel 2.1 + Komp. 47, kap. 1 og 2) 1/19 Forelesning 6 1.10.2003 Litt om kompilering og interpretering En kompilator oversetter et program til et annet språk, for eksempel maskinspråk.
DetaljerLitt om kompilering og interpretering. Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Syntaks og semantikk
Litt om kompilering og interpretering Dagens tema Syntaks (kapittel 2. + Komp. 47, kap. og 2) En kompilator oversetter et program til et annet språk, for eksempel maskinspråk. Et program interpreteres
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 17 januar, 2011 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Modula OJD Tidspunkt: Mandag
DetaljerINF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt
Her kan jeg godt si litt om meg selv. Arne Skjærholt adhyāyaḥ prathamaḥ Arne Skjærholt adhyāyaḥ prathamaḥ Faget Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder,
DetaljerINF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt
NF1820 NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ Her kan jeg godt si litt om meg selv NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ NF1820 Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #8
IN1140: Introduksjon til språkteknologi Forelesning #8 Samia Touileb Universitetet i Oslo 18. oktober 2017 Forrige uke 2 Syntaks Tema for i dag 3 Midtveisevaluering IN1140, høst 2018 Kontekstfrie grammatikker
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #10
IN1140: Introduksjon til språkteknologi Forelesning #10 Samia Touileb Universitetet i Oslo 01. november 2018 Lingvistiske nivåer 2 Semantikk 3 studiet av betydning slik det uttrykkes gjennom språk betydning
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 13. gang, 10.4.2014 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk
DetaljerMorfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1
Morfologi Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting EXFAC EURA 2. Morfologi1 1 Setninger består av ord (grupper av ord) Ord har struktur: les-te, en god les-er -te: bøyning
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #10
IN1140: Introduksjon til språkteknologi Forelesning #10 Samia Touileb Universitetet i Oslo 01. november 2018 Lingvistiske nivåer 2 Semantikk 3 studiet av betydning slik det uttrykkes gjennom språk betydning
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags
Detaljer2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.
1 Innhold Del 1: Ord og klasser av ord 1 Ord og klasser av ord 9 2 Substantiv 11 2.1 Genus 11 2.2 Bøyning 13 2.3 Substantiv med bare entallsformer 17 2.4 Substantiv med bare flertallsformer 17 2.5 Genitiv
DetaljerHMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo
INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2016 13. gang, 20.4.2016 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk
DetaljerIvar Utne, ; RETTA ; forslag om oppg. II (tekstslingvistikk) FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F
Ivar Utne, 30.11.2015; RETTA 1.12.15; forslag om oppg. II (tekstslingvistikk) 8.12.15 FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F 30.11.2015 Nedafor er det forslag til svar for oppgave III om synstaktisk
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 13 april, 2015 LINGVISTISKE NIVÅER SEMANTIKK studiet av betydning slik det uttrykkes gjennom språk betydning til morfemer, ord,
DetaljerKristian Emil Kristoffersen, Hanne Gram Simonsen og Andreas Sveen (red.) Språk. En grunnbok. Universitetsforlaget
Kristian Emil Kristoffersen, Hanne Gram Simonsen og Andreas Sveen (red.) Språk En grunnbok Universitetsforlaget Innhold Forord 13 1 Hva er språk? 17 Av Kristian Emil Kristoffersen 1.1 Innledning 17 1.2
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #7
IN1140: Introduksjon til språkteknologi Forelesning #7 Lilja Øvrelid Universitetet i Oslo 11 oktober 2018 Tema for i dag 2 Forrige uke Ordklasser Ordklassetagging Oblig2a: språkmodeller (frist: 17/9) I
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 24 april, 2017 1 Semantisk språkteknologi Lingvistiske nivåer 2 Semantikk studiet av betydning slik det uttrykkes
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 24 april, 2017 1 Semantisk språkteknologi Lingvistiske nivåer 2 Semantikk studiet av betydning slik det uttrykkes
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjortende forelesning Lilja Øvrelid 7 mai, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 8 mai, 2017 1 Språkteknologiske applikasjoner Mange språkteknologiske applikasjoner kombinerer teknikker vi har
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 8 mai, 2017 1 Språkteknologiske applikasjoner Mange språkteknologiske applikasjoner kombinerer teknikker vi har
DetaljerMAT1030 Diskret matematikk
MAT1030 Diskret matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 30. april 2008 Oppsummering Mandag så vi på hvordan vi kan finne uttrykk og termer på infiks form,
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk
DetaljerEXFAC EURA Syntaks2 1
EXFAC EURA Syntaks2 1 Språk Noen avvik fra og tillegg til kap. 12 (som ikke skal leses i sin helhet), bedre tilpasset ILOS-fagenes terminologi og språk Mest om form i dag og om verbet Feil i eksemplene?
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #8
IN1140: Introduksjon til språkteknologi Forelesning #8 Samia Touileb Universitetet i Oslo 17. oktober 2017 Tema for i dag 2 Fra forrige uke: HMM og FSA Evaluering Syntaks HMM og FSA 3 HMM er er en utvidelse
DetaljerNORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1
NORSK ANDRESPRÅKSKORPUS KURSHEFTE ASK, kurshefte Hilde Johansen (2011) 1 KURSHEFTETS INNHOLD 1. Antall ord i ulike delkorpus (testnivå og morsmål) 2. Persondata 3. Feilkoder 4. Oslo-Bergen-taggerens taggsett
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational
DetaljerMAT1030 Diskret Matematikk
MAT1030 Diskret Matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 4. mai 2010 (Sist oppdatert: 2010-05-04 14:11) Forelesning 27 MAT1030 Diskret Matematikk 4. mai 2010
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2016 14. gang, 27.4.2016 Jan Tore Lønning I dag Formell setningssemantikk: Systematisk oversettelse fra naturlig språk til logisk språk Utvidelser av det logiske språket To trinn
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk
DetaljerSamspillet mellom leksikon og syntaks
Samspillet mellom leksikon og syntaks Victoria Rosén Universitetet i Bergen og Uni Research 12. konferanse om leksikografi i Norden Oslo, 16. august 2013 Bakgrunn som syntaktiker Introduksjon Arbeidet
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2 Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 27 april, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker vi har sett på
DetaljerForelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28)
MAT1030 Diskret Matematikk Forelesning 27: Trær Roger Antonsen Institutt for informatikk, Universitetet i Oslo Forelesning 27 6. mai 2009 (Sist oppdatert: 2009-05-06 22:28) MAT1030 Diskret Matematikk 6.
DetaljerINF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 2 Naturlige språk som
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Semantikk II Gordana Ilić Holen (basert på Lilja Øvrelids slides) 26 april 2012 SEMANTIKK Forrige gang: Introduksjon Ordsemantikk (Leksikal semantikk)
DetaljerSkanning del I INF /01/15 1
Skanning del I INF 5110-2015 21/01/15 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: Programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.
DetaljerUNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF1080 Logiske metoder for informatikk Eksamensdag: 10. desember 2013 Tid for eksamen: 09.00 13.00 Oppgave 1 Mengdelære (10 poeng)
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning Lilja Øvrelid 23 april, 2012 SEMANTIKK Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,
DetaljerINF1800 Forelesning 6
INF1800 Forelesning 6 Utsagnslogikk Roger Antonsen - 3. september 2008 (Sist oppdatert: 2008-09-03 12:49) Mer om bruk av utsagnslogikk Hvordan fange inn utsagn? Jeg spiser det hvis det er godt. Jeg spiser
DetaljerSetningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.
Setningsledd Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo http://www.hf.uio.no/tekstlab Hvorfor lære setningsanalyse? Økt forståelse for hvordan man bygger opp setninger i skriftlige arbeider
DetaljerINNHOLD. Innledning 12. Kapittel 1: Kommunikasjon 14. Kapittel 2: Sjanger 20. Kapittel 3: Med språket som verktøy 26
INNHOLD Innledning 12 Kapittel 1: Kommunikasjon 14 Hva er kommunikasjon? 15 Kommunikativ kompetanse 15 Kommunikasjon har alltid et formål 16 Retorikk: læren om målrettet kommunikasjon 17 Konvensjoner 17
DetaljerParsing basert på LFG: Et MlT/Xerox-system applisert på norsk
Helge Dyvik Institutt for fonetikk og lingvistikk Universitetet i Bergen Sydnesplass 9 5000 Bergen Knut Hofland NA VFs EDB-senter fo r humanistisk forskning Postboks 53 5014 Bergen-Universitet Parsing
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2 Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse
DetaljerGrammatikk En innføring av Anne Lene Berge
Grammatikk En innføring av Anne Lene Berge Det er vanlig å dele et språksystem inn i fire hoveddeler: fonologien, som beskriver lydsystemet, morfologien, som gjør greie for hvordan ord er bygd opp og hvordan
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 13 april, 2015 LINGVISTISKE NIVÅER SEMANTIKK studiet av betydning slik det uttrykkes gjennom språk betydning til morfemer, ord,
DetaljerFAGPLAN I NORSK FOR 7. TRINN HØSTEN 2016
FAGPLAN I NORSK FOR 7. TRINN HØSTEN 06 a Kap Side a 5 6 Vite hvordan språket ble til 8 9 Rettskriving Og/å Lydlike ord 0 5 Rettskriving og 8 9 0 46 59 5 4 + 6 60 7 4 Vite hva språk er og hvordan det har
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv
DetaljerINF1800 LOGIKK OG BEREGNBARHET
INF1800 LOGIKK OG BEREGNBARHET FORELESNING 6: UTSAGNSLOGIKK Roger Antonsen Institutt for informatikk Universitetet i Oslo 3. september 2008 (Sist oppdatert: 2008-09-03 12:49) Mer om bruk av utsagnslogikk
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 27 mars, 2017 1 Semantikk Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,
DetaljerFOL: syntaks og representasjon. 15. og 16. forelesning
FOL: syntaks og representasjon 15. og 16. forelesning Førsteordens logikk Førsteordens logikk: et formelt system som man bruker til å representere og studere argumenter. Som utsagnslogikk, men mer uttrykkskraftig,
DetaljerINF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda
Arne Skjærholt Lectio secunda Arne Skjærholt Lectio secunda Python/NLTK En del grunner til at vi foretrekker Python over Java For det første er NLTK i Python, ikke Java Det er en ganske viktig grunn =)
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 27 mars, 2017 1 Semantikk Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,
DetaljerSetningsledd. Norsk som fremmedspråk Side 131
Setningsledd Norsk som fremmedspråk Side 131 VERBAL er det viktigste leddet i en setning Det forteller om handlingen, og det sier noe om tiden når den skjer Verbalet kan være et enkelt ord, eller det kan
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femte forelesning Arne Skjærholt 25 januar, 2012 MORFOLOGI µορφή (morph ē) - form λόγος (lógos) - lære MORFOLOGI µορφή (morph ē) - form λόγος
Detaljer1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.
INF2820 Datalingvistikk V2012 Jan Tore Lønning LITT PYTHON 2 Hvorfor Pyhton Python syntaks NLTK Natural Language Tool Kit: Omgivelser for å eksperimentere med datalingvistikk Diverse datalingvistiske algoritmer
DetaljerInformasjonsgjenfinning
INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 18. september Outline 1 Hva er IR? Tradisjonell evaluering Invertert indeks 2 Rangering Evaluering av rangering 3 Grunnleggende egenskaper Vektorer
DetaljerIfis forslag til reviderte studieprogrammer
Ifis forslag til reviderte studieprogrammer Andre utkast 10. desember 2015 Innledning Dette er andre versjon («β-versjonen») av Ifis forslag til våre nye bachelorprogrammer. Det skal behandles i UU 17.
Detaljer