INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Størrelse: px
Begynne med side:

Download "INF1820: Introduksjon til språk-og kommunikasjonsteknologi"

Transkript

1 INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 17 januar, 2011

2 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Modula OJD

3 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Modula OJD Arbeidsmengde: 37,5 / 3 = 12,5 timer Etter forelesning+gruppe: 9,5 timer

4 Obligatoriske oppgaver, poengsystem: 3 obligatoriske oppgaver, hver delt i to deloppgaver (1a, 1b, 2a, 2b, 3a, 3b) 100 poeng per oppgave For å gå opp til eksamen: bestå alle tre obligatoriske oppgaver akkumulere min 100 poeng for hver obligatoriske oppgave Absolutte frister Kopiering/plagiat

5 Obligatoriske oppgaver, poengsystem: 3 obligatoriske oppgaver, hver delt i to deloppgaver (1a, 1b, 2a, 2b, 3a, 3b) 100 poeng per oppgave For å gå opp til eksamen: bestå alle tre obligatoriske oppgaver akkumulere min 100 poeng for hver obligatoriske oppgave Absolutte frister Kopiering/plagiat Tidsrammer Viktighet av gruppeundervisningen

6 Obligatoriske oppgaver, poengsystem: 3 obligatoriske oppgaver, hver delt i to deloppgaver (1a, 1b, 2a, 2b, 3a, 3b) 100 poeng per oppgave For å gå opp til eksamen: bestå alle tre obligatoriske oppgaver akkumulere min 100 poeng for hver obligatoriske oppgave Absolutte frister Kopiering/plagiat Tidsrammer Viktighet av gruppeundervisningen Emnesiden: timeplan, pensum, lesehenvisninger, beskjeder etc.

7 EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til praksis. Vi vil ta for oss morfologisk, syntaktisk, samt noe semantisk analyse av naturlige språk, formell språkteori og korpusbaserte metoder. Studentene vil få et første møte med noen datalingvistiske applikasjonsområder.

8 LITTERATUR Pensum: An Introduction to Language (8th Edition) by Victoria A. Fromkin, Robert Rodman, and Nina Hyams Kapittel 1-5 Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (2nd edition) by Daniel Jurafsky and James H. Martin Kapittel 1-5, 12, 19 & 20 Deler av: Natural Language Processing with Python by Steven Bird, Ewan Klein and Edward Loper (URL) Kapittel NLTK 1, 2, Anbefalt: How to think like a computer scientist: Python, on-line URL

9 INTRODUKSJON TIL LINGVISTIKK

10 INTRODUKSJON TIL LINGVISTIKK Hva vil det si å beherske et språk? Hva vet vi om menneskelig språkprosessering? Hva mener vi med at språket er uendelig? Hva utgjør språkets byggeklosser? Hvordan settes disse sammen til meningsbærende enheter? Hvem gjør hva mot hvem i en setning? Og hvordan vet vi det?

11 INTRODUKSJON TIL SPRÅKTEKNOLOGI Kan vi få kunnskap om menneskelig språk ved prosessering av store tekstmengder? Hvordan kan regulære uttrykk brukes til å beskrive språklige fenomener? Hvordan kan vi tildele ordklasser automatisk og hvordan evaluerer vi systemene våre? Hvordan kan vi automatisk gruppere ord til fraser? Hvordan kan vi automatisk skille mellom forskjellige betydninger av et ord?

12 DU KAN skrive enkle programmer for å manipulere store tekstmengder i Python

13 DU KAN skrive enkle programmer for å manipulere store tekstmengder i Python... redusere alle ord i en tekst til dets baseform (oblig1) Søk på dances tango gir treff som learn to dance tango, what is tango dancing

14 DU KAN skrive enkle programmer for å manipulere store tekstmengder i Python... redusere alle ord i en tekst til dets baseform (oblig1) Søk på dances tango gir treff som learn to dance tango, what is tango dancing automatisk trekke ut datouttrykk fra en tekst (oblig1) Forslag om å legge til et møte i kalender

15 DU KAN skrive enkle programmer for å manipulere store tekstmengder i Python... redusere alle ord i en tekst til dets baseform (oblig1) Søk på dances tango gir treff som learn to dance tango, what is tango dancing automatisk trekke ut datouttrykk fra en tekst (oblig1) Forslag om å legge til et møte i kalender lage frekvenslister (oblig1) Hva er årets ord?

16 DU KAN skrive enkle programmer for å manipulere store tekstmengder i Python... redusere alle ord i en tekst til dets baseform (oblig1) Søk på dances tango gir treff som learn to dance tango, what is tango dancing automatisk trekke ut datouttrykk fra en tekst (oblig1) Forslag om å legge til et møte i kalender lage frekvenslister (oblig1) Hva er årets ord? Trekke ut entiteter fra en tekst (oblig2): The crown prince of Norway Håkon Magnus Mette Marit s husband

17 DU KAN... Automatisk tagge en tekst med ordklasser (Oblig2):

18 DU KAN... Automatisk tagge en tekst med ordklasser (Oblig2): After the social browser launched two weeks earlier, talk about it exploded.

19 DU KAN... Automatisk tagge en tekst med ordklasser (Oblig2): After the social browser launched two weeks earlier, talk about it exploded. 1 After 2 the 3 social 4 browser 5 launched 6 two 7 weeks 8 earlier 9, 10 talk 11 about 12 it 13 exploded

20 DU KAN... Automatisk tagge en tekst med ordklasser (Oblig2): After the social browser launched two weeks earlier, talk about it exploded. 1 After after 2 the the 3 social social 4 browser browser 5 launched launch 6 two two 7 weeks week 8 earlier earlier 9,, 10 talk talk 11 about about 12 it it 13 exploded explode

21 DU KAN... Automatisk tagge en tekst med ordklasser (Oblig2): After the social browser launched two weeks earlier, talk about it exploded. 1 After after IN 2 the the DT 3 social social JJ 4 browser browser NN 5 launched launch VVD 6 two two JJ 7 weeks week NN 8 earlier earlier RBR 9,,, 10 talk talk NN 11 about about IN 12 it it PP 13 exploded explode VVD

22 DU KAN... Automatisk tagge en tekst med ordklasser (Oblig2): After the social browser launched two weeks earlier, talk about it exploded.... og evaluere resultatet! 1 After after IN 2 the the DT 3 social social JJ 4 browser browser NN 5 launched launch VVD 6 two two JJ 7 weeks week NN 8 earlier earlier RBR 9,,, 10 talk talk NN 11 about about IN 12 it it PP 13 exploded explode VVD

23 DU KAN... forklare hva som gir opphav til flertydighet i språk og illustrere forskjeller, feks ved hjelp av syntaktiske trær (oblig3): The girls saw Bill on the beach with a telescope

24 Language may refer either to the specifically human capacity for acquiring and using complex systems of communication, or to a specific instance of such a system of complex communication. The scientific study of language in any of its senses is called linguistics. (Eng. Wikipedia)

25 Language may refer either to the specifically human capacity for acquiring and using complex systems of communication, or to a specific instance of such a system of complex communication. The scientific study of language in any of its senses is called linguistics. (Eng. Wikipedia) Vitenskapelige studiet av språk Vitenskapelig? Systematisk studie av regler, systemer og prinsipper i menneskelige språk

26 Hva er lingvistisk kunnskap? Ubevisst (tacit knowledge) Men det er mye kunnskap (know-how vs know-that)

27 Hva er lingvistisk kunnskap? Ubevisst (tacit knowledge) Men det er mye kunnskap (know-how vs know-that) Kunnskap om lyd: lydsystemet for et språk rekkefølgen på lyder

28 Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller mening Vilkårlig (arbitrær) kobling mellom form og mening odun asa wartawan

29 Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller mening Vilkårlig (arbitrær) kobling mellom form og mening odun : tre (mat.) Tyrkisk asa wartawan

30 Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller mening Vilkårlig (arbitrær) kobling mellom form og mening odun : tre (mat.) Tyrkisk asa : morgen Japansk wartawan

31 Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller mening Vilkårlig (arbitrær) kobling mellom form og mening odun : tre (mat.) Tyrkisk asa : morgen Japansk wartawan : reported Indonesisk

32 Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller mening Vilkårlig (arbitrær) kobling mellom form og mening odun : tre (mat.) Tyrkisk asa : morgen Japansk wartawan : reported Indonesisk konvensjonalisert

33 Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller mening Vilkårlig (arbitrær) kobling mellom form og mening odun : tre (mat.) Tyrkisk asa : morgen Japansk wartawan : reported Indonesisk konvensjonalisert Er det alt?

34 Kunnskap om hvordan ord settes sammen til fraser, til setninger Mengden av setninger er uendelig Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk

35 Kunnskap om hvordan ord settes sammen til fraser, til setninger Mengden av setninger er uendelig Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk Dette er en setning

36 Kunnskap om hvordan ord settes sammen til fraser, til setninger Mengden av setninger er uendelig Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk Dette er en setning Dette er en setning som jeg skriver akkurat nå

37 Kunnskap om hvordan ord settes sammen til fraser, til setninger Mengden av setninger er uendelig Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv.

38 Kunnskap om hvordan ord settes sammen til fraser, til setninger Mengden av setninger er uendelig Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv.

39 Kunnskap om hvordan ord settes sammen til fraser, til setninger Mengden av setninger er uendelig Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv. Hva er øvre grense?

40 Grammatikalitet Norske sykehus bruker for mye antibiotika *Sykehus norske bruker for mye antibiotika *Norske sykehus for mye antibiotika bruker *Norsk sykehus bruker for mye antibiotika Kunnskap om regler for hvordan man danner setninger i et språk en endelig mengde regler, med et endelig vokabular en uendelig mengde setninger Grammatikalitetsbedømninger

41 GRAMMATIKK 1. den mentale grammatikken 2. modellen eller beskrivelsen av denne Kunnskapen om enheter og regler i et språk: Fonologi: lyder ord Morfologi: morfemer ord Syntaks: ord fraser, fraser setninger Semantikk: ord mening, setninger mening

42 Universal Grammar The Innateness Hypothesis Omdebattert: Steven Pinker: The Language Instinct, Geoffrey Sampson s motsvar Språktilegnelse, Poverty of the Stimulus Unik egenskap for mennesker, språk hos dyr? Honey bee dance

43 ...the scientific study of language from a computational perspective. Computational linguists are interested in providing computational models of various kinds of linguistic phenomena (Association for Computational Linguistics) Datalingvistikk, Computational linguistics Bruk av språklig kunnskap i systemer HAL the holy grail of computational linguistics

44 Modellering av språklig kunnskap: Fonetikk/fonologi: kunnskap om lingvistiske lyder Fonetikk Lydlære: taleapparatets anatomi og fysiologi, uttale og lydbølgenes fysiske egenskaper Fonologi Hvordan lyder fungerer i språk, hvordan lyder forholder seg til hverandre Talegjenkjenning/talesyntese

45 Modellering av språklig kunnskap: Fonetikk/fonologi: kunnskap om lingvistiske lyder Fonetikk Lydlære: taleapparatets anatomi og fysiologi, uttale og lydbølgenes fysiske egenskaper Fonologi Hvordan lyder fungerer i språk, hvordan lyder forholder seg til hverandre Talegjenkjenning/talesyntese Eksempel problem: homofoner (homonymer) ord som uttales likt men har forskjellig betydelse weak week to too two

46 Modellering av språklig kunnskap: Morfologi: kunnskap om meningsbærende deler av ord, ordstruktur Morfologisk analyse, ordklassetagging Eksempel problem: flertydige morfemer -er-endelsen i norsk

47 Modellering av språklig kunnskap: Syntaks: kunnskap om strukturelle forhold mellom ord Chunking, parsing Eksempel problem: visse syntaktiske konstruksjoner, (feks kontroll, koordinering) Fredrik promised Mary to call the plumber Fredrik asked Mary to call the plumber Fredrik asked Mary to call the plumber and then the pizza place

48 Modellering av språklig kunnskap: Semantikk: kunnskap om mening ord, setninger Word Sense Disambiguation (WSD), textual entailment

49 Modellering av språklig kunnskap: Semantikk: kunnskap om mening ord, setninger Word Sense Disambiguation (WSD), textual entailment Eksempel problem: en form flere meninger Mine mål er egentlig ganske forskjellige uttalt av en fotballspiller uttalt av en modell som sammenligner seg med Kate Moss uttalt av en ISK masterstudent Alle studenter hater to kurs

50 Modellering av språklig kunnskap: Diskurs: kunnskap om enheter ut over enkelte ytringer Anaforresolusjon, dialogsystemer... det er diskutabelt hvor mye Watson egentlig forstår. Den driver snarere en form for etterlikning av noen av måtene menneskehjernen prosesserer språk på. (Dagbladet, 14/1/11)

51 Modellering av språklig kunnskap: Diskurs: kunnskap om enheter ut over enkelte ytringer Anaforresolusjon, dialogsystemer... det er diskutabelt hvor mye Watson egentlig forstår. Den driver snarere en form for etterlikning av noen av måtene menneskehjernen prosesserer språk på. (Dagbladet, 14/1/11) Vi ga bananene til apene fordi de var sultne. Vi ga bananene til apene fordi de var modne.

52 FLERTYDIGHET De fleste språkteknologiske applikasjoner må håndtere flertydighet ( ambiguity ) Kjennetegner naturlige språk, på alle nivåer I saw her duck Krasjet med rådyr på moped (Agderposten)

53 FORMELLE MODELLER Endelige tilstandsmaskiner ( finite state automata ) Formelle regelsystemer Fonologi, morfologi Syntaks

54 FORMELLE MODELLER Første ordens logikk Semantikk, pragmatikk Probabilistiske modeller utvidelser til probabilistiske versjoner, disambiguering vektormodeller Leksikal IR semantikk,

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2012 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Chill Arbeidsmengde: 37,5 /

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #2

IN1140: Introduksjon til språkteknologi. Forelesning #2 IN1140: Introduksjon til språkteknologi Forelesning #2 Samia Touileb Universitetet i Oslo 30. august 2018 Tema forrige uke 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Tema for

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk

Detaljer

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning INF2820 Datalingvistikk 14. januar 2018 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time:

Detaljer

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning INF2820 Datalingvistikk V2016 Jan Tore Lønning INF2820 Datalingvistikk 20. januar 2016 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære språk OBS: Lov å

Detaljer

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning INF2820 Datalingvistikk 16. januar 2017 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære

Detaljer

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning INF2820 Datalingvistikk V2015 Jan Tore Lønning INF2820 Datalingvistikk 21. januar 2015 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker

Detaljer

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning INF2820 Datalingvistikk V2014 Jan Tore Lønning INF2820 Datalingvistikk 19. januar 2014 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1 IN1140: Introduksjon til språkteknologi Forelesning #1 Erik Velldal Universitetet i Oslo 22. august 2017 Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper Obliger

Detaljer

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt Her kan jeg godt si litt om meg selv. Arne Skjærholt adhyāyaḥ prathamaḥ Arne Skjærholt adhyāyaḥ prathamaḥ Faget Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder,

Detaljer

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt NF1820 NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ Her kan jeg godt si litt om meg selv NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ NF1820 Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske

Detaljer

INF1820: Oppsummering

INF1820: Oppsummering Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1 IN1140: Introduksjon til språkteknologi Forelesning #1 Lilja Øvrelid Universitetet i Oslo 23. august 2018 Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1 IN1140: Introduksjon til språkteknologi Forelesning #1 Lilja Øvrelid Universitetet i Oslo 23. august 2018 Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper

Detaljer

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon OBS: Lov å stille spørsmål underveis Forelesninger

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon 1. Hvorfor datalingvistikk? 2. Hva er utfordringene?

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 13. gang, 10.4.2014 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2016 13. gang, 20.4.2016 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

LF - Eksamen i INF1820

LF - Eksamen i INF1820 LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2015 5. Gang - 16.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2017 6. Gang - 20.2 Jan Tore Lønning I dag Kontekstfrie grammatikker og naturlige språk (fortsatt fra sist) Kontekstfrie grammatikker og regulære språk Grammatikker og trær i NLTK

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer

Detaljer

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF 2820 V2015: Obligatorisk innleveringsoppgave 3 INF 2820 V2015: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 17.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Del 1 RD Parsing Oppgave 1:

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 26 mars, 2012 1 / 48 FORMELLE MODELLER Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 1: INTRODUKSJON Roger Antonsen Institutt for informatikk Universitetet i Oslo 19. august 2008 (Sist oppdatert: 2008-09-03 12:35) Velkommen til INF1800! Introduksjon

Detaljer

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019 Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019 Tid: 09:15 16:00 sted: Ole-Johan Dahls hus Tilstede: Joakim Nivre, Lilja Øvrelid (LTG, vara), Jan Tore Lønning (programrådsleder),

Detaljer

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning INF2820 Datalingvistikk V2018 10. Gang 19.3 del 1 Jan Tore Lønning I dag: to deler A. Active chart-parsing Fortsatt fra sist B. Tekstklassifisering 2 CHART-PARSING 3 I dag chart-parsing Chart-parsing:

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 1 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2012 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 17. januar 2012 2 Naturlige språk En mann kjøpte en bil av en mann som hadde

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #12

IN1140: Introduksjon til språkteknologi. Forelesning #12 IN1140: Introduksjon til språkteknologi Forelesning #12 Lilja Øvrelid Universitetet i Oslo 15 november 2018 Tema for i dag 2 I dag Repetisjon Digital prøveeksamen Neste uke Gjennomgang av eksamensoppgave

Detaljer

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF 2820 V2016: Innleveringsoppgave 3 del 1 INF 2820 V2016: Innleveringsoppgave 3 del 1 Pga tekniske problemer er oppgaveteksten delt i to. Dette er første del. Andre del legges ut mandag 13.3! Besvarelsene skal leveres i devilry innen fredag 24.3

Detaljer

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 19. januar 2014 2 Naturlige språk En mann kjøpte en bil av en mann som hadde eid bilen i

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 51 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

Hvordan er arbeidsmengden i forhold til omfanget i studiepoeng?

Hvordan er arbeidsmengden i forhold til omfanget i studiepoeng? INF121 Hvor fornøyd er du med kurset? Hvor mye har du lært på kurset? Hvordan er arbeidsmengden i forhold til omfanget i studiepoeng? Har du savnet forkunnskap? Hvis ja, hva har du savnet forkunnskaper

Detaljer

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsing algoritmen Algoritmen uttrykt

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #13

IN1140: Introduksjon til språkteknologi. Forelesning #13 IN1140: Introduksjon til språkteknologi Forelesning #13 Samia Touileb Universitetet i Oslo 22. november 2018 Vinnerne av obligkonkurransen 2 De har scoret flest oblig-poeng igjennom semesteret (av maksimalt

Detaljer

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning INF2820 Datalingvistikk V2017 9. Gang 13.3 Jan Tore Lønning I dag chart-parsing Fortsatt fra sist: Chart-parsing: hovedideer BU chart-parsing: algoritmen NLTKs ChartParser Enkel Python-implementasjon av

Detaljer

Dagens plan INF3170 Logikk. Obliger og eksamen. Forelesning 1: Introduksjon, mengdelære og utsagnslogikk. Christian Mahesh Hansen og Roger Antonsen

Dagens plan INF3170 Logikk. Obliger og eksamen. Forelesning 1: Introduksjon, mengdelære og utsagnslogikk. Christian Mahesh Hansen og Roger Antonsen Dagens plan INF3170 Logikk Forelesning 1: Introduksjon, mengdelære og utsagnslogikk Christian Mahesh Hansen og Roger Antonsen Institutt for informatikk, Universitetet i Oslo 1 Praktisk informasjon 2 23.

Detaljer

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye) INF247 Er du? Er du? - Annet Ph.D. Student Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye) Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen,

Detaljer

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK 19. januar 2017 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 8. gang, 6.3.2014 Jan Tore Lønning I dag Chart parsing Implementasjon CKY og Chart: Parsing vs anerkjenning 2 Chart alternativ datastruktur (S, [0, 1]) (VP, [0,1]) (Det, [1,2])

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #7

IN1140: Introduksjon til språkteknologi. Forelesning #7 IN1140: Introduksjon til språkteknologi Forelesning #7 Lilja Øvrelid Universitetet i Oslo 11 oktober 2018 Tema for i dag 2 Forrige uke Ordklasser Ordklassetagging Oblig2a: språkmodeller (frist: 17/9) I

Detaljer

Climate change and adaptation: Linking. stakeholder engagement- a case study from

Climate change and adaptation: Linking. stakeholder engagement- a case study from Climate change and adaptation: Linking science and policy through active stakeholder engagement- a case study from two provinces in India 29 September, 2011 Seminar, Involvering ved miljøprosjekter Udaya

Detaljer

inf 1510: bruksorientert design

inf 1510: bruksorientert design inf 1510: bruksorientert design våren 2011 Tone Bratteteig design av informasjonssystemer + i:d (informatikk: design, bruk, interaksjon) Roger Antonsen: studielaben & Åpen Sone i dag: velkommen & introduksjon

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 SAMMENHENGER FSA OG REGULÆRE UTTRYKK 31. januar

Detaljer

GEO326 Geografiske perspektiv på mat

GEO326 Geografiske perspektiv på mat U N I V E R S I T E T E T I B E R G E N Institutt for geografi Emnerapport høsten 2015: GEO326 Geografiske perspektiv på mat Innhold: 1. Informasjon om emnet 2. Statistikk 3. Egenevaluering 4. Studentevaluering

Detaljer

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning INF2820 Datalingvistikk V2018 10. Gang, del 2 19.3 Jan Tore Lønning TEKSTKLASSIFISERING 2 I dag: tekstklassifisering Tekstklassifisering og maskinlæring Eksempel: NLTK "Names" Ekseperimentelt oppsett 1

Detaljer

INF2270 Datamaskinarkitektur

INF2270 Datamaskinarkitektur Velkommen Velkommen til INF2270 Datamaskinarkitektur Motto: Datamaskinen på tvers Forelesere Forelesere Omid Mirmotahari (omidmi@ifi.uio.no) fra Studielaben, men opprinnelig fra Nanoelektronikk. Dag Langmyhr

Detaljer

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning INF2820 Datalingvistikk V2015 14. Gang 4.5 Jan Tore Lønning CHART PARSING 2 I dag Svakheter ved tidligere parsere RD og SR: ineffektivitet CKY: CNF Chart parsing,,dotted items og fundamentalregelen Algoritmer:

Detaljer

Last ned Innføring i lingvistikk. Last ned. Last ned e-bok ny norsk Innføring i lingvistikk Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

Last ned Innføring i lingvistikk. Last ned. Last ned e-bok ny norsk Innføring i lingvistikk Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi Last ned Innføring i lingvistikk Last ned ISBN: 9788200452737 Antall sider: 373 Format: PDF Filstørrelse: 16.06 Mb Innføring i lingvistikk er skrevet for lingvistikkvarianten i førstesemesterstudiet ved

Detaljer

Syntax/semantics - I INF 3110/ /29/2005 1

Syntax/semantics - I INF 3110/ /29/2005 1 Syntax/semantics - I Program program execution Compiling/interpretation Syntax Classes of langauges Regular langauges Context-free langauges Scanning/Parsing Meta models INF 3/4-25 8/29/25 Program

Detaljer

EN Skriving for kommunikasjon og tenkning

EN Skriving for kommunikasjon og tenkning EN-435 1 Skriving for kommunikasjon og tenkning Oppgaver Oppgavetype Vurdering 1 EN-435 16/12-15 Introduction Flervalg Automatisk poengsum 2 EN-435 16/12-15 Task 1 Skriveoppgave Manuell poengsum 3 EN-435

Detaljer

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk

Detaljer

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsingalgoritmen Algoritmen uttrykt

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2017 5. Gang - 13.2 Jan Tore Lønning I dag Tekstnormalisering: lemmatisering og «stemming» Tagget tekst og tagging Begrensninger ved regulære språk Frasestruktur og kontekstfrie

Detaljer

Studieplan 2016/2017

Studieplan 2016/2017 Studieplan 2016/2017 Årsstudium i digital kommunikasjon Studiepoeng: 60 Studiets varighet, omfang og nivå Studiet er på 60 studiepoeng og tas på heltid over 1 år. Det er også mulig å ta det på deltid over

Detaljer

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene

Detaljer

INF2270 Datamaskinarkitektur

INF2270 Datamaskinarkitektur Velkommen Velkommen til INF2270 Datamaskinarkitektur Motto: Datamaskinen på tvers Forelesere Forelesere Omid Mirmotahari (omidmi@ifi.uio.no) fra Studielaben, men opprinnelig fra gruppen for Nanoelektronikk.

Detaljer

Planlagte studieplanendringer for lingvistikk og datalingvistikk

Planlagte studieplanendringer for lingvistikk og datalingvistikk edlegg til UUI-sak /11: Endring i studieløp - Lingvistikk/Datalingvistikk edlegg 3: Brev til IF med aktuelle emneplaner Institutt for fremmedspråk Programstyret for bachelorprogrammet i språk og informasjon

Detaljer

Eksamen ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister. Nynorsk/Bokmål

Eksamen ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister. Nynorsk/Bokmål Eksamen 22.11.2012 ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister Nynorsk/Bokmål Nynorsk Eksamensinformasjon Eksamenstid Hjelpemiddel Eksamen varer i 5 timar. Alle hjelpemiddel

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational

Detaljer

Factoid Spørsmål Svar

Factoid Spørsmål Svar Grunnleggende INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 25. september Outline Grunnleggende 1 Grunnleggende 2 3 4 5 Outline Grunnleggende 1 Grunnleggende 2 3 4 5 Factoide Grunnleggende

Detaljer

Velkommen til INF5110 Kompilatorteknikk

Velkommen til INF5110 Kompilatorteknikk Velkommen til INF5110 Kompilatorteknikk 15. januar 2013 Kursansvarlige: Stein Krogdahl [steink@ifi.uio.no] Ragnhild Kobro Runde [ragnhilk@ifi.uio.no] Henning Berg (oblig-ansvarlig) [hennb@ifi.uio.no] Kursområdet:

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen

Detaljer

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye) INF122, Høst-16 Er du? Er du? - Annet Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye) Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 =

Detaljer

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda Arne Skjærholt Lectio secunda Arne Skjærholt Lectio secunda Python/NLTK En del grunner til at vi foretrekker Python over Java For det første er NLTK i Python, ikke Java Det er en ganske viktig grunn =)

Detaljer

Emneevaluering GEOV272 V17

Emneevaluering GEOV272 V17 Emneevaluering GEOV272 V17 Studentenes evaluering av kurset Svarprosent: 36 % (5 av 14 studenter) Hvilket semester er du på? Hva er ditt kjønn? Er du...? Er du...? - Annet PhD Candidate Samsvaret mellom

Detaljer

INF 2820 V2016: Innleveringsoppgave 3 hele

INF 2820 V2016: Innleveringsoppgave 3 hele INF 2820 V2016: Innleveringsoppgave 3 hele Dette er det komplette settet! Besvarelsene skal leveres i devilry innen fredag 24.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil

Detaljer

3/1/2011. I dag. Recursive descent parser. Problem for RD-parser: Top Down Space. Jan Tore Lønning & Stephan Oepen

3/1/2011. I dag. Recursive descent parser. Problem for RD-parser: Top Down Space. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 TABELLPARSING Jan Tore Lønning & Stephan Oepen 1. mars 2011 2 I dag Oppsummering fra sist: Recursive-descent og Shift-reduce parser Svakheter med disse Tabellparsing: Dynamisk

Detaljer

1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2

1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 Regulære språk Følgende er ekvivalente: a) L kan

Detaljer

Hilsen Gro Wenche, Anne Marie og Alena Tlf.mob , e-post:

Hilsen Gro Wenche, Anne Marie og Alena Tlf.mob , e-post: Vo- grunnskole Viktig informasjon Velkommen! Den første uken har passert. Nå begynner vi å komme oss i gang i alle fagene. I faget norsk, blir vi å ha diktat på onsdagene. Teksten til diktatet vil dere

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 6. juni 2014 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0

Detaljer

Introduksjon til 3290

Introduksjon til 3290 Introduksjon til 3290 Magnus Li magl@ifi.uio.no INF3290 29 / 30.08.2017 Gruppetimene Presentasjon og diskusjon av ukens tema, pensum og begreper. Tirsdager 14:15-16:00 Onsdager 12:15-14:00 Dere kan møte

Detaljer

INF3170 Forelesning 1

INF3170 Forelesning 1 INF3170 Forelesning 1 Introduksjon og mengdelære Roger Antonsen - 26. januar 2010 (Sist oppdatert: 2010-01-26 14:58) Dagens plan Innhold Velkommen til INF3710 Logikk 1 Litt praktisk informasjon...................................

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning BEGRENSNINGER VED REGULÆRE SPRÅK OG KONTEKSTFRIE GRAMMATIKKER 2 I dag 1. Begrensninger ved regulære språk 2. Noen egenskaper ved naturlige språk 3. Kontekstfrie

Detaljer

Afasi og demens. Inger Moen Februar, 2009. Institutt for lingvistiske og nordiske studier (ILN)

Afasi og demens. Inger Moen Februar, 2009. Institutt for lingvistiske og nordiske studier (ILN) Afasi og demens Inger Moen Februar, 2009 Hovedtrekk ved afasi Redusert evne til å forstå og til å produsere språk, i en eller flere modaliteter Resultat av fokal hjerneskade i den dominante hemisfære Språkevnen

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 26. januar 2011 2 Naturlige språk En mann kjøpte en bil av en mann som hadde

Detaljer

Velkommen til INF Kompilatorteknikk

Velkommen til INF Kompilatorteknikk Velkommen til INF5110 - Kompilatorteknikk Kursansvarlige: Stein Krogdahl [steink@ifi.uio.no] Birger Møller-Pedersen [birger@ifi.uio.no] Eivind Gard Lund (hjelpelærer) [eivindgl@student.matnat.uio.no] Kursområdet:

Detaljer

INF1800 Forelesning 4

INF1800 Forelesning 4 INF1800 Forelesning 4 Utsagnslogikk Roger Antonsen - 27. august 2008 (Sist oppdatert: 2008-09-03 12:39) Før vi begynner Praktiske opplysninger Kursets hjemmeside blir stadig oppdatert: http://www.uio.no/studier/emner/matnat/ifi/inf1800/

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 20. januar 2012 2 Non-Determinism Speech and Language Processing - Jurafsky and Martin

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 4: UTSAGNSLOGIKK Roger Antonsen Institutt for informatikk Universitetet i Oslo 27. august 2008 (Sist oppdatert: 2008-09-03 12:39) Før vi begynner Praktiske opplysninger

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen TABELLPARSING 1. mars 2011 2 I dag Oppsummering fra sist: Recursive-descent og Shift-reduce parser Svakheter med disse Tabellparsing: Dynamisk

Detaljer