IN1140: Introduksjon til språkteknologi. Forelesning #2

Størrelse: px
Begynne med side:

Download "IN1140: Introduksjon til språkteknologi. Forelesning #2"

Transkript

1 IN1140: Introduksjon til språkteknologi Forelesning #2 Samia Touileb Universitetet i Oslo 30. august 2018

2 Tema forrige uke 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer

3 Tema for i dag 3 Hva lærer jeg i IN1140? Hva er lingvistikk? Språkteknologiske komponenter Metoder

4 Etter å ha tatt IN1140, kan du skrive enkle programmer for å manipulere store tekstmengder i Python

5 Etter å ha tatt IN1140, kan du skrive enkle programmer for å manipulere store tekstmengder i Python... trekke ut alle ord i en tekst, dvs. utføre såkalt tokenisering

6 Etter å ha tatt IN1140, kan du skrive enkle programmer for å manipulere store tekstmengder i Python... trekke ut alle ord i en tekst, dvs. utføre såkalt tokenisering... lage frekvenslister Hva er årets ord?

7 Etter å ha tatt IN1140, kan du skrive enkle programmer for å manipulere store tekstmengder i Python... trekke ut alle ord i en tekst, dvs. utføre såkalt tokenisering... lage frekvenslister Hva er årets ord? 2017: falske nyheter, 2016: hverdagsintegrering, 2015: det grønne skiftet, 2014: fremmedkriger, 2013: sakte-tv, 2012: å nave (naving), 2011: rosetog, 2010: askefast

8 Etter å ha tatt IN1140, kan du beregne sannsynligheten for ord i en viss kontekst Eksempel ja takk, det vil jeg... gjerne? hjerne?

9 Etter å ha tatt IN1140, kan du automatisk merke opp ( tagge ) en tekst med ordklasser: Eksempel After the social browser launched two weeks earlier, talk about it exploded. 1 After after IN 2 the the DT 3 social social JJ 4 browser browser NN 5 launched launch VVD 6 two two JJ 7 weeks week NN 8 earlier earlier RBR 9,,, 10 talk talk NN 11 about about IN 12 it it PP 13 exploded explode VVD

10 Etter å ha tatt IN1140, kan du forklare hva som gir opphav til flertydighet i språk og illustrere forskjeller, feks ved hjelp av syntaktiske trær: The girls saw Bill on the beach with a telescope

11 Etter å ha tatt IN1140, kan du forstå en enkel maskinlæringsalgoritme (Naive Bayes) som kan brukes til automatisk betydningsklassifisering SKIM the pages for a clearer insight:reading She SKIMS through the novel which seems to fascinate them:reading Remove the vanilla pod, SKIM the jam, and let it cool:removing We SKIMMED across the surface of that sodding lake whilst all around us gathered the dark hosts of hell:self_motion

12 Hva er lingvistikk? 9

13 Hva er lingvistikk? 10 Det vitenskapelige studiet av menneskelige språk Regler, systemer og prinsipper i språk hva har ulike språk til felles? og hvordan varierer de? hvordan fungerer språk? hvordan forandrer språk seg over tid? hvordan tilegner barn seg språk? hvordan er språk representert i hjernen?

14 Lingvistisk kunnskap 11 Kunnskap om lyd: lydsystemet for et språk rekkefølgen på lyder Kunnskap om tegn (tegnspråk)

15 Lingvistisk kunnskap 12

16 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree sabah ciel

17 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree : tre engelsk sabah ciel

18 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree : tre engelsk sabah : morgen arabisk ciel

19 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree : tre engelsk sabah : morgen arabisk ciel : himmel fransk

20 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree : tre engelsk sabah : morgen arabisk ciel : himmel fransk

21 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree : tre engelsk sabah : morgen arabisk ciel : himmel fransk Konvensjonell sammenheng: må læres

22 Lingvistisk kunnskap 13 Kunnskap om ord: Visse lydsekvenser korresponderer til et visse konsepter, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning tree : tre engelsk sabah : morgen arabisk ciel : himmel fransk Konvensjonell sammenheng: må læres Er det alt?

23 Lingvistisk kunnskap 14 Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig

24 Lingvistisk kunnskap 14 Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning

25 Lingvistisk kunnskap 14 Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå

26 Lingvistisk kunnskap 14 Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som dere mener at jeg tror at jeg skriver akkurat nå osv.

27 Lingvistisk kunnskap 14 Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som dere mener at jeg tror at jeg skriver akkurat nå osv.

28 Lingvistisk kunnskap 15 Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv.

29 Lingvistisk kunnskap 15 Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv. Hvor setter vi grensen? Evne til å forstå og skape nye setninger, språkbruk er kreativ universell egenskap ved språk

30 Lingvistisk kunnskap 16 Grammatikalitet Norske sykehus bruker for mye antibiotika *Sykehus norske bruker for mye antibiotika *Norske sykehus for mye antibiotika bruker *Norsk sykehus bruker for mye antibiotika

31 Lingvistisk kunnskap 16 Grammatikalitet Norske sykehus bruker for mye antibiotika *Sykehus norske bruker for mye antibiotika *Norske sykehus for mye antibiotika bruker *Norsk sykehus bruker for mye antibiotika Kunnskap om regler for hvordan man danner setninger i et språk en endelig mengde regler, med et endelig vokabular en uendelig mengde setninger Grammatikalitetsbedømninger

32 Lingvistiske nivåer 17 Fonetikk/fonologi: lyder ord Morfologi: morfemer ord Syntaks: ord fraser, fraser setninger Semantikk: ord betydning, setninger betydning

33 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk

34 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk

35 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid

36 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig

37 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig Alle menneskelige språk bruker endelig (finitt) mengde lyder og ord til å danne uendelig mengde mulige setninger

38 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig Alle menneskelige språk bruker endelig (finitt) mengde lyder og ord til å danne uendelig mengde mulige setninger Alle språk kan uttrykke negasjon, spørsmål, gi kommandoer, snakke om fortid/framtid, hypotetiske situasjoner

39 Hva vi vet om språk 18 Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig Alle menneskelige språk bruker endelig (finitt) mengde lyder og ord til å danne uendelig mengde mulige setninger Alle språk kan uttrykke negasjon, spørsmål, gi kommandoer, snakke om fortid/framtid, hypotetiske situasjoner Ethvert normalt barn er i stand til å lære morsmålet sitt

40 Lingvistiske disipliner 19

41 Språkteknologiske komponenter 20

42 Språkteknologiske komponenter 21 Fonetikk/fonologi: kunnskap om lingvistiske lyder Talegjenkjenning/talesyntese: tale tekst tekst tale

43 Språkteknologiske komponenter 21 Fonetikk/fonologi: kunnskap om lingvistiske lyder Talegjenkjenning/talesyntese: tale tekst tekst tale Eksempel problem Homofoner (homonymer) ord som uttales likt men har forskjellig betydelse weak week to too two

44 Språkteknologiske komponenter 22 Morfologi: kunnskap om ordstruktur Morfologisk analyse, ordklassetagging

45 Språkteknologiske komponenter 22 Morfologi: kunnskap om ordstruktur Morfologisk analyse, ordklassetagging Eksempel problem Flertydighet av flies og like gir opphav til ulike tolkninger

46 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing

47 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing Eksempel problem Noen syntaktiske konstruksjoner gir opphav til flere tolkninger

48 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing Eksempel problem Noen syntaktiske konstruksjoner gir opphav til flere tolkninger liten, pen skole

49 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing Eksempel problem Noen syntaktiske konstruksjoner gir opphav til flere tolkninger liten, pen skole liten pike, pen skole

50 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing Eksempel problem Noen syntaktiske konstruksjoner gir opphav til flere tolkninger liten, pen skole liten pike, pen skole liten, pen pike

51 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing Eksempel problem Noen syntaktiske konstruksjoner gir opphav til flere tolkninger liten, pen skole liten pike, pen skole liten, pen pike ganske liten skole

52 Språkteknologiske komponenter 23 Syntaks: kunnskap om relasjoner mellom ord Chunking, parsing Eksempel problem Noen syntaktiske konstruksjoner gir opphav til flere tolkninger liten, pen skole liten pike, pen skole liten, pen pike ganske liten skole ganske liten pike

53 Språkteknologiske komponenter 24 Semantikk: kunnskap om mening ord, setninger Word Sense Disambiguation (WSD)

54 Språkteknologiske komponenter 24 Semantikk: kunnskap om mening ord, setninger Word Sense Disambiguation (WSD) Eksempel problem En form flere meninger Mine mål er egentlig ganske forskjellige

55 Språkteknologiske komponenter 24 Semantikk: kunnskap om mening ord, setninger Word Sense Disambiguation (WSD) Eksempel problem En form flere meninger Mine mål er egentlig ganske forskjellige uttalt av en fotballspiller uttalt av en modell som sammenligner seg med Kate Moss uttalt av en IN1140 student

56 Språkteknologiske komponenter 25 Semantikk: kunnskap om mening ord, setninger Eksempel problem Flertydighet i rekkevidde ( scope ) Alle studenter hater et kurs: x.student(x) ( z.kurs(z) hater(x, z)) z.kurs(z) ( x.student(x) hater(x, z))

57 Språkteknologiske komponenter 26 Diskurs: kunnskap om enheter ut over enkelte ytringer Anaforresolusjon, dialogsystemer

58 Språkteknologiske komponenter 27 NLP-systemer: moduler som representerer forskjellige lingvistiske nivåer Pipeline -arkitektur Høyere nivåer avhenger typisk av lavere

59 Hvorfor blir resultatene (noen ganger) dårlige? 28

60 28 Hvorfor blir resultatene (noen ganger) dårlige? Språkforståelse er komplisert Den nødvendige kunnskapen er enorm De fleste stadier viser flertydighet

61 Flertydighet 29 De fleste språkteknologiske applikasjoner må håndtere flertydighet ( ambiguity ) Kjennetegner naturlige språk, på alle nivåer I saw her duck Krasjet med rådyr på moped (Agderposten)

62 Metoder tallet: manuelt utformede regeler og leksikon En regel er definert over pattern og action (token = Mr. orthography type = FirstCap) person name

63 Metoder tallet : empirisk revolusjon Maskinlæring Datamaskiner kan lære fra data: fange opp mønstre og generalisere til nye eksempler. Supervised Weakly supervised Unsupervised

64 Metoder 32 Formelle modeller hentet fra matematikk, logikk, statistikk Maskinlæring brukes for å håndtere flertydighet

65 Maskinlæring 33 Kunstig intelligens: delområde innen informatikk (fra 60-tallet) fokus på oppgaver som er lette for mennesker, men vanskelige for maskiner språkforståelse er en slik oppgave Maskinlæring: gitt et AI problem og en masse data om verden (eksempler): la datamaskinen finne riktig svar unngår hardkoding av svarene

66 Formelle modeller 34 Kan fange inn den språklige kunnskapen, et lite antall formelle modeller og teorier Hentet fra informatikk, matematikk og lingvistikk Disse modellene kan prosesseres ved et lite antall algoritmer

67 Formelle modeller 35 Endelige tilstandsmaskiner ( finite state automata ): Består av tilstander, overganger ( transitions ) og en input-representasjon Variasjoner: deterministiske og ikke-deterministiske, endelige tilstandsmaskiner og endelige tilstandstransdusere

68 Formelle modeller 36 Formelle regelsystemer feks kontekstfrie grammatikker Syntaktiske trær

69 Formelle modeller 37 Førsteordens logikk Semantikk, pragmatikk Probabilistiske modeller utvidelser til probabilistiske versjoner, disambiguering Vektormodeller Leksikal semantikk, søk

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2012 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Chill Arbeidsmengde: 37,5 /

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 17 januar, 2011 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Modula OJD Tidspunkt: Mandag

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2017 1 Språkteknologi Språkteknologi Kjært barn: Språkteknologi ( Language Technology ) Datalingvistikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2012 ...the scientific study of language from a computational perspective. Computational linguists

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Andre forelesning Lilja Øvrelid 23 januar, 2014 SPRÅKTEKNOLOGI...the scientific study of language from a computational perspective. Computational

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #10

IN1140: Introduksjon til språkteknologi. Forelesning #10 IN1140: Introduksjon til språkteknologi Forelesning #10 Samia Touileb Universitetet i Oslo 01. november 2018 Lingvistiske nivåer 2 Semantikk 3 studiet av betydning slik det uttrykkes gjennom språk betydning

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #10

IN1140: Introduksjon til språkteknologi. Forelesning #10 IN1140: Introduksjon til språkteknologi Forelesning #10 Samia Touileb Universitetet i Oslo 01. november 2018 Lingvistiske nivåer 2 Semantikk 3 studiet av betydning slik det uttrykkes gjennom språk betydning

Detaljer

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning INF2820 Datalingvistikk 14. januar 2018 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time:

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 13 april, 2015 LINGVISTISKE NIVÅER SEMANTIKK studiet av betydning slik det uttrykkes gjennom språk betydning til morfemer, ord,

Detaljer

INF1820: Oppsummering

INF1820: Oppsummering Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 24 april, 2017 1 Semantisk språkteknologi Lingvistiske nivåer 2 Semantikk studiet av betydning slik det uttrykkes

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 24 april, 2017 1 Semantisk språkteknologi Lingvistiske nivåer 2 Semantikk studiet av betydning slik det uttrykkes

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning INF2820 Datalingvistikk V2014 Jan Tore Lønning INF2820 Datalingvistikk 19. januar 2014 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker

Detaljer

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning INF2820 Datalingvistikk 16. januar 2017 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære

Detaljer

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning INF2820 Datalingvistikk V2015 Jan Tore Lønning INF2820 Datalingvistikk 21. januar 2015 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker

Detaljer

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon OBS: Lov å stille spørsmål underveis Forelesninger

Detaljer

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon 1. Hvorfor datalingvistikk? 2. Hva er utfordringene?

Detaljer

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning INF2820 Datalingvistikk V2016 Jan Tore Lønning INF2820 Datalingvistikk 20. januar 2016 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære språk OBS: Lov å

Detaljer

LF - Eksamen i INF1820

LF - Eksamen i INF1820 LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #12

IN1140: Introduksjon til språkteknologi. Forelesning #12 IN1140: Introduksjon til språkteknologi Forelesning #12 Lilja Øvrelid Universitetet i Oslo 15 november 2018 Tema for i dag 2 I dag Repetisjon Digital prøveeksamen Neste uke Gjennomgang av eksamensoppgave

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning Lilja Øvrelid 23 april, 2012 SEMANTIKK Studiet av betydning slik det uttrykkes gjennom språk Betydning til morfemer, ord,

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 13 april, 2015 LINGVISTISKE NIVÅER SEMANTIKK studiet av betydning slik det uttrykkes gjennom språk betydning til morfemer, ord,

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Ellevte forelesning Lilja Øvrelid 26 mars, 2012 1 / 48 FORMELLE MODELLER Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1 IN1140: Introduksjon til språkteknologi Forelesning #1 Erik Velldal Universitetet i Oslo 22. august 2017 Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper Obliger

Detaljer

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #13

IN1140: Introduksjon til språkteknologi. Forelesning #13 IN1140: Introduksjon til språkteknologi Forelesning #13 Samia Touileb Universitetet i Oslo 22. november 2018 Vinnerne av obligkonkurransen 2 De har scoret flest oblig-poeng igjennom semesteret (av maksimalt

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

Introduksjon. MAT1030 Diskret Matematikk. Introduksjon. En graf. Forelesning 22: Grafteori. Roger Antonsen

Introduksjon. MAT1030 Diskret Matematikk. Introduksjon. En graf. Forelesning 22: Grafteori. Roger Antonsen MAT1030 Diskret Matematikk Forelesning 22: Grafteori Roger Antonsen Institutt for informatikk, Universitetet i Oslo Introduksjon 21. april 2009 (Sist oppdatert: 2009-04-21 15:13) MAT1030 Diskret Matematikk

Detaljer

Introduksjon. MAT1030 Diskret matematikk. Søkealgoritmer for grafer. En graf

Introduksjon. MAT1030 Diskret matematikk. Søkealgoritmer for grafer. En graf Introduksjon MAT13 Diskret matematikk Forelesning 21: Grafteori Roger Antonsen Matematisk Institutt, Universitetet i Oslo 9. april 28 Vi skal nå over til kapittel 1 & grafteori. Grafer fins overalt rundt

Detaljer

MAT1030 Diskret matematikk

MAT1030 Diskret matematikk MAT1030 Diskret matematikk Forelesning 21: Grafteori Roger Antonsen Matematisk Institutt, Universitetet i Oslo 9. april 2008 Introduksjon Vi skal nå over til kapittel 10 & grafteori. Grafer fins overalt

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 4. mai 2010 (Sist oppdatert: 2010-05-04 14:11) Forelesning 27 MAT1030 Diskret Matematikk 4. mai 2010

Detaljer

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF 2820 V2015: Obligatorisk innleveringsoppgave 3 INF 2820 V2015: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 17.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Del 1 RD Parsing Oppgave 1:

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 13. gang, 10.4.2014 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 1 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

MAT1030 Forelesning 22

MAT1030 Forelesning 22 MAT1030 Forelesning 22 Grafteori Roger Antonsen - 21. april 2009 (Sist oppdatert: 2009-04-21 15:13) Introduksjon Introduksjon Vi skal nå over til kapittel 10 & grafteori. Grafer fins overalt rundt oss!

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 1: INTRODUKSJON Roger Antonsen Institutt for informatikk Universitetet i Oslo 19. august 2008 (Sist oppdatert: 2008-09-03 12:35) Velkommen til INF1800! Introduksjon

Detaljer

Forelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28)

Forelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28) MAT1030 Diskret Matematikk Forelesning 27: Trær Roger Antonsen Institutt for informatikk, Universitetet i Oslo Forelesning 27 6. mai 2009 (Sist oppdatert: 2009-05-06 22:28) MAT1030 Diskret Matematikk 6.

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2017 6. Gang - 20.2 Jan Tore Lønning I dag Kontekstfrie grammatikker og naturlige språk (fortsatt fra sist) Kontekstfrie grammatikker og regulære språk Grammatikker og trær i NLTK

Detaljer

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tiende forelesning Lilja Øvrelid 20 mars, 2014 1 / 51 FORMELLE MODELLER kan representere den språklige kunnskapen v.hj.a et lite antall formelle

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1 IN1140: Introduksjon til språkteknologi Forelesning #1 Lilja Øvrelid Universitetet i Oslo 23. august 2018 Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 20 mars, 2017 1 Formelle modeller Kan fange inn den språklige kunnskapen v.hj.a et lite antall formelle modeller

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #8

IN1140: Introduksjon til språkteknologi. Forelesning #8 IN1140: Introduksjon til språkteknologi Forelesning #8 Samia Touileb Universitetet i Oslo 18. oktober 2017 Forrige uke 2 Syntaks Tema for i dag 3 Midtveisevaluering IN1140, høst 2018 Kontekstfrie grammatikker

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2016 13. gang, 20.4.2016 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

Ifis bachelorundervisning fra 2017

Ifis bachelorundervisning fra 2017 Ifis bachelorundervisning fra 2017 En rapport fra Sundvollen-konferansen 2015 Dag Langmyhr 1 1 Planlegging av bachelorprogrammene Første «prosjekt» var å planlegge den fremtidige 3-årige bachelorutdanningen

Detaljer

MAT1030 Diskret matematikk

MAT1030 Diskret matematikk MAT1030 Diskret matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 30. april 2008 Oppsummering Mandag så vi på hvordan vi kan finne uttrykk og termer på infiks form,

Detaljer

Forelesning 25. MAT1030 Diskret Matematikk. Litt repetisjon. Litt repetisjon. Forelesning 25: Trær. Roger Antonsen

Forelesning 25. MAT1030 Diskret Matematikk. Litt repetisjon. Litt repetisjon. Forelesning 25: Trær. Roger Antonsen MAT1030 Diskret Matematikk Forelesning 25: Trær Roger Antonsen Institutt for informatikk, Universitetet i Oslo Forelesning 25 29. april 2009 (Sist oppdatert: 2009-04-29 00:28) MAT1030 Diskret Matematikk

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 6. juni 2014 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0

Detaljer

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt Her kan jeg godt si litt om meg selv. Arne Skjærholt adhyāyaḥ prathamaḥ Arne Skjærholt adhyāyaḥ prathamaḥ Faget Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder,

Detaljer

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF 2820 V2016: Innleveringsoppgave 3 del 1 INF 2820 V2016: Innleveringsoppgave 3 del 1 Pga tekniske problemer er oppgaveteksten delt i to. Dette er første del. Andre del legges ut mandag 13.3! Besvarelsene skal leveres i devilry innen fredag 24.3

Detaljer

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda Arne Skjærholt Lectio secunda Arne Skjærholt Lectio secunda Python/NLTK En del grunner til at vi foretrekker Python over Java For det første er NLTK i Python, ikke Java Det er en ganske viktig grunn =)

Detaljer

Skanning del I. Kapittel 2 INF 3110/ INF

Skanning del I. Kapittel 2 INF 3110/ INF Skanning del I Kapittel 2 18.01.2013 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.

Detaljer

Forelesning 25. MAT1030 Diskret Matematikk. Litt repetisjon. Litt repetisjon. Forelesning 25: Trær. Dag Normann

Forelesning 25. MAT1030 Diskret Matematikk. Litt repetisjon. Litt repetisjon. Forelesning 25: Trær. Dag Normann MAT1030 Diskret Matematikk Forelesning 25: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo Forelesning 25 27. april 2010 (Sist oppdatert: 2010-04-27 14:16) MAT1030 Diskret Matematikk 27. april

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2016 6. Gang - 24.2 Jan Tore Lønning PARSING DEL 1 2 I dag Hva er parsing? Høyre- og venstreavledninger Recursive-Descent parser (top-down) Shift-Reduce parser (bottom-up) Pythonimplementasjon:

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 25: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 27. april 2010 (Sist oppdatert: 2010-04-27 14:15) Forelesning 25 MAT1030 Diskret Matematikk 27. april

Detaljer

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning INF2820 Datalingvistikk V2018 10. Gang, del 2 19.3 Jan Tore Lønning TEKSTKLASSIFISERING 2 I dag: tekstklassifisering Tekstklassifisering og maskinlæring Eksempel: NLTK "Names" Ekseperimentelt oppsett 1

Detaljer

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt NF1820 NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ Her kan jeg godt si litt om meg selv NF1820 Arne Skjærholt adhyāyaḥ prathamaḥ NF1820 Emnet gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske

Detaljer

INF 2820 V2016: Innleveringsoppgave 3 hele

INF 2820 V2016: Innleveringsoppgave 3 hele INF 2820 V2016: Innleveringsoppgave 3 hele Dette er det komplette settet! Besvarelsene skal leveres i devilry innen fredag 24.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil

Detaljer

Kapittel 3: Litt om representasjon av tall

Kapittel 3: Litt om representasjon av tall MAT1030 Diskret Matematikk Forelesning 3: Litt om representasjon av tall Dag Normann Matematisk Institutt, Universitetet i Oslo Kapittel 3: Litt om representasjon av tall 26. januar 2010 (Sist oppdatert:

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En

Detaljer

Syntax/semantics - I INF 3110/ /29/2005 1

Syntax/semantics - I INF 3110/ /29/2005 1 Syntax/semantics - I Program program execution Compiling/interpretation Syntax Classes of langauges Regular langauges Context-free langauges Scanning/Parsing Meta models INF 3/4-25 8/29/25 Program

Detaljer

Uke 10 TID MANDAG TIRSDAG ONSDAG TORSDAG FREDAG. Uke 11 TID MANDAG TIRSDAG ONSDAG TORSDAG FREDAG. Informasjon. Uke 10 UKE 11

Uke 10 TID MANDAG TIRSDAG ONSDAG TORSDAG FREDAG. Uke 11 TID MANDAG TIRSDAG ONSDAG TORSDAG FREDAG. Informasjon. Uke 10 UKE 11 Uke 10 TID MANDAG TIRSDAG ONSDAG TORSDAG FREDAG 0815-0900 Matte Naturfag Matte/eng. Norsk Engelsk 0900-0945 Sam-fag Naturfag Matte/eng. Språk Matte 1000-1045 GAP Språk GAP Naturfag GAP 1045-1130 GAP Språk

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 4: UTSAGNSLOGIKK Roger Antonsen Institutt for informatikk Universitetet i Oslo 27. august 2008 (Sist oppdatert: 2008-09-03 12:39) Før vi begynner Praktiske opplysninger

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2015 6. Gang - 23.2 Jan Tore Lønning PARSING DEL 1 2 I dag Høyre- og venstreavledninger Recursive-descent parser (top-down) Begynne Shift-reduce parser (bottom-up) 25. februar

Detaljer

INF 2820 V2016: Obligatorisk innleverinsoppgave 1

INF 2820 V2016: Obligatorisk innleverinsoppgave 1 INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa

Detaljer

Skanning del I INF /01/15 1

Skanning del I INF /01/15 1 Skanning del I INF 5110-2015 21/01/15 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: Programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #7

IN1140: Introduksjon til språkteknologi. Forelesning #7 IN1140: Introduksjon til språkteknologi Forelesning #7 Lilja Øvrelid Universitetet i Oslo 11 oktober 2018 Tema for i dag 2 Forrige uke Ordklasser Ordklassetagging Oblig2a: språkmodeller (frist: 17/9) I

Detaljer

INF1820: Ordklassetagging

INF1820: Ordklassetagging NF1820: Ordklassetagging NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Ordklassetagging Never gonna give you up Never gonna let

Detaljer

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019 Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019 Tid: 09:15 16:00 sted: Ole-Johan Dahls hus Tilstede: Joakim Nivre, Lilja Øvrelid (LTG, vara), Jan Tore Lønning (programrådsleder),

Detaljer

Kombinatorikk. MAT1030 Diskret Matematikk. Oppsummering av regneprinsipper

Kombinatorikk. MAT1030 Diskret Matematikk. Oppsummering av regneprinsipper MAT1030 Diskret Matematikk Forelesning 22: Grafteori Dag Normann Matematisk Institutt, Universitetet i Oslo Kombinatorikk 14. april 2010 (Sist oppdatert: 2010-04-14 12:43) MAT1030 Diskret Matematikk 14.

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 22: Grafteori Dag Normann Matematisk Institutt, Universitetet i Oslo 14. april 2010 (Sist oppdatert: 2010-04-14 12:42) Kombinatorikk MAT1030 Diskret Matematikk 14.

Detaljer

Ifis forslag til reviderte studieprogrammer

Ifis forslag til reviderte studieprogrammer Ifis forslag til reviderte studieprogrammer Andre utkast 10. desember 2015 Innledning Dette er andre versjon («β-versjonen») av Ifis forslag til våre nye bachelorprogrammer. Det skal behandles i UU 17.

Detaljer

Definisjonene og forklaringene i denne presentasjonen er hentet fra eller basert på kap. 1 (Kristoffersen: «Hva er språk?

Definisjonene og forklaringene i denne presentasjonen er hentet fra eller basert på kap. 1 (Kristoffersen: «Hva er språk? Definisjonene og forklaringene i denne presentasjonen er hentet fra eller basert på kap. 1 (Kristoffersen: «Hva er språk?») og 13 (Ryen: «Fremmedspråksinnlæring») i pensumboka SPRÅK. EN GRUNNBOK, Universitetsforlaget

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1 IN1140: Introduksjon til språkteknologi Forelesning #1 Lilja Øvrelid Universitetet i Oslo 23. august 2018 Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk

Detaljer

INF 4130. 8. oktober 2009. Dagens tema: Uavgjørbarhet. Neste uke: NP-kompletthet

INF 4130. 8. oktober 2009. Dagens tema: Uavgjørbarhet. Neste uke: NP-kompletthet INF 4130 8. oktober 2009 Stein Krogdahl Dagens tema: Uavgjørbarhet Dette har blitt framstilt litt annerledes tidligere år Se Dinos forelesninger fra i fjor. I år: Vi tenker mer i programmer enn i Turing-maskiner

Detaljer

MAT1030 Forelesning 25

MAT1030 Forelesning 25 MAT1030 Forelesning 25 Trær Dag Normann - 27. april 2010 (Sist oppdatert: 2010-04-27 14:16) Forelesning 25 Litt repetisjon Vi har snakket om grafer og trær. Av begreper vi så på var følgende: Eulerstier

Detaljer

Scanning - I Kap. 2. Hva scanneren gjør

Scanning - I Kap. 2. Hva scanneren gjør Scanning - I Kap. 2!! Hovedmål! Gå ut fra en beskrivelse av de enkelte tokens, og hvordan de skal deles opp i klasser! Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med all

Detaljer

MAT1030 Forelesning 22

MAT1030 Forelesning 22 MAT1030 Forelesning 22 Grafteori Dag Normann - 14. april 2010 (Sist oppdatert: 2010-04-14 12:45) Kombinatorikk Oppsummering av regneprinsipper Ordnet utvalg med repetisjon: n r Ordnet utvalg uten repetisjon:

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational

Detaljer

Tekstmining: En kort innføring

Tekstmining: En kort innføring www.nr.no Tekstmining: En kort innføring Pierre Lison Seniorforsker, NR Norsk evalueringsforening 30.08.2018 Litt om NR Et forskningsinstitutt (privat stiftelse) Utfører oppdragsforskning for både næringsliv

Detaljer

MAT1030 Forelesning 3

MAT1030 Forelesning 3 MAT1030 Forelesning 3 Litt om representasjon av tall Dag Normann - 26. januar 2010 (Sist oppdatert: 2010-01-26 14:22) Kapittel 3: Litt om representasjon av tall Hva vi gjorde forrige uke Vi diskuterte

Detaljer

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags

Detaljer

Hva er kunstig intelligens og maskinlæring? Cathrine Pihl Lyngstad 18. Oktober 2018

Hva er kunstig intelligens og maskinlæring? Cathrine Pihl Lyngstad 18. Oktober 2018 Hva er kunstig intelligens og maskinlæring? Cathrine Pihl Lyngstad 18. Oktober 2018 Agenda Hva er AI og ML? Hvor står teknologien? Anvendelsesområder (i offentlig forvaltning) Hva gjør vi konkret i AI

Detaljer

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

INF2820 V2017 Oppgavesett 5 Gruppe 21.2 INF2820 V2017 Oppgavesett 5 Gruppe 21.2 Denne uka er det først noen teoretiske oppgaver. Deretter er det en del praktiske arbeidsoppgaver som vil forberede deg til arbeidet med innleveringsoppgavesett

Detaljer