INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning
|
|
- Torfinn Tønnessen
- 7 år siden
- Visninger:
Transkript
1 INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning
2 I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 2
3 Naturlige språk som formelle språk Et formelt språk består av: En endelig mengde A Ø En delmengde L A* Eksempel 3 A = mengden av alle former av alle ord i Bokmålsordboka A* = mengden av alle sekvenser av slike ord L = mengden av de strengene fra A* vi anser som grammatiske norske setninger Eksempel 4 A = {a, b, c,, æ, ø, å} A* = {, a, b, c, aa, ab, ac, ba,, cccc,, datalingvistikk, } Det er mer struktur i naturlige språk enn det som fanges i definisjonen av formelle språk L = mengden av de bokstavstrengene vi ser på som norske ord. Eksempel 5 A = {a, b, c,, æ, ø, å, \blank, \.} L = mengden av de strengene vi ser på som norske setninger. 3. februar
4 Setning Fraser NP, VP, PP NP S VP NP VP V AP N P Struktur PP NP Syntaks Struktur over ordnivå Morfem angripe lig u e/pl Hun studerer uangripelige IT-systemer ved UiO u+angripe+lig+e V Adj PL Adj Adj_pl Morfologi Ordenes struktur 3. februar
5 Mer substruktur unassailable Morfologi un+assail+able V unassailable /ʌnəˈseɪləb(ə)l/ Fonologi+ fonetikk Adj Adj I ethvert språk er det et lite antall lyder som alle ord er bygget opp fra I tekster forholder vi oss til tegn For noen språk er skrift en refleksjon av lydene Men f.eks. ikke for kinesisk Mange flere skrifttegn enn lyder 3. februar
6 Ord (i naturlige språk) En mann kjøpte en bil av en mann som hadde eid bilen i tjue år. Hvor mange ord? 3. februar
7 Ord (i naturlige språk) En mann kjøpte en bil av en mann som hadde eid bilen i tjue år. In [10]: text="en mann kjøpte en bil av en mann som hadde eid bilen i tjue år".split() In [11]: len(text) Out[11]: 15 In [12]: len(set(text)) Out[12]: 13 In [13]: len(set(w.lower() for w in text)) Out[13]: februar
8 Ord (i naturlige språk) En mann kjøpte en bil av en mann som hadde eid bilen i tjue år. Hvor mange forskjellige ord (types)? 3. februar
9 Ord (i naturlige språk) En mann kjøpte en bil av en mann som hadde eid bilen i tjue år. Hvor mange forskjellige ord (types)? 12 ord(former) 11 leksem Ett leksem 4 ulike former av samme leksem Ett lemma (siteringsform) mann mannen menn mennene N, sg, indef N, sg, def N, pl, indef N, pl, def 3. februar
10 Utfordringer En murer murer murer. Hvor mange ordformer: 2 eller 4? Lemma en Det murer N mask sing indef murer murer V pres mure murer N mask pl indef mur 10
11 Utfordring Kari ga Ola bank. Kari satte pengene i en bank. bank, N, sg, indef To forskjellige ord eller ett? Mest naturlig å tenke på dette som to forskjellige ordformer av to forskjellige leksemer (homonymi) Men noen systemer behandler dem som et leksem med flere betydninger (polysemi) (eks. WordNet) 3. februar
12 Ordklasser/ Part of speech N V N Jenta spiste eplet N V jenta, gutten, potetene, sola,.. spiste, så, likte, kastet, (Forenklet:) Ord av samme klasse kan erstatte hverandre: Gutten spiste eplet. Jenta så potetene. Ord av forskjellige klasser kan ikke alltid erstatte hverandre: *Gutten jenta potetene. *Spiste så potetene. 3. februar
13 Noen ordklasser Klasse ( Category ) Underklasser Eksempler V verb kastet, spiser, løper, er, N nomen, substantiv, noun Fellesnavn, common noun, CN Egennavn, proper name jenta, gutter, barna, potetene, Per, Kari, Michelle, Bill, A adjektiv pen, snill, godt P preposisjon på, under, ved, Det Determinativ en, enhver, noen, ingen, Pronomen Adverb jeg, du, oss, min, Ikke, derfor, ofte, 3. februar
14 Ordklasser fortsatt Flere ordklasser: Interjeksjon: ja, æsj, hurra,.. Konjunkjson: og, eller,.. Subjunksjon: at, hvis, fordi, Litt ulike forslag til Ordklasser inkl. antall Kriterier for klassifikasjon, og følgelig hvilken klasse en del ord faller i Skille Åpne klasser: N, V, Adj, Adv, Int Lukkede: Pro, Prep, Conj., Subj. 14
15 Ordform - trekk En fullform av et ord vil ha en del trekk ( features ) Noen av disse er inherente og felles for alle former av et leksem: Svarer til undeklasser av ordklassene Kjønn/ gender for substantiv Jente/jenta/jenter/jentene er femininum Transitivitet(stype) for verb Kaste/kaster/kastet/kast tar nomen-komplementet Vite/vet/visste/visst tar komplementsetning (at ) Andre er spesifikke for formen av ordet, Bestemthet, tall for substantiv, form og tid for verb Kjønn for adjektiv 3. februar
16 I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 16
17 Morfologi To perspektiv: Ords oppbygning Danning av ord 1. Bøyning, infleksjon Ulike former av samme leksem 2. Avledning, derivasjon quick quickly 3. Ordsammensetning Hjernehinnebetennelse 4. Klitika 17
18 Oppbygning u+angripe+lig+e V Adj PL Adj Adj_pl Morfem: minste meningsbærende enhet Stamme: angripe Prefix: u- Suffix: -lig, -e Andre språk også: infix, circumfix 18
19 1.Bøyning/( inflection ): substantiv N, substantiv Entall Flertall Ubestemt Bestemt Ubestemt Bestemt gutt gutten gutter guttene jente jenta jenter jentene barn barnet barn barna En linje er et leksem Lemma = ubestemt entallsformen Abstrakt trekk Ubest+flertall Bestemt entall, neut Bestemt entall, fem Bestemt, flertall, neut Skille Realisering er,, 3. februar et a a, ene
20 1.Bøyning/( inflection ): verb V, verb infinitiv presens preteritum perfektum imperativ kaste kaster kastet kasta bygge bygger bygde bygget kastet kasta bygd bygget kast bygg gå går gikk gått gå En linje er et leksem Lemma = infinitivsformen Abstrakt trekk presens Skille Realisering er, preteritum et, de, et, 3. februar
21 Eksempel: spansk (wikipedia) Fortid-nåtid-fremtid Entall: 1. pers, 2.pers, 3.pers Flertall 1. pers, 2.pers, 3.pers 21
22 Bøyning Regulær: Bil-bilen-biler-bilene Kaste-kaster-kastet-kastet Irregulær: Gås-gåsa-gjess-gjessene Gå-går-gikk-gått 3. februar
23 2. Avledning-derivasjon Kombinere en ordstamme med et grammatisk morfem Ofte gir det ny ordklasse V, verb infinitiv Adjektiv, avledning Substantiv, avledning Substantiv, avledning Substantiv, avledning u+angripe+lig+e V Adj PL ende ing er Adj kaste kastende kasting (en) kaster (et) kast Adj_pl bygge byggende bygging (et) bygg gå gående gåing 3. februar
24 3. Sammensetning Et sammensatt ord får egenskaper fra siste leddet god: Adj + snakke:v godsnakke: V fiske: V + konkurranse: N fiskekonkurranse: N 3. februar
25 4. Klitika Ikke hele ord. Fungerer morfologisk som affikser, men syntaktisk som ord Mary s car I ve done that Jeg slo n i bordtennis Dronningen av Englands hund 25
26 Lyd- og skriftendringer Ved bøyning og avledning er det ikke bare å henge på endelser kiste: N + -en: sg,def kisten (ikke kisteen) vill: Adj + -t: Neut vilt (ikke villt) Osv. Også lyd-/skriftendringer ved sammensetning vin + glass vinglass rødvin + glass rødvinsglass 26
27 I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 27
28 Prosessering Analyse: Gitt en ordforekomst, eks gikk eller uangripelig, finn: Lemma (eller leksem) for å behandle ordets mening gikk gå, uangripelige uangripelig Morfologiske trekk for å se hvordan ordet passer med omgivelsene gikk: V, pret, uangripelige: Adj, pl Evt. interessert i om det er avledet (for semantikk) u-angripelige Syntese: Gitt lemma (leksem) og morfologiske trekk, generer form gå, V, pret gikk 28
29 Leksikon Vi trenger et leksikon. To alternativ: Fullformsleksiokon: Alle ordformer er listet med lemma/leksem og trekk: Gikk, V, pret, gå Leksemleksikon Til hvert leksem er det et lemma og (tilgang til) regler for å generer alle former med info Eks: for kaste holder det i leksikon at det er verb og regulær bøyning For gå må vi liste opp formene 29
30 Leksemleksikon eller fullformsleksikon? Tidligere tider måtte en ha leksemleksikon pga av plassbehov på datamaskinen I dag er det vanlig å bruke fullformsleksikon for språk som engelsk og norsk 30
31 Behov for morfologiske prosessr For språk med en rik morfologi f.eks. Finsk former av et verb Tyrkisk former av et verb kan vi ikke lagre alle former. Trenger regler. Tonivåmorfologien beskrevet i J&M en tilnærming for disse språkene 31
32 Tonivåmorfologien Ikke detaljer pga. Manglende programvare Ikke så relevant for norsk og engelsk Utilstrekkelig beskrivelse i boka 2/3/2017 Speech and Language Processing - Jurafsky and Martin 32
33 Leksikon for norsk For norsk kan vi bruke et fullformsleksikon for bøyning, dvs. alle kjente former av all kjente ord Men vi trenger noe mer Avledete ord vil kunne være representert i fullformsleksikonet, men det kan dannes nye Nye sammensatte ord Nye ord, disse kan også forsøkes analysert morfologisk ut i fra sammenhengen 33
34 Flertydigheter En morfologisk analysator som virker på enkeltord utenfor kontekst vil være flertydig Flertydighet er en utfordring for all språkprosessering Lemma murer N mask sing indef murer murer V pres mure murer N mask pl indef mur 34
35 I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 35
36 Arbeid med tekst Setningssegmentering Tokenisering Xvxvxvxvxvxvxvxvxvxvxvxvxv Xvxvxvxvxvxvxvxvxvxvx Xycxycxcycvdferefdvdferdf Nfnfnf Wgwgwgwgwg Wgwgwgwgwgwgwgwgwg Whhhhh Wgwgwgw Whwhwhwhwhwhwhwhwhhwhw Whwhwhhwwh Whhhhh Whhhhhhhhh whhhhhhhhhhhhhhh Xvxvx vxv xvxv xvxvx vxv xv xvxv Xvxvxvxvxvxvxvxvxvxvx Xycxyc xcy cvd fe ref dv df erdf Nfn fnf Wg wg wg wg wg Wgwgwg wgwg wgwg wgwg Whh hhh Whh hhh 36
37 Setningssegmentering ``Hvor vanskelig er det? : ``Bare del ved:.!? Hva med forkortelser? ``OK, ikke del etter forkortelser Men hva hvis forkortelsen kommer sist I en setning? Hva med innskutte setninger lurte Ola? Problemet er ikke så trivielt som det kan høres ut. 37
38 Tokenisering Dele opp en streng i en liste av ord. Høres enkelt ut, i Python In [10]: text="en mann kjøpte en bil av en mann som hadde eid bilen i tjue år".split() Men er det alltid så enkelt? For example, this isn t a well-formed example. Hvordan dele? 1. For example, this is n t a well-formed example. 2. For example, this isn t a well- formed example. 3. for example this is not a well-formed example (1) is Penn TreeBank-style (PTB) (2) is English Resource Grammar-style (ERG) 38
39 Tokenisering noen valg 1. For example, this is n t a well-formed example. 2. For example, this isn t a well- formed example. 3. for example this is not a well-formed example Skilletegn: (1) eget token, (2) del av ordet foran, (3) fjernet isn t, doesn t etc.: (1) dele, (2) beholde, (3) normalisere Norsk: skakke, vikke, måkke, bøkke, (Ikke i tekst, men i transkribert tale) Flerordsuttrykk: (2) en token, (1,3) en token per ord Bindestrek: Hvor skal vi dele? Case folding (lowercasing) eller ikke 39
40 Tokenisering spesielle tokens Desimaltalluttrykk Klokkeslett URL E-postadresser Forkortelser... 40
41 Metoder Setningssegmentering Maskinlæring Tokenisering Regulære uttrykk (Se på oppgaver) 3. februar
42 Hvordan tokenisere? Billigste i Python: words = s.split() Hvis vi heller vil ha example enn example. clean_words = [w.strip(.,:;?! ) for w in words] For å beholde. som en token krever mer. I NLTK for engelsk words = nltk.word_tokenize(s) Hvordan vil denne tokenisere ``for example -setning? Obs ikke optimal for norsk. 42
43 Tekst i NLTK In [36]: raw='this item consists of several sentences. It should be illustrative' In [37]: sents = nltk.sent_tokenize(raw) In [38]: for i in sents: print(i) This item consists of several sentences. It should be illustrative In [39]: tokenized = [nltk.word_tokenize(s) for s in sents] In [40]: tokenized Out[40]: [['This', 'item', 'consists', 'of', 'several', 'sentences', '.'], ['It', 'should', 'be', 'illustrative']] 3. februar
44 Tekstnormalisering Søk Søk1: regjeringen foreslo Søk2: regjeringen foreslår Får vi det samme? For mange oppgaver ønsker vi at foreslo skal være det samme som foreslå Lemmatisering: Skifter en ordform med lemmaet svarende til leksemet Kan gjøres hvis vi har en morfologisk analysator. Men som eksempelet med murer viser: Prosessen er ikke entydig med mindre vi gjør noe mer Parsing eller tagging eller Velger første ller den mest frekvente 44
45 Stemming Forsøk på å finne stammen i ord uten leksikon (stamme er ikke alltid det samme som lemma) Forenklet lemmatisering Brukes i søkemotorer In [50]: norsk_stem = nltk.snowballstemmer('norwegian') In [52]: norsk_stem.stem('murer') Out[52]: 'mur' In [53]: norsk_stem.stem('uangripelige') Out[53]: 'uangrip In [55]: norsk_stem.stem('foreslo') Out[55]: 'foreslo' 45
INF2820 Datalingvistikk V2018 Forelesning 4, 5.2 Jan Tore Lønning
INF2820 Datalingvistikk V2018 Forelesning 4, 5.2 Jan Tore Lønning I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 2 Naturlige språk som
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
Detaljer2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.
INF2820 Datalingvistikk V2012 Jan Tore Lønning Begrensninger ved regulære Regulære er ikke ideelle modeller for naturlige, dvs Verken regulære uttrykk eller NFA er ideelle for å beskrive naturlige fordi:
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning BEGRENSNINGER VED REGULÆRE SPRÅK OG KONTEKSTFRIE GRAMMATIKKER 2 I dag 1. Begrensninger ved regulære språk 2. Noen egenskaper ved naturlige språk 3. Kontekstfrie
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2017 5. Gang - 13.2 Jan Tore Lønning I dag Tekstnormalisering: lemmatisering og «stemming» Tagget tekst og tagging Begrensninger ved regulære språk Frasestruktur og kontekstfrie
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2018 5. Gang - 12.2 Jan Tore Lønning I dag Tokenisering, lemmatisering og «stemming» Tagget tekst og tagging Begrensninger ved regulære språk Frasestruktur og kontekstfrie grammatikker
DetaljerINF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning
INF2820 Datalingvistikk V2015 Forelesning 4, 9.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Begrensninger ved regulære språk Regulære uttrykk: teoretiske og praktiske Noen egenskaper
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 19. januar 2014 2 Naturlige språk En mann kjøpte en bil av en mann som hadde eid bilen i
DetaljerINF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning
INF2820 Datalingvistikk V2014 Forelesning 4, 6.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Regulære uttrykk: teoretiske og praktiske Begrensninger ved regulære språk Noen egenskaper
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2012 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 17. januar 2012 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerINF1820 INF1820 2013-02-14. Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon µορφή - form λόγος - lære Morfologi er det laveste meningsbærende nivået i språk. Fonologi og fonetikk er lavere nivåer, men de er ikke meningsbærende
DetaljerINF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK 19. januar 2017 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En
DetaljerINF 2820 V2016: Innleveringsoppgave 3 del 1
INF 2820 V2016: Innleveringsoppgave 3 del 1 Pga tekniske problemer er oppgaveteksten delt i to. Dette er første del. Andre del legges ut mandag 13.3! Besvarelsene skal leveres i devilry innen fredag 24.3
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 26. januar 2011 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerNorsk minigrammatikk bokmål
Norsk minigrammatikk bokmål Ordklassene Substantiv Adjektiv Artikler Pronomen Tallord Verb Adverb Konjunksjoner Preposisjoner Interjeksjoner ORDKLASSENE Den norske grammatikken inneholder ti ordklasser:
DetaljerINF 2820 V2018: Innleveringsoppgave 2
INF 2820 V2018: Innleveringsoppgave 2 Besvarelsene skal leveres i devilry innen fredag 2.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil
DetaljerMorfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1
Morfologi Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting EXFAC EURA 2. Morfologi1 1 Setninger består av ord (grupper av ord) Ord har struktur: les-te, en god les-er -te: bøyning
DetaljerINF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar
Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 1
INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa
DetaljerINF1820: Oppsummering
Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til
DetaljerINF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning
INF2820 Datalingvistikk V2018 10. Gang 19.3 del 1 Jan Tore Lønning I dag: to deler A. Active chart-parsing Fortsatt fra sist B. Tekstklassifisering 2 CHART-PARSING 3 I dag chart-parsing Chart-parsing:
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femte forelesning Arne Skjærholt 25 januar, 2012 MORFOLOGI µορφή (morph ē) - form λόγος (lógos) - lære MORFOLOGI µορφή (morph ē) - form λόγος
DetaljerGrammatikk En innføring av Anne Lene Berge
Grammatikk En innføring av Anne Lene Berge Det er vanlig å dele et språksystem inn i fire hoveddeler: fonologien, som beskriver lydsystemet, morfologien, som gjør greie for hvordan ord er bygd opp og hvordan
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen KONTEKSTFRIE GRAMMATIKKER OG PARSING 22. februar 2011 2 I dag Avledninger og normalformer Parsing: ovenifra og ned (top-down) Parsing: nedenifra
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 2
INF 2820 V2016: Obligatorisk innleverinsoppgave 2 Besvarelsene skal leveres i devilry innen torsdag 17.3 kl 18.00 Filene det vises til finner du på o /projects/nlp/inf2820/scarrie o /projects/nlp/inf2820/cfg
DetaljerSlides til 12.1 Formelt språk og formell grammatikk
Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen
DetaljerINF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les
Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer
DetaljerINF 2820 V2016: Innleveringsoppgave 3 hele
INF 2820 V2016: Innleveringsoppgave 3 hele Dette er det komplette settet! Besvarelsene skal leveres i devilry innen fredag 24.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerINF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning
INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning INF2820 Datalingvistikk 19. januar 2014 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning INF2820 Datalingvistikk 21. januar 2015 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker
DetaljerINF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning
INF2820 Datalingvistikk V2017 9. Gang 13.3 Jan Tore Lønning I dag chart-parsing Fortsatt fra sist: Chart-parsing: hovedideer BU chart-parsing: algoritmen NLTKs ChartParser Enkel Python-implementasjon av
DetaljerINF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция
Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2015 5. Gang - 16.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker
DetaljerUKE TEMA SKRIVE GRAMMATIKK VERK ARBEIDMETODER. flertall
ÅRSPLAN I NORSK FOR GO1 01-01 UKE TEMA SKRIVE GRAMMATIKK VERK ARBEIDMETODER -5 Bli kjent 1. Presentasjon Substantiv: egennavn og. Fortell om en fellesnavn, entall og kap. 1 matrett flertall På norsk- 6-7
DetaljerINF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK, DEL 2 19. januar 2017 2 Sist uke: FSA Brukes om hverandre: Finite state automaton - FSA
DetaljerINF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning
INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj
DetaljerINF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning
INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsingalgoritmen Algoritmen uttrykt
DetaljerINF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning
INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsing algoritmen Algoritmen uttrykt
DetaljerINF2820 Datalingvistikk V gang, 27.2 Jan Tore Lønning
INF2820 Datalingvistikk V2014 7. gang, 27.2 Jan Tore Lønning I dag Mellomspill: Chomsky Normal Form Tabellparsing: CKY-algoritmen Innlede Chart-Parsing 20. februar 2014 2 Chomsky-normalform (CNF) En grammatikk
DetaljerINF2820 Datalingvistikk V2016. Jan Tore Lønning
INF2820 Datalingvistikk V2016 Jan Tore Lønning INF2820 Datalingvistikk 20. januar 2016 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære språk OBS: Lov å
DetaljerINF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning
INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning INF2820 Datalingvistikk 14. januar 2018 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time:
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 20. januar 2012 2 Non-Determinism Speech and Language Processing - Jurafsky and Martin
DetaljerINF2820 Datalingvistikk V Gang, del Jan Tore Lønning
INF2820 Datalingvistikk V2018 10. Gang, del 2 19.3 Jan Tore Lønning TEKSTKLASSIFISERING 2 I dag: tekstklassifisering Tekstklassifisering og maskinlæring Eksempel: NLTK "Names" Ekseperimentelt oppsett 1
Detaljer. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo
.. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk Sverre Stausland Johnsen Universitetet i Oslo stausland.johnsen@iln.uio.no Universitetet i Stavanger 15. januar
DetaljerUKEPLAN FOR 7A, UKE 23 TIME
UKEPLAN FOR 7A, UKE 23 TIME MANDAG 04.06 TIRSDAG 05.06 ONSDAG Besøksdag fra Nordhus TORSDAG 08.06 FREDAG 09.06 1. FY/ MU Gjennomgang av Årsprøve i norsk Språkboka s. 160: Årsprøve i Låt-prosjektet vurderings-
Detaljer1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon OBS: Lov å stille spørsmål underveis Forelesninger
DetaljerINF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning INF2820 Datalingvistikk 16. januar 2017 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære
DetaljerUKEPLAN FOR 7B, UKE 23 MANDAG TIRSDAG ONSDAG
TIME UKEPLAN FOR 7B, UKE 23 MANDAG TIRSDAG ONSDAG Besøksdag fra Nordhus TORSDAG FREDAG 1. FY/ 2. Gjennomgang av vurderingskriteriene til årsprøven i norsk. Årsprøve i norsk fram til ca. 11.00 /FY Språkboka
DetaljerINF 2820 V2018: Innleveringsoppgave 3
INF 2820 V2018: Innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 23.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerINF2820 Datalingvistikk V Gang 6.3 Jan Tore Lønning
INF2820 Datalingvistikk V2017 8. Gang 6.3 Jan Tore Lønning I dag CKY-algoritmen fortsatt fra sist Python-implementasjon av CKY Chomsky Normal Form (CNF) Chart-parsing BU-algoritme for chart-parsing 3.
DetaljerAPPENDIKS D Geminittisk språk/grammatikk
1 APPENDIKS D Geminittisk språk/grammatikk Jeg har latt overskriften på dette appendikset bli sående i sin opprinnelige form, selv om jeg kun har maktet å gi et nokså usystematisk og mangelfullt innblikk
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2017 6. Gang - 20.2 Jan Tore Lønning I dag Kontekstfrie grammatikker og naturlige språk (fortsatt fra sist) Kontekstfrie grammatikker og regulære språk Grammatikker og trær i NLTK
DetaljerINF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning
INF2820 Datalingvistikk V2015 11. Gang 13.4 Jan Tore Lønning I dag Unifikasjonsgrammatikker Repetisjon og overblikk: Formalisme Lingvistisk anvendelse Utvidelse av lingvistisk anvendelse NLTKs implementering
DetaljerLøsningforslag for obligatorisk innlevering 2 INF2820
Løsningforslag for obligatorisk innlevering 2 INF2820 March 16, 2017 Oppgave 1 NFA START: 0 FINAL: 5 EDGES: 0 # 1 0 'kvart' 3 0 MINUTE 4 1 'halv' 2 1 HOUR 5 2 HOUR 5 3 PRE 2 4 PRE 1 ABRS: HOUR: 'ett',
Detaljer"Det er fort gjort og skrive feil." En presentasjon av en automatisk grammatikkontroll for bokmål
1 av 5 02.06.2010 17:00 "Det er fort gjort og skrive feil." En presentasjon av en automatisk grammatikkontroll for bokmål Av Kristin Hagen og Pia Lane Det siste året har Tekstlaboratoriet ved Universitetet
DetaljerMorfologi. Studiet av ordenes struktur Kap. 11. EXFAC EURA 2. Morfologi1 1
Morfologi Studiet av ordenes struktur Kap. 11 EXFAC EURA 2. Morfologi1 1 Morfologi - Wikipedia Morfologi er læren om former (gresk logos = lære, morpho = form ) og kan referere til: Morfologi (biologi),
DetaljerINF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning
INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning TABELLPARSING OG CHART- PARSING 24. februar 2012 2 I dag Mellomspill: Chomsky Normal Form Tabellparsing: CKY-algoritmen Innlede Chart-Parsing 24. februar
Detaljer2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.
1 Innhold Del 1: Ord og klasser av ord 1 Ord og klasser av ord 9 2 Substantiv 11 2.1 Genus 11 2.2 Bøyning 13 2.3 Substantiv med bare entallsformer 17 2.4 Substantiv med bare flertallsformer 17 2.5 Genitiv
DetaljerNORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1
NORSK ANDRESPRÅKSKORPUS KURSHEFTE ASK, kurshefte Hilde Johansen (2011) 1 KURSHEFTETS INNHOLD 1. Antall ord i ulike delkorpus (testnivå og morsmål) 2. Persondata 3. Feilkoder 4. Oslo-Bergen-taggerens taggsett
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational
Detaljer2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen KONTEKSTFRIE GRAMMATIKKER OG PARSING 22. februar 2011 2 Høyre- og venstreavledninger Til hvert tre svarer det mange avledninger. For kontekstfrie
DetaljerLF - Eksamen i INF1820
LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar
DetaljerINF 2820 V2016: Innleveringsoppgave 2
INF 2820 V2016: Innleveringsoppgave 2 Besvarelsene skal leveres i devilry innen fredag 3.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 20 poeng. Til sammen kan en få inntil
DetaljerKom i gang veiledning
Brukerveiledning Kom i gang veiledning PCS kommunikasjonstavle Art.nr 461333 Rev A NO 2 Innhold 1. PCS kommunikasjonstavle... 5 2. Beskrivelse av sidene i PCS kommunikasjonstavle... 6 Tavle: beskrivelse
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 8. gang, 6.3.2014 Jan Tore Lønning I dag Chart parsing Implementasjon CKY og Chart: Parsing vs anerkjenning 2 Chart alternativ datastruktur (S, [0, 1]) (VP, [0,1]) (Det, [1,2])
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 11. gang, 27.3.2014 Jan Tore Lønning I dag Repetere en del begreper: Trekkstrukturer Unifikasjon og subsumpsjon Trekkbaserte grammatikker Form: to alternative format Tolkning
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon 1. Hvorfor datalingvistikk? 2. Hva er utfordringene?
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 26. januar 2015 2 ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 26. januar 2015
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 6. juni 2014 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0
DetaljerINF1820 INF1820 2013-02-22. Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt
dairoku: del 6, kougi: forelesning Arne Skjærholt 第 六 講 義 Arne Skjærholt 第 六 講 義 Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva
DetaljerINF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning
INF2820 Datalingvistikk V2015 14. Gang 4.5 Jan Tore Lønning CHART PARSING 2 I dag Svakheter ved tidligere parsere RD og SR: ineffektivitet CKY: CNF Chart parsing,,dotted items og fundamentalregelen Algoritmer:
DetaljerSetningsledd. Norsk som fremmedspråk Side 131
Setningsledd Norsk som fremmedspråk Side 131 VERBAL er det viktigste leddet i en setning Det forteller om handlingen, og det sier noe om tiden når den skjer Verbalet kan være et enkelt ord, eller det kan
DetaljerEXFAC EURA Syntaks2 1
EXFAC EURA Syntaks2 1 Språk Noen avvik fra og tillegg til kap. 12 (som ikke skal leses i sin helhet), bedre tilpasset ILOS-fagenes terminologi og språk Mest om form i dag og om verbet Feil i eksemplene?
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 13. gang, 10.4.2014 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk
DetaljerINF5820. Language technological applications. H2010 Jan Tore Lønning
INF5820 Language technological applications H2010 Jan Tore Lønning jtl@ifi.uio.no Maskinoversettelse INF 5820 H2008 Forelesning 2 Machine Translation 1. Some examples 2. Why is machine translation a problem?
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #13
IN1140: Introduksjon til språkteknologi Forelesning #13 Samia Touileb Universitetet i Oslo 22. november 2018 Vinnerne av obligkonkurransen 2 De har scoret flest oblig-poeng igjennom semesteret (av maksimalt
DetaljerInformasjonsgjenfinning
INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 18. september Outline 1 Hva er IR? Tradisjonell evaluering Invertert indeks 2 Rangering Evaluering av rangering 3 Grunnleggende egenskaper Vektorer
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 12. gang, 3.4.2014 Jan Tore Lønning I dag Trekkbaserte grammatikker (unifikasjonsgrammatikker) for naturlige språk NLTKs implementering av slike Litt om lingvistiske modeller
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1 Praktisk Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 SAMMENHENGER FSA OG REGULÆRE UTTRYKK 31. januar
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 22. januar 2014 2 DFA deterministisk endelig maskin Q = {q0, q1, q2,, qn-1} Strengt
DetaljerSjekkliste B2-nivå. 1 Har du brukt stor/liten forbokstav, punktum (.), komma (,) og spørsmålstegn (?) riktig?
Sjekkliste B2-nivå 1 Har du brukt stor/liten forbokstav, punktum (.), komma (,) og spørsmålstegn (?) riktig? 2 Har du subjekt og et bøyd verb i alle setninger? 3 Har du satt ordene på riktig plass i setningene?
DetaljerOrdklasser Inndelingen ORDKLASSEINNDELINGEN
Ordklasser Inndelingen ORDKLASSEINNDELINGEN Hvorfor lære om ordklasser? Viktig del av den grammatiske språkbeskrivelsen Forstå bøyningsmåter skrive korrekt Innsikt i hvordan norsk skiller seg fra andre
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2014 HVOR OG NÅR Tidspunkt: Forelesning: Torsdag 12:15-14, Seminarrom C Grupper: Mandag/tirsdag 14:15-16
Detaljer2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 24. februar 2012 2 Context-Free Grammars Det mest sentrale verktøyet i datalingvistikk 24. februar 2012 3 2/24/2012 Speech
DetaljerØvinger september Wiebke Ramm, Kjetil Rå Hauge
EXFAC03-EURA 2011H Øvinger 20 21 september Wiebke Ramm, Kjetil Rå Hauge wiebke.ramm@ilos.uio.no; k.r.hauge@ilos.uio.no! Infoside: http://folk.uio.no/kjetilrh/exfac!! Her har vi: Lette spørsmål Lurespørsmål
DetaljerMuligheter for lulesamisk språkteknologi
Muligheter for lulesamisk språkteknologi Lene Antonsen og Trond Trosterud Senter for samisk språkteknologi Giellatekno Institutt for språkvitenskap Muligheter for lulesamisk språkteknologi Samisk språkteknologi
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2012 Tidspunkt: Mandag 12:15-14, lille aud Onsdag 10:15-12, 12:15-14, Chill Arbeidsmengde: 37,5 /
DetaljerInnhold. Forord Om å bruke Norsk for deg: Grammatikkoppgaver Hovedfokus: Substantiv... 17
Forord....11 Om å bruke Norsk for deg: Grammatikkoppgaver...13 Tematisk fokusering en grammatisk veiviser.................................... 13 Minigrammatikk før noen av kapitlene.........................................
DetaljerEksamen i LING 1112 Morfologi og syntaks 1. Våren 2013
UNIVERSITETET I OSLO DET HUMANISTISKE FAKULTET ------------- Eksamen i LING 1112 Morfologi og syntaks 1 Våren 2013 Tid: Torsdag 23. mai 2013 kl. 9-13 (4 timer/timar) Sted/stad: SB lesesal B Ingen hjelpemidler
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #7
IN1140: Introduksjon til språkteknologi Forelesning #7 Lilja Øvrelid Universitetet i Oslo 11 oktober 2018 Tema for i dag 2 Forrige uke Ordklasser Ordklassetagging Oblig2a: språkmodeller (frist: 17/9) I
Detaljer