INF 2820 V2018: Innleveringsoppgave 2
|
|
- Svein-Erik Tollefsen
- 5 år siden
- Visninger:
Transkript
1 INF 2820 V2018: Innleveringsoppgave 2 Besvarelsene skal leveres i devilry innen fredag 2.3 kl Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil 500 poeng. For å kunne gå opp til eksamen må du ha oppnådd minst 300 poeng til sammen på de 5 settene. For å oppnå poeng er det viktigere at du prøver å løse en oppgave enn at løsningen er helt riktig. Vektleggingen er slik sett annerledes enn på eksamen. Innleveringsfrister utsettes kun i forbindelse med sykdom (ved egenmelding eller legeerklæring), og omlevering vil ikke være mulig Vi går ut i fra at du har lest og er kjent med IFIs reglementet for obligatoriske oppgaver: og også kjenner rutinene for behandling av fuskesaker Dette er en individuell oppgave. Det skal ikke leveres felles besvarelser. Du kan levere om igjen i Devilry inntil fristen, men inkluder i så fall for alt du vil ha bedømt i den siste innleveringen. De tidligere innleveringene blir ikke lest. Hvis du leverer mer enn en fil, pakk filene i et zip-arkiv, hvis det bare er en fil, lever filen. Kall filen for <brukernavn>_inf2820_innlev_2 Filene det vises til i oppgaveteksten, blir ikke lagt ut i vortex. Du finner dem på IFIs cluster under /projects/nlp/inf2820/ i mappene scarrie og cfg. Del 1: Leksikon og morfologisk analyse (inntil 50 poeng for hele delen) Vi skal arbeide med morfologi og leksikon for norsk. Først finner vi et tilgjengelig leksikon for norsk, og så bearbeider vi det for våre formål. Det kan være greit å vite at Språkbanken, som ligger ved Nasjonalbiblioteket, har en del tilgjengelige ressurser for norsk språk, bl.a. leksika, se og gå videre til Språkbankens ressurskatalog. Vi har lastet ned SCARRIE-leksikonet, som ble utviklet av Victoria Rosén og Koenraad De Smedt ved Universitetet i Bergen, og Torbjørn Nordgård ved Norges Teknisk-Naturvitenskapelige Universitet. Leksikonet distribueres i XML (se utsnitt i appendiks). For å gjøre det lettere å redistribuere, har vi fjernet en del trekk knyttet til stil, som ikke er relevant for oss, slått sammen former som blir like etter at denne informasjonen er fjernet og lagret det i et kompakt format (se appendiks). For så å lese det inn i Python, har vi laget noen enkle objekter og metoder. Du bør laste ned hele mappen scarrie til ditt eget område/maskin. Du kan arbeide interaktivt med leksikonet i Python 3 (eller ipython 3). Kjør programmet read_lexicon_py3.py fra mappen scarrie. Innlesningen foregår ved at du lager et objekt i klassen ScaryLexicon, som i det følgende eksempelet. Denne har en attributt words. Dette er en Python dictionary som inneholder alle ordene som fullformer. Leksikonet består av mer enn forskjellige ord. Hvert ord består av selve formen og to typer trekk, et morfologisk trekk og et morfosyntaktisk trekk. (Informasjonen i de to trekkene er til dels overlappende.) Vi har laget en klasse for slike ord i Python. Vi kan plukke ut et tilfeldig ord og inspisere nærmere. 1
2 >>> sclex = ScaryLexicon() >>> wf2 = sclex.words[ w99263 ] >>> wf2.form 'glupskest' >>> wf2.morf_feat 'Adj,indef,sg' >>> wf2.syn_feat 'Adj_mfn_sup_indef_sg' >>> wf2.ident w99263 Hvert ord (ordform) har altså en unik identifikator, her w Grunnen til at vi må ha identifikatorer for ord, og ikke kan bruke selve formen som identifikator, er at flere ulike ord skrives likt. Se på 'w140165', 'w140116', 'w140106'. Disse har samme form, men avviker fra hverandre på andre egenskaper. Identifikatorene tjener som "keys" for dictionary words. Vi har også lagt inn identifikatoren i objektet for ordet for lett å kunne gå den andre veien. For å få mindre å skrive i det følgende, kan du for eksempel sette >>> words = sclex.words Når vi skal analysere tekst, er vi interessert i å gjenkjenne ordene vi ser og trekke ut deres morfologiske og syntaktiske egenskaper. Vi kunne skrevet en prosedyre, som til en ordform som kaster, går gjennom hele dictionary sclex.words for å plukke de ordene som har denne formen. Men det ville bli ineffektivt i praksis. Vi vil derfor gjøre dette en gang for alle for alle ordformer, lagre resultatene i en ny dictionary, som vi så kan bruke etter behov. a) (10 poeng) Lag en Python-dictionary form_to_ids som til en overflateform, som 'kaster', returnerer en liste av identifikatorer: alle identifikatorer av ordformer med denne formen. Altså, for 'kaster' skal den gi ['w140165', 'w140116', 'w140106']. Lag deretter en funksjon som til en form skriver ut alle mulige analyser, f.eks. til 'kaster' noe slikt som V,pres V_pres_indic_active_main_ditrans!intrans!trans N,pl,indef N_m_pl_indef N,sg,indef N_m_sg_indef Innlevering: Kode+resultatet av å analysere 'kastet' og 'øyer'. b) (10 poeng) Verdien av de to trekkene wf.morf_feat og wf.syn_feat er ganske kompakte og mer beregnet for lesing av maskiner enn av mennesker. Du finner forklaring på hva trekkene betyr her: For hver av de tre analysene av kaster, forklar bit for bit hva trekkene betyr. Innlevering: Svar på spørsmålene. 2
3 c) (10 poeng) Vi vil nå endre analyserutinen til å skrive ut mer forståelig informasjon. For words['w140116'] kan det se ut som noe slikt kaster cat: N gen: neut num: pl def: def Alle ordene i leksikonet er tilordnet en ordklasse eller kategori (eng: "part of speech", "category") så dette trekket skal med for alle ord. For noen ordklasser er dette alt som finnes. For andre ordklasser, er det en god del mere. Prøv å tolke og skrive ut all informasjon for ordene som tilhører klassene N, V, og Det. Innlevering: Kode+resultatet av å analysere 'kaster', 'kastet', 'noen' og 'et'. d) (15 poeng) Vi vil også at analysen vår skal gi grunnformen, som også kalles lemmaet, til de ulike ordformene. For eksempel ønsker vi til 'foreslo' å finne 'foreslå'. Scarrie-leksikonet gir ikke direkte svar på dette. Det inneholder ikke lemmaer. Men det Scarrie-leksikonet gjør, er å samle sammen ordformer til et leksem (som det kaller "Lexical Entry"). Leksemet inneholder ikke annen informasjon utover at det grupperer sammen ordformer. Under innlesningen av ScaryLexicon har vi laget en klasse Lexeme. Et objekt i denne klassen inneholder en unik identifikator og en liste ordidentifikatorer som sier hvilke ordformer som er i dette leksemet. Vi har laget en dictionary som til leksemidentifikatorer gir leksemet med denne identifikatoren. >>> lexemes['x29482'].word_ids ['w140165', 'w140166', 'w140167', 'w140168', 'w140169'] Og ser vi nærmere etter står dette for: w kaster N,sg,indef N_m_sg_indef w kastere N,pl,indef N_m_pl_indef w kasteren N,sg N_m_sg_def w kasterer N,pl,indef N_m_pl_indef w kasterne N,pl N_m_pl_def I dette tilfellet er den naturlige siteringsformen, den du vil finne i en ordbok, 'kaster'. Den kommer først, men det gjør den ikke for andre leksem (se f.eks. lexemes['x34351']). Du skal nå skrive en kodebit som til en leksemidentifikator returnerer den ordformen som er den mest naturlige siteringsformen, for eksempel til x29482 gir den 'kaster', og til x29471 gir den kaste. Du må her tenke igjennom flere ting: Hvilken form er den mest naturlige å finne i en ordbok for ulike ordklasser, som verb (V), substantiv (N) og adjektiv (A)? Hvordan finner du frem til denne ved hjelp av trekkene morf_feat og syn_feat? Hvordan skriver du koden for å finne frem til denne? Innlevering: Kode + resultatet av å bruke koden på leksemene med identifikatorer x30027, x30049, x
4 e) (5 poeng) Nå får vi beregnet et lemma fra et helt leksem. Men det vi ønsker er en "lemmatizer", en rutine som tar en ordform og gir lemmaet, for eksempel til 'foreslo' gir 'foreslå'. Utvid nå rutinen fra pkt (c) slik at den i tillegg returnerer et lemma. For words['w140116'] kan det se ut som noe slikt kaster cat: N lemma: kaste gen: neut num: pl def: de Innlevering: Kode+resultat av analyse av 'kaster', 'kastet', 'fisker', 'øyer', 'foreslo' og 'gås'. Del 2 Kontekstfrie grammatikker (inntil 50 poeng for hele delen) Vi skal lage en kontekstfri frasestrukturgrammatikk (CFP-SG eller CFG) for et utsnitt av norsk språk. Det er et mål at grammatikken bare beskriver grammatiske norske setninger. Den skal ikke akseptere ugrammatiske ordsekvenser. For å oppnå det vil grammatikken "undergenerere". Det vil være mange norske setninger den ikke fanger inn. Ved å utvide grammatikken med flere regler og et større leksikon vil vi gradvis kunne fange inn mer. Vi skal arbeide med utvidelser av grammatikken etter hvert. Vi vil bruke NLTK sitt format for å skrive kontekstfrie grammatikker. Du kan skrive grammatikken til fil og bruke nltk.data.load() for å lese den inn i Python (jfr. seksj 8.3 i NLTK-boka). Innlest slik blir grammatikken et Python-objekt av klassen grammar. For å teste grammatikken kan du bruke NLTKs chart parser. Du kan da teste den som i >>> parser_basic = nltk.chartparser(grammar) >>> for t in parser_basic.parse( Mary ran.split()): print(t) (Eller skift print(t) med t.pretty_print() ).Vi bruker nltk.chartparser() og ikke f.eks. nltk.recursivedescentparser() fordi den første kan behandle alle typer CFG-er, og vi er ikke interessert i parsingprosedyren i denne oppgaven. Merk også at du må bruke dokumentasjon for 2.utgave av NLTK-boka her. Kommandoene (og metodene) er noe endret og har fått nye navn siden 1.utgaven. Byggestenene En setning er en sekvens av norske ord, som ga, barnet, huset. Ut i fra formell språkteori vil disse utgjøre "alfabetet" for det formelle språket, mens setningene blir de velformete uttrykkene. I tillegg til ord og setninger, opererer vi med fraser. En setning er bygget opp av fraser som igjen er bygget opp av fraser eller ord. Sett i fra teorien for CFG, blir ordene terminaler, mens hver frase vil være merket med en ikke-terminal. Setninger vil være merket med ikke-terminalen som er startsymbolet. 4
5 Ord Ord kan deles inn i ordklasser. De største og viktigste er N (substantiv eller nomen): Kari, barn, barnet, V (verb): ga, solgte, spiste, A (adjektiv): stort, pent, underlig, P (preposisjoner): fra, til, på, Innenfor ordklassene kan det være underklasser. For substantiv skiller vi mellom egennavn, Kari, og fellesnavn, barn. For verb skiller vi bl.a. mellom intransitive, sov, transitive, anerkjenne, og ditransitive, ga. Ord bøyes og kommer i forskjellige former, som bestemt, barnet og ubestemt, barn. Klasse, underklasse og form er bestemmende for hvor et ord kan forekomme. To ord som tilhører samme klasse, underklasse og form, f.eks. barnet og huset, kan forekomme i de samme posisjonene. I en grammatisk setning kan vi skifte ut det ene med det andre og stadig få en grammatisk setning. To forskjellige former av et ord kan ikke alltid skiftes. Vi kan si et barn, men ikke et barnet. Det er også grunnen til å operere med underklasser. Både barn og jente er substantiv, men vi kan ikke si et jente sov selv om vi kan si et barn sov. I denne oppgaven kan vi dele ord inn i grupper ut i fra ordklasse og evt. underklasse og form. Oppgave 1. Fraser og setninger (20 poeng) I første omgang vil vi se på setninger som består av en NP (nomenfrase) etterfulgt av en VP (verbfrase) og se mer på oppbygningen av NP og VP NP Vi vil ha med flere NP-ledd, altså uttrykk som kan ta samme plassen som Kari eller barnet i eksemplene. For NP vil vi begrense oss til (i) egennavn, (ii) substantiv i bestemt form entall, (iii) nøytrumsubstantiv i ubestemt form entall med en foranstilt bestemmer (et, ethvert, noe, ). For disse ubestemte vil vi kunne ta med et ubegrenset antall modifiserende adjektiv (pent, stort, lite, ). Skal være med i språket Kari sov. Barnet sov. Et barn sov. Et lite pent barn sov. Kari sa at et lite barn sov. Skal ikke være med i språket Pent barnet sov. Et pene barn sov. 5
6 VP Vi vil ha med intransitive (sov), transitive (solgte) og ditransitive (overrakte) verb. Noen verb kan være både f.eks. transitive og intransitive, andre kan bare være i en underklasse. Skal være med i språket Kari ga barnet huset Kari overrakte dyret eplet Kari solgte huset Kari spiste eplet Kari spiste Kari smilte Skal ikke være med i språket Kari ga Kari ga dyret Kari solgte Kari spiste barnet eplet Kari smilte eplet Vi skal også ta med verb som tar setningskomplement. Noen av disse tar både et nominalkomplement (barnet) og et setningskomplement (at Ola sa at dyret smilte i det siste eksemplet). Skal være med i språket Kari fortalte barnet at dyret smilte Kari fortalte at dyret smilte Kari sa at dyret smilte Kari fortalte barnet at Ola sa at dyret smilte. Skal ikke være med i språket Kari sa barnet at dyret smilte Kari solgte at dyret smilte. Merk at denne konstruksjonen kan gjentas som i det siste eksempelet. Den kan gjentas et ubegrenset antall ganger. Lag en grammatikk som oppfyller dette og kall den basic.cfg. I grammatikken skal du bruke naturlige kategorinavn (ikke-terminaler) som NP og VP slik det er vist i eksempler i NLTK-boka, seksjon Du står fritt i hvor mye av X-bar-teori du vil bruke. Leksikonet skal inneholde minst 6 ord av hver av: - Substantiv, egennavn - Substantiv fellesnavn neutrum entall. Disse skal også forekomme både i bestemt og ubestemt form. - Adjektiv - Intransitive verb - Transitive verb - Minst 3 hver i de øvrige verb-klassene. Innlevering: basic.cfg Oppgave 2: PP-ledd (20 poeng) På grunn av mulige problemer for noen typer parsere, har vi skilt ut PP-ledd til en egen del slik at vi har en grammatikk med PP-ledd og en uten. Utvid basic.cfg til en grammatikk med PP-ledd, kall den pp.cfg, og lag chart-parser parser_pp. Du skal ha med minst 6 forskjellige preposisjoner. 6
7 PP Vi tar med preposisjonalledd, disse kan modifisere et nominalledd eller VP. Skal være med Dyret med barnet sov. Dyret sov i huset. Dyret med barnet sov i huset. Type NP-modifikasjon VP-modifikasjon Begge typer i denne setningen. Vi har laget et lite testsett med setninger som skal være med i språket, kalt norsk_testset.txt. Setningene merket med + skal være med i språket. For å teste at vi ikke får med for mye, har vi også tatt med negative eksempler som ikke er grammatiske setninger og merket dem med -. Du kan teste grammatikken din med funksjonen test fra test_cfg_py3.py. (Begge ligger i mappen cfg på fellesområdet). Denne sjekker bare om det finnes minst en analyse for hver av de grammatiske setningene. Det er et poeng med kontekstfrie grammatikker at vi kan få frem flertydigheter og at de reflekteres i trær. Se på setningene: a) Dyret i huset ved vannet sov. b) Kari sov i huset ved vannet. c) Kari likte huset ved vannet. d) Kari likte dyret i huset ved vannet. Hver av setningene (a-c) har to analyser. Sjekk at du får dette. For hver av de tre eksemplene forklar med en til to setninger intuitivt forskjellen mellom de to analysene. Hvor mange analyser får (d)? Innlevering: Fila som inneholder pp.cfg. Resultatet av utskrift med kjøring med test_cfg_py3.py sammen med norsk_testset.txt. Kjøringseksempler som viser trærne du får for setningene (a-d). (Du kan bruke Tree-metoden pretty_print() til å skrive ut trærne.) Forklaringene det spørres etter. Oppgave 3: Utviding av grammatikken (10 poeng) Vi skal nå utvide grammatikk pp.cfg med en del flere konstruksjoner. For det første skal vi utvide med koordinasjon av setninger som i (a), NP-er som i (b) og VP-er som i (c). For koordinasjon bør du tilstrebe mest mulig generelle (og korrekte) regler, som dekker flest mulig tilfeller. a) Kari smilte og barnet sov. b) Ola og Kari smilte. c) Kari smilte og ga barnet dyret. Dernest skal vi inkludere noen relativsetninger. Vi vil her nøye oss med bare noen former for relativsetninger og med forholdsvis lite prinsipielle løsninger. De to formene av relativsetninger vi vil se på, er på formen (d) som vi finner i (e) og (f), og på formen (g) som vi finner i (h) og (k). 7
8 d) som VP e) Kari som smilte likte dyret f) Kari likte barnet som likte dyret som sov g) som NP TV h) Dyret som Kari likte sov i) Kari likte dyret som barnet som sov likte Kall den utvidete grammatikken for my.cfg. Hvor mange trær tilordner grammatikken til setningen Ola som fortalte at Kari sov og smilte likte barnet og huset ved vannet. Innlevering: Grammatikken my.cfg. Svar på spørsmål om hvor mange analyser setningen får og lever trærne som grammatikken tilskriver setningen. - SLUTT 8
9 Appendiks Utdrag fra main i formatet som leses av read_python_py3.py Lexeme glupende;adj,pos;adj_mfn_pos_e glupende;adj,pos,indef,sg;adj_mfn_pos_indef_sg Lexeme glupsk;adj,pos,indef,sg;adj_mfn_pos_indef_sg glupske;adj,pos;adj_mfn_pos_e glupskere;adj,sgpl;adj_mfn_comp_defindef_sgpl glupskest;adj,indef,sg;adj_mfn_sup_indef_sg glupskeste;adj,sgpl;adj_mfn_sup_def_sgpl Lexeme gluten;n,sg,indef;n_n_sg_indef glutenet;n,sg;n_n_sg_def Utdrag fra originalt Scarrie-leksikon <LexicalEntry><Lemma /> <feat att="writtenform" val="glupende" /> <feat att="morsynfeat" val="adj,pos" /> <feat att="synfeat" val="adj_mfn_pos_e" /> <feat att="writtenform" val="glupende" /> <feat att="morsynfeat" val="adj,pos,indef,sg" /> <feat att="synfeat" val="adj_mfn_pos_indef_sg" /> </LexicalEntry> <LexicalEntry><Lemma /> <feat att="writtenform" val="glupsk" /> <feat att="morsynfeat" val="adj,pos,indef,sg" /> <feat att="synfeat" val="adj_mfn_pos_indef_sg" /> <feat att="writtenform" val="glupske" /> <feat att="morsynfeat" val="adj,pos" /> 9
10 <feat att="synfeat" val="adj_mfn_pos_e" /> <feat att="writtenform" val="glupskere" /> <feat att="morsynfeat" val="adj,sgpl" /> <feat att="synfeat" val="adj_mfn_comp_defindef_sgpl" /> <feat att="writtenform" val="glupskest" /> <feat att="morsynfeat" val="adj,indef,sg" /> <feat att="synfeat" val="adj_mfn_sup_indef_sg" /> <feat att="writtenform" val="glupskeste" /> <feat att="morsynfeat" val="adj,sgpl" /> <feat att="synfeat" val="adj_mfn_sup_def_sgpl" /> </LexicalEntry> <LexicalEntry><Lemma /> <feat att="writtenform" val="gluten" /> <feat att="morsynfeat" val="n,sg,indef" /> <feat att="synfeat" val="n_n_sg_indef" /> <feat att="writtenform" val="glutenet" /> <feat att="morsynfeat" val="n,sg" /> <feat att="synfeat" val="n_n_sg_def" /> </LexicalEntry> 10
INF 2820 V2016: Innleveringsoppgave 3 del 1
INF 2820 V2016: Innleveringsoppgave 3 del 1 Pga tekniske problemer er oppgaveteksten delt i to. Dette er første del. Andre del legges ut mandag 13.3! Besvarelsene skal leveres i devilry innen fredag 24.3
DetaljerINF 2820 V2016: Innleveringsoppgave 2
INF 2820 V2016: Innleveringsoppgave 2 Besvarelsene skal leveres i devilry innen fredag 3.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 20 poeng. Til sammen kan en få inntil
DetaljerINF 2820 V2016: Innleveringsoppgave 3 hele
INF 2820 V2016: Innleveringsoppgave 3 hele Dette er det komplette settet! Besvarelsene skal leveres i devilry innen fredag 24.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 2
INF 2820 V2016: Obligatorisk innleverinsoppgave 2 Besvarelsene skal leveres i devilry innen torsdag 17.3 kl 18.00 Filene det vises til finner du på o /projects/nlp/inf2820/scarrie o /projects/nlp/inf2820/cfg
DetaljerINF 2820 V2018: Innleveringsoppgave 3
INF 2820 V2018: Innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 23.3 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil
DetaljerINF 2820 V2016: Obligatorisk innleveringsoppgave 3
INF 2820 V2016: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen torsdag 21.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Oppgave 1: Shift-reduce-effektivisering
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 1
INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa
DetaljerINF 2820 V2015: Obligatorisk innleveringsoppgave 3
INF 2820 V2015: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 17.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Del 1 RD Parsing Oppgave 1:
DetaljerINF 2820 V2015: Obligatorisk innleverinsoppgave 2
INF 2820 V2015: Obligatorisk innleverinsoppgave 2 Besvarelsene skal leveres i devilry innen fredag 13.3 kl 18.00 Filene det vises til finner du på o /projects/nlp/inf2820/cfg o /projects/nlp/inf2820/scarrie
DetaljerINF 2820 V2018: Innleveringsoppgave 1
INF 2820 V2018: Innleveringsoppgave 1 Besvarelsene skal leveres i devilry innen fredag 9.2 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil
DetaljerINF2820 V2017 Oppgavesett 5 arbeidsoppgaver
INF2820 V2017 Oppgavesett 5 arbeidsoppgaver Dette er oppgaver du kan arbeide med på egen hånd. Du kan også arbeide med dem i gruppa 28.2 (hvis du har innleveringsoppgave 2 under kontroll) og spørre gruppelæreren
DetaljerINF2820 V2017 Oppgavesett 5 Gruppe 21.2
INF2820 V2017 Oppgavesett 5 Gruppe 21.2 Denne uka er det først noen teoretiske oppgaver. Deretter er det en del praktiske arbeidsoppgaver som vil forberede deg til arbeidet med innleveringsoppgavesett
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 6. juni 2014 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0
DetaljerINF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning
INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene
DetaljerINF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning
INF2820 Datalingvistikk V2018 10. Gang 19.3 del 1 Jan Tore Lønning I dag: to deler A. Active chart-parsing Fortsatt fra sist B. Tekstklassifisering 2 CHART-PARSING 3 I dag chart-parsing Chart-parsing:
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning BEGRENSNINGER VED REGULÆRE SPRÅK OG KONTEKSTFRIE GRAMMATIKKER 2 I dag 1. Begrensninger ved regulære språk 2. Noen egenskaper ved naturlige språk 3. Kontekstfrie
DetaljerINF2820-V2018 Oppgavesett 10 Gruppe 18.4
INF2820-V2018 Oppgavesett 10 Gruppe 18.4 Chart-parsing med papir og penn Denne oppgaven tjener flere formål: Få bedre grep på chart-parsing See hvordan en chart-parser behandler venstrerekursjon Praktisk
Detaljer2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.
INF2820 Datalingvistikk V2012 Jan Tore Lønning Begrensninger ved regulære Regulære er ikke ideelle modeller for naturlige, dvs Verken regulære uttrykk eller NFA er ideelle for å beskrive naturlige fordi:
DetaljerLøsningforslag for obligatorisk innlevering 2 INF2820
Løsningforslag for obligatorisk innlevering 2 INF2820 March 16, 2017 Oppgave 1 NFA START: 0 FINAL: 5 EDGES: 0 # 1 0 'kvart' 3 0 MINUTE 4 1 'halv' 2 1 HOUR 5 2 HOUR 5 3 PRE 2 4 PRE 1 ABRS: HOUR: 'ett',
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk
DetaljerINF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning
INF2820 Datalingvistikk V2017 9. Gang 13.3 Jan Tore Lønning I dag chart-parsing Fortsatt fra sist: Chart-parsing: hovedideer BU chart-parsing: algoritmen NLTKs ChartParser Enkel Python-implementasjon av
DetaljerOppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være:
2 Eksamen INF2820, 2015, oppgave 2 Oppgave 2 La gramatikk G være: S > NP VP VP > VI VP > VTV NP VP > VS CP CP > C S NP > 'dyret' 'barnet' 'Kari' 'Ola' VI > 'sov' 'smilte' 'danset' VTV > 'kjente' 'likte'
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
DetaljerOppgave 1. Spørsmål 1.1 (10%) Gitt det regulære uttrykket: a((bcd)+(cd))*cd
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 14. juni 2016 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0
DetaljerINF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning
INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj
DetaljerINF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция
Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk
DetaljerSpørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerINF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning
INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2015 5. Gang - 16.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
DetaljerINF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning
INF2820 Datalingvistikk V2015 11. Gang 13.4 Jan Tore Lønning I dag Unifikasjonsgrammatikker Repetisjon og overblikk: Formalisme Lingvistisk anvendelse Utvidelse av lingvistisk anvendelse NLTKs implementering
DetaljerINF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning
INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsing algoritmen Algoritmen uttrykt
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2017 6. Gang - 20.2 Jan Tore Lønning I dag Kontekstfrie grammatikker og naturlige språk (fortsatt fra sist) Kontekstfrie grammatikker og regulære språk Grammatikker og trær i NLTK
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 11. gang, 27.3.2014 Jan Tore Lønning I dag Repetere en del begreper: Trekkstrukturer Unifikasjon og subsumpsjon Trekkbaserte grammatikker Form: to alternative format Tolkning
DetaljerINF2820 Datalingvistikk V2018 Forelesning 4, 5.2 Jan Tore Lønning
INF2820 Datalingvistikk V2018 Forelesning 4, 5.2 Jan Tore Lønning I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 2 Naturlige språk som
DetaljerINF2820 Datalingvistikk V gang, Jan Tore Lønning
INF2820 Datalingvistikk V2014 12. gang, 3.4.2014 Jan Tore Lønning I dag Trekkbaserte grammatikker (unifikasjonsgrammatikker) for naturlige språk NLTKs implementering av slike Litt om lingvistiske modeller
DetaljerOppgave 1 (samlet 40%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerINF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning I dag Naturlige språk Ord Litt morfologi Språkteknologi: leksikon og morfologi Tekstprosessering de første trinn 2 Naturlige språk som
DetaljerINF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning
INF2820 Datalingvistikk V2014 Forelesning 4, 6.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Regulære uttrykk: teoretiske og praktiske Begrensninger ved regulære språk Noen egenskaper
DetaljerINF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY
INF5830, H2009, Obigatorisk innlevering 2 Innleveringsfrist 4.11 1 Oppgave: Unære produksjoner i CKY For bottom-up parsere, som CKY, har vi forutsatt at grammatikken er på CNF. For de ikke-leksikalske
DetaljerINF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning
INF2820 Datalingvistikk V2015 Forelesning 4, 9.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Begrensninger ved regulære språk Regulære uttrykk: teoretiske og praktiske Noen egenskaper
DetaljerINF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning
INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsingalgoritmen Algoritmen uttrykt
Detaljer2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen KONTEKSTFRIE GRAMMATIKKER OG PARSING 22. februar 2011 2 Høyre- og venstreavledninger Til hvert tre svarer det mange avledninger. For kontekstfrie
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen KONTEKSTFRIE GRAMMATIKKER OG PARSING 22. februar 2011 2 I dag Avledninger og normalformer Parsing: ovenifra og ned (top-down) Parsing: nedenifra
DetaljerObligatorisk oppgave 4, INF2820, 2014
Obligatorisk oppgave 4, INF2820, 2014 Besvarelsene skal leveres i devilry innen 7.5 kl 1800. Filene det vises til finner du etter hvert på /projects/nlp/inf2820/ Oppgavene kan løses alene og det skal leveres
DetaljerLF - Eksamen i INF1820
LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerINF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning
INF2820 Datalingvistikk V2018 9. Gang 13.3 Jan Tore Lønning I dag to deler A. Trekkstrukturgramatikker Fortsatt fra sist B. Chart-parsing Fortsetter parsing fra for to uker siden 2 TREKKSTRUKTUR- GRAMMATIKKER
DetaljerINF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning
INF2820 Datalingvistikk V2016 10. Gang 30.3 Jan Tore Lønning I dag Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj
DetaljerINF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les
Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 14. juni 2016 Tid for eksamen: 1430-1830 Oppgåvesettet er på 5 side(r) Vedlegg: 0
DetaljerINF2820 Datalingvistikk V Gang 6.3 Jan Tore Lønning
INF2820 Datalingvistikk V2017 8. Gang 6.3 Jan Tore Lønning I dag CKY-algoritmen fortsatt fra sist Python-implementasjon av CKY Chomsky Normal Form (CNF) Chart-parsing BU-algoritme for chart-parsing 3.
DetaljerINF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar
Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2017 5. Gang - 13.2 Jan Tore Lønning I dag Tekstnormalisering: lemmatisering og «stemming» Tagget tekst og tagging Begrensninger ved regulære språk Frasestruktur og kontekstfrie
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2018 6. Gang - 19.2 Jan Tore Lønning I dag Kontekstfrie grammatikker og naturlige språk Grammatikker og trær i NLTK Kontekstfrie grammatikker, avledninger og trær Hva er parsing?
DetaljerINF2820 V2017 Oppgavesett 6 Gruppe 7.3
INF2820 V2017 Oppgavesett 6 Gruppe 7.3 Oppgave 1: Lag en kontekstfri grammatikk som beskriver samme språk som nettverket under. S a S S c S S b A1 A1 a S A1 c S A1 b A2 A2 c S A2 a S A2 b A3 A3 a A3 A3
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2015 6. Gang - 23.2 Jan Tore Lønning PARSING DEL 1 2 I dag Høyre- og venstreavledninger Recursive-descent parser (top-down) Begynne Shift-reduce parser (bottom-up) 25. februar
DetaljerSlides til 12.1 Formelt språk og formell grammatikk
Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen
Detaljer. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo
.. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk Sverre Stausland Johnsen Universitetet i Oslo stausland.johnsen@iln.uio.no Universitetet i Stavanger 15. januar
DetaljerINF2820 Datalingvistikk V Gang 16.3 Jan Tore Lønning
INF2820 Datalingvistikk V2015 9. Gang 16.3 Jan Tore Lønning I dag Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj
DetaljerHjemmeeksamen 1 i INF3110/4110
Hjemmeeksamen i INF30/40 Innleveringsfrist: fredag 24. oktober kl. 500 Innlevering Hele besvarelsen skal leveres skriftlig på papir i IFI-ekspedisjonen innen fredag 24. oktober kl. 500. Merk besvarelsen
DetaljerOppgavesett for Python
Oppgavesett for Python Petter Mæhlum Januar 2019 1 List comprehension Dette er ment som en rask innføring i list comprehension, med tilhørende oppgaver. List comprehension er en spesiell type syntaks i
Detaljer2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 24. februar 2012 2 Context-Free Grammars Det mest sentrale verktøyet i datalingvistikk 24. februar 2012 3 2/24/2012 Speech
DetaljerINF2820 Datalingvistikk V2012
INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 24. februar 2012 2 1 I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Parsing: ovenifra og ned
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 23. februar 2012 2 I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Parsing: ovenifra og ned
DetaljerMAT-INF 1100: Obligatorisk oppgave 1
13. september, 2018 MAT-INF 1100: Obligatorisk oppgave 1 Innleveringsfrist: 27/9-2018, kl. 14:30 i Devilry Obligatoriske oppgaver («obliger») er en sentral del av MAT-INF1100 og er utmerket trening i å
DetaljerEksamen INF2820 Datalingvistikk, H2018, Løsningsforslag
Eksamen INF2820 Datalingvistikk, H2018, Løsningsforslag 1 2 Tre1: Tre 2: Tre 3: 3 Det kan være lurt å bytte ut regel NP > NP og NP med NP > NP C NP C > og Grammatikk G blander terminaler og ikketerminaler
DetaljerInnlevering 2b i INF2810, vår 2017
Innlevering 2b i INF2810, vår 2017 Dette er del to av den andre obligatoriske oppgaven i INF2810. Man kan oppnå 10 poeng for oppgavene i 2b, og man må ha minst 12 poeng tilsammen for 2a + 2b for å få godkjent.
Detaljer3/5/2012. Chart alternativ datastruktur. Fundamentalregelen. Chart-parsing. Bottom-up FORMELL SPRÅKTEORI. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning CHART-PARSING FORMELL SPRÅKTEORI 5. mars 2012 2 Chart alternativ datastruktur NP Det Nom Fundamentalregelen NP Det Nom Nom Nom PP Nom Nom PP NP PP P NP Det
DetaljerIN2110 Obligatorisk innlevering 1a
IN2110 Obligatorisk innlevering 1a Oppsett Leveres innen fredag 15. februar kl. 23.59 i Devilry. For IN2110 har vi laget et utviklingsmiljø for Python som inneholder programvare og data for de obligatoriske
DetaljerINF2820 Datalingvistikk V gang, 27.2 Jan Tore Lønning
INF2820 Datalingvistikk V2014 7. gang, 27.2 Jan Tore Lønning I dag Mellomspill: Chomsky Normal Form Tabellparsing: CKY-algoritmen Innlede Chart-Parsing 20. februar 2014 2 Chomsky-normalform (CNF) En grammatikk
DetaljerObligatorisk Oppgave 1
Obligatorisk Oppgave 1 INF5110 - Kompilatorteknikk Våren 2016 Frist: 20. mars 23:59 Hensikten med Oppgaven Tanken bak denne oppgaven er at man skal få litt praktisk erfaring med følgende: Bruke skannings-
DetaljerINF1820 V2013 Oppgave 3b CFGer og semantikk
INF1820 V2013 Oppgave 3b CFGer og semantikk Innleveringsfrist, onsdag 1. mai Lever inn svarene dine i en fil som angir brukernavnet ditt, slik: oblig3a brukernavn.py En perfekt besvarelse på denne oppgaven
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning CHART-PARSING FORMELL SPRÅKTEORI 5. mars 2012 2 Chart alternativ datastruktur NP Det Nom Nom Nom PP NP PP P NP Det Nom, N P NP, PN 0 book 1 the 2 flight 3
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2018 5. Gang - 12.2 Jan Tore Lønning I dag Tokenisering, lemmatisering og «stemming» Tagget tekst og tagging Begrensninger ved regulære språk Frasestruktur og kontekstfrie grammatikker
DetaljerOppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :
Eksempelspørsmål Spørsmål av denne typen kan forventes til eksamen, men kanskje ikke så mange. I hvert fall ville dette pluss spørsmål fra første del av pensum blitt for mye for en tretimers eksamen. Oppgave
DetaljerHjemmeeksamen 2 i INF3110/4110
Hjemmeeksamen 2 i INF3110/4110 Innleveringsfrist: onsdag 19. november kl. 1400 Innlevering Besvarelsen av oppgave 2,3,4 og 5 skal leveres skriftlig på papir i IFI-ekspedisjonen. Merk denne med navn, kurskode,
DetaljerObligatorisk Oppgave 1
Obligatorisk Oppgave 1 INF5110/INF9110 - Kompilatorteknikk Våren 2013 Frist fredag 15. mars Hensikten med Oppgaven Tanken bak denne oppgaven er at man skal få litt praktisk erfaring med følgende: Bruke
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerINF2820-V2014-Oppgavesett 15, gruppe 13.5
INF2820-V2014-Oppgavesett 15, gruppe 13.5 Vi møtes på FORTRESS denne uka. Semantikk i grammatikken Utgangspunktet er det lille grammatikkfragmentet med semantiske regler presentert I NLTK-boka som simple-sem.fcfg.
DetaljerAPPENDIKS D Geminittisk språk/grammatikk
1 APPENDIKS D Geminittisk språk/grammatikk Jeg har latt overskriften på dette appendikset bli sående i sin opprinnelige form, selv om jeg kun har maktet å gi et nokså usystematisk og mangelfullt innblikk
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2016 6. Gang - 24.2 Jan Tore Lønning PARSING DEL 1 2 I dag Hva er parsing? Høyre- og venstreavledninger Recursive-Descent parser (top-down) Shift-Reduce parser (bottom-up) Pythonimplementasjon:
DetaljerNorsk minigrammatikk bokmål
Norsk minigrammatikk bokmål Ordklassene Substantiv Adjektiv Artikler Pronomen Tallord Verb Adverb Konjunksjoner Preposisjoner Interjeksjoner ORDKLASSENE Den norske grammatikken inneholder ti ordklasser:
DetaljerTest of English as a Foreign Language (TOEFL)
Test of English as a Foreign Language (TOEFL) TOEFL er en standardisert test som måler hvor godt du kan bruke og forstå engelsk på universitets- og høyskolenivå. Hvor godt må du snake engelsk? TOEFL-testen
DetaljerINF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning
INF2820 Datalingvistikk V2016 12. Gang 13.4 Jan Tore Lønning I dag Trekkbaserte grammatikker for naturlige språk med vekt på subkategorisering/argumenter, 3 tilnærminger a. Enkel løsning, grammatikk 1
Detaljer3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerKlasse. Uke 11 - Reise Mars Navn:
Klasse H Uke 11 - Reise 14. - 18. Mars - 2016 Navn: Arbeidsplan Mandag 1. Se supernytt 2. Repetisjon 3. Dele ut ukeplanen 4. Øveord/verb - tavleundervisning 5. Lese - Norsk start Tirsdag 1. Se supernytt
DetaljerLesekurs i praksis. Oppgaver på «Nivå 2» Vigdis Refsahl
1 Lesekurs i praksis Oppgaver på «Nivå 2» Vigdis Refsahl Dette heftet må brukes sammen med: Teori Når lesing er vanskelig» og Praksis oppgaver på «Nivå 1» Oppgavene på «Nivå 2» innføres gradvis når elevene
DetaljerINF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning
INF2820 Datalingvistikk V2015 14. Gang 4.5 Jan Tore Lønning CHART PARSING 2 I dag Svakheter ved tidligere parsere RD og SR: ineffektivitet CKY: CNF Chart parsing,,dotted items og fundamentalregelen Algoritmer:
DetaljerEXFAC EURA Syntaks2 1
EXFAC EURA Syntaks2 1 Språk Noen avvik fra og tillegg til kap. 12 (som ikke skal leses i sin helhet), bedre tilpasset ILOS-fagenes terminologi og språk Mest om form i dag og om verbet Feil i eksemplene?
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 20. januar 2012 2 Non-Determinism Speech and Language Processing - Jurafsky and Martin
DetaljerSjekkliste B2-nivå. 1 Har du brukt stor/liten forbokstav, punktum (.), komma (,) og spørsmålstegn (?) riktig?
Sjekkliste B2-nivå 1 Har du brukt stor/liten forbokstav, punktum (.), komma (,) og spørsmålstegn (?) riktig? 2 Har du subjekt og et bøyd verb i alle setninger? 3 Har du satt ordene på riktig plass i setningene?
DetaljerObligatorisk oppgave 1 i INF 4130, høsten 2009
Obligatorisk oppgave 1 i INF 4130, høsten 2009 Leveringsfrist fredag 2. oktober Institutt for informatikk Krav til innleverte oppgaver ved Institutt for informatikk (Ifi) Ved alle pålagte innleveringer
DetaljerLast ned Norsk grammatikk for læreren - Kirsti Mac Donald. Last ned
Last ned Norsk grammatikk for læreren - Kirsti Mac Donald Last ned Forfatter: Kirsti Mac Donald ISBN: 9788202475895 Antall sider: 173 Format: PDF Filstørrelse:16.22 Mb Hvordan er reglene for bruk av preposisjoner?
DetaljerLast ned Norsk grammatikk for læreren - Kirsti Mac Donald. Last ned
Last ned Norsk grammatikk for læreren - Kirsti Mac Donald Last ned Forfatter: Kirsti Mac Donald ISBN: 9788202475895 Antall sider: 173 Format: PDF Filstørrelse: 26.26 Mb Hvordan er reglene for bruk av preposisjoner?
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #7
IN1140: Introduksjon til språkteknologi Forelesning #7 Lilja Øvrelid Universitetet i Oslo 11 oktober 2018 Tema for i dag 2 Forrige uke Ordklasser Ordklassetagging Oblig2a: språkmodeller (frist: 17/9) I
Detaljer