INF1820 V2014 Oppgave 3b CFGer og semantikk

Like dokumenter
INF1820 V2013 Oppgave 3b CFGer og semantikk

FORBEREDELSE TIL ÅRSPRØVE I ENGELSK 7. KLASSE FREDAG 19. MAI 2017

Engelsk gruppe 2 høsten 2015

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Slope-Intercept Formula

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

Vekeplan 4. Trinn. Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD. Norsk Matte Symjing Ute Norsk Matte M&H Norsk

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Mannen min heter Ingar. Han er også lege. Han er privatpraktiserende lege og har et kontor på Grünerløkka sammen med en kollega.

UNIVERSITETET I OSLO

Of all the places in the world, I love to stay at Grandma Genia and

INF2820 Datalingvistikk V Gang Jan Tore Lønning

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning

IN1140: Introduksjon til språkteknologi. Forelesning #10

INF2820 Datalingvistikk V2012

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Macbeth: Frozen Scenes

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Den som gjør godt, er av Gud (Multilingual Edition)

INF 2820 V2016: Innleveringsoppgave 3 del 1

2018 ANNUAL SPONSORSHIP OPPORTUNITIES

IN1140: Introduksjon til språkteknologi. Forelesning #10

Den som gjør godt, er av Gud (Multilingual Edition)

INF 2820 V2016: Innleveringsoppgave 3 hele

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

EN Skriving for kommunikasjon og tenkning

Støtteark Tidsformer (verb) Presens (nåtid): Når vi skriver i presens så bruker vi verbet i sin grunnform, men hvis det er

Norsk (English below): Guide til anbefalt måte å printe gjennom plotter (Akropolis)

norsk grammatikk bok C2FFB2EE7079E5C7671E474DBC1B7657 Norsk Grammatikk Bok

Come to praise. We have come to praise your name and give thanks for all things you ve done We lift our voices up to you You are worthy of our song

SERVICE BULLETINE

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

Hvorfor skal vi lære grammatikk?

Språkleker og bokstavinnlæring

PSi Apollo. Technical Presentation

Trigonometric Substitution

Økologisk og kulturell dannelse i økonomiutdanningen

Norsk Grammatikk Oppgaver

Vedlegg 2 Dokumentasjon fra TVM leverandør

INF2820-V2014-Oppgavesett 15, gruppe 13.5

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Uke Kompetansemål fra kunnsakpsløftet Ferdighetsmål Lærebok: Quest Vurdering Everyday practice Språklæring:

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

EMPIC MEDICAL. Etterutdanningskurs flyleger 21. april Lars (Lasse) Holm Prosjektleder Telefon: E-post:

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning

Oppgave 1 (samlet 15%)

INF 2820 V2016: Obligatorisk innleveringsoppgave 3

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

UNIVERSITETET I OSLO

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Syntax/semantics - I INF 3110/ /29/2005 1

LF - Eksamen i INF1820

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

THE MONTH THE DISCIPLINE OF PRESSING

Enkel og effektiv brukertesting. Ida Aalen LOAD september 2017

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Årsplan ENGELSK 5.trinn. Setningsmønster It starts at It finishes at I want to be a when I grow up

Årsplan i engelsk 1.klasse 2017/2018

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Gol Statlige Mottak. Modul 7. Ekteskapsloven

2A September 23, 2005 SPECIAL SECTION TO IN BUSINESS LAS VEGAS

Bestille trykk av doktoravhandling Ordering printing of PhD Thesis

Elektronisk innlevering/electronic solution for submission:

Manuset ligger på NSKI sine sider, men kan også kjøpes på

7. trinn Målark Chapter 1 Bokmål

En praktisk innføring i team-basert læring

C13 Kokstad. Svar på spørsmål til kvalifikasjonsfasen. Answers to question in the pre-qualification phase For English: See page 4 and forward

lytte etter og bruke engelske språklyder gjennom praktiskestetiske gi eksempler på noen situasjoner der det kan være nyttig å kunne engelsk

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

Speak with Us! - Kindergarten

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE I BI2014 MOLEKYLÆRBIOLOGI

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

Guidance. CBEST, CSET, Middle Level Credential

AvtaleGiro beskrivelse av feilmeldinger for oppdrag og transaksjoner kvitteringsliste L00202 levert i CSV fil

ÅRSPLAN for skoleåret i : ENGELSK for 1.trinn.

Årsplan: Engelsk 3.trinn Uke

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Bouvet Island. The Norvegia expedition in 1927/28 declared the world s most isolated island as Norwegian area. Birds. No. 1/2018 Norway Post Stamps

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

STOP KISS av Diana Son Scene for en mann og to kvinner

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

TRENERROLLEN PEDAGOGISK PERSPEKTIV GEIR BANGSTAD 11. SEPTEMBER 2010

Transkript:

INF1820 V2014 Oppgave 3b CFGer og semantikk Innleveringsfrist fredag 9. mai Lever inn svarene dine i en fil som angir brukernavnet ditt, slik: oblig3b brukernavn.py En perfekt besvarelse av denne oppgaven er verdt 100 poeng. 1 Et grammatikkfragment for engelsk (40 poeng) Engelsk har samsvarsbøyning mellom subjekt og verb: subjekter i tredje person entall krever en spesiell form av verbet (she likes, it likes versus I like, they like). Engelsk har også, som norsk, noe kasusmarkering for pronomen. For eksempel, I, he, they er i nominativ kasus, mens me, him, them er i akkusativt kasus. I denne oppgaven skal du skrive en kontekstfri grammatikk som aksepterer setningene i (a), men ikke setningene i (b): 1. Setninger grammatikken skal akseptere: (a) she likes him (b) they like him (c) they like the actress (d) they like the actresses (e) I know her (f) I know the actor whom she likes (g) I know the actress who likes him (h) the actress who likes him sings (i) the actresses who like him sing 2. Setninger grammatikken ikke skal akseptere: 1

(a) *she likes he (b) *they likes him (c) *me know her (d) *I know the actress whom likes him (e) *the actress who likes him sing (f) *the actress who like him sings (g) *the actresses who likes him sing (h) *the actresses who like him sings NLTK inneholder flere forskjellige parsere som tildeler syntaktisk struktur til en setning automatisk, i henhold til en grammatikk. Her skal du bruke RecursiveDescent-parseren som står beskrevet i seksjon 8.3. Du kan formulere grammatikken din direkte som en streng, slik: grammar = nltk.parse_cfg(""" S -> NP VP VP -> V NP V NP PP PP -> P NP V -> "saw" "ate" "walked" NP -> "John" "Mary" "Bob" Det N Det N PP Det -> "a" "an" "the" "my" N -> "man" "dog" "cat" "telescope" "park" P -> "in" "on" "by" "with" """) Merk deg at flere alternativer for samme kategori skal formuleres med disjunksjon VP -> V NP V NP PP, dvs. at VP enten kan bestå av en V NP eller V NP PP. Merk deg videre at RecursiveDescent-parseren ikke håndterer venstre-rekursjon av typen VP -> VP PP, så du må formulere grammatikken din uten denne formen for rekursjon. Du kan teste grammatikken din på en setning slik: sent = "Mary saw Bob".split() rd_parser = nltk.recursivedescentparser(grammar) for tree in rd_parser.nbest_parse(sent): print tree Parseren skriver da ut et tre i klammenotasjon: (S (NP Mary) (VP (V saw) (NP Bob))) Implementer grammatikkfragmentet for engelsk som beskrevet over, test grammatikken din på setningene i (a) og (b) ovenfor og skriv ut resultatet. Pass på at grammatikken din faktisk generer et tre for alle setningene i (a) og ikke genererer noe tre for setningene i (b). 2

2 Manuell annotering av ordbetydning (25 poeng) I denne oppgaven skal du gjøre en manuell annotering av ordbetydning og kommentere obervasjonene dine. Skriv svarene dine som utkommentert tekst i Python-filen din. Setningene i (a)-(j) under er hentet fra SemCor-korpuset, et korpus som er annotert med ordbetydning, og alle inneholder verbet leave. 1. But questions with which committee members taunted bankers appearing as witnesses left little doubt that they will recommend passage of it. 2. The departure of the Giants and the Dodgers to California left New York with only the Yankees. 3. After the coach listed all the boy s faults, Hartweger said, Coach before I leave here, you ll get to like me. 4. R. H. S. Crossman, M.P., writing in The Manchester Guardian, states that departures from West Berlin are now running at the rate not of 700, but of 1700 a week, and applications to leave have risen to 1900 a week. 5. The house has been swept so clean that contemporary man has been left with no means, or at best with wholly inadequate means, for dealing with his experience of spirit. 6. A second and also good practice is to shear off the tops, leaving an inch high stub with just a leaf or two on each branch. 7. No doubt some experiences vanish so completely as to leave no trace on the sleeper s mind. 8. He is a widower, his three children are dead, he has no one left on earth ; also he is a drunk, and has lost his job on that account 9. Piepsam tries to stop him by force, receives a push in the chest from Life, and is left standing in impotent and growing rage, while a crowd begins to gather. 10. The audience leaves the play under a spell, It is the kind of spell which the exposure to spirit in its living active manifestation always evokes. 3

Slå opp verbet leave i WordNet (bruk Use WordNet online : http://wordnetweb. princeton.edu/perl/webwn). Du skal ikke ta hensyn til betydningene for substantivet leave. For hver av setningene i (a)-(j) skal du velge en betydning ( sense ) fra WordNet for verbet leave i setningen og notere valget ditt. På Use Word- Net online -siden kan du klikke på Display Options og velge Show Sense Numbers for å få en nummerert oversikt over de forskjellige betydningene. Bruk disse nummerene i svaret ditt. Videre skal du reflektere rundt arbeidet ditt og besvare følgende spørsmål: Hvilke setninger var det vanskelig å annotere og hvorfor? Hvilke par (eller grupperinger) av WordNet-betydninger var det vanskelig å skille fra hverandre og hvilke kriterier brukte du for å skille mellom dem? 3 Betydningsdisambiguering (WSD) med en Naive Bayesklassifiserer (35 poeng) Filen wsd tren.txt inneholder (fiktive) data annotert med ordbetydning for lemmaet skim. Hver linje inneholder en liste med trekk og en kategori. Elementene i hver linje er adskilt med mellomrom. Første element i hver linje er kategorien og de andre elementene er trekk. Første linje ser slik ut: Reading book day novel Dette betyr at betydningskategorien for denne instansen er reading og inneholder trekkene book, day og novel. 1. Bruk treningsdataene i wsd tren.txt til å beregne sannsynligheten for betydningen removing: beregn sannsynligheten P (Removing) ved Maximum Likelihood Estimation (MLE) fra dataene. Bruk Python til å utføre beregningene dine. 2. Ett av trekkene som forekommer i treningsfilen er day. Beregn sannsynligheten for dette trekket, gitt Reading-betydningen, dvs P (day Reading). Bruk MLE over treningsdataene og bruk Python til å utføre beregningene dine. 4

3. Filen wsd test.txt inneholder en testinstans på samme format som treningsdataene, bortsett fra at kategorien er ukjent:? paper surface towards Bruk Naive Bayes-formelen for å beregne den mest sannsynlige betydningen for denne testinstansen. Bruk Python til å utføre beregningene dine. Husk at i Naive Bayes er den mest sannsynlige betydningen ŝ gitt ved: ŝ = argmax s S P (s) n P (f j s) Du kan lese mer om bruk av Naive Bayes for WSD-oppgaven i Jurafsky & Martin 20.2. j=1 5