UNIVERSITETET I OSLO Side 1 Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2820 Datalingvistikk Eksamensdag: 14. juni 2016 Tid for eksamen: 1430-1830 Oppgavesettet er på 5 side(r) Vedlegg: 0 Tillatte hjelpemidler: ingen Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene.
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne når de kommer i tilfelle noe er uklart. Hvis du føler noen forutsetninger mangler, lag dine egne og redegjør for dem! Oppgave 1 (samlet 40%) La grammatikk G1 være: VP > VS CP CP > C S NP > DET N NP > NP PP VP > VP PP PP > P NP NP > 'dyret' 'treet' 'Kari' 'Ola' N > 'dyr' 'tre' DET > 'et' 'ethvert' VP > 'sov' 'smilte' 'danset' VTV > 'kjente' 'likte' 'dyttet' VS > 'trodde' 'så' 'fortalte' C > 'at' P > 'fra' 'til' 'ved' Spørsmål 1.1 (10%) Tegn opp de 3 trærne som grammatikken tilordner til ordsekvensen 1) Kari så at Ola dyttet et dyr fra treet Spørsmål 1.2 (5%) Forklar kort forskjellene i mening som svarer til de 3 forskjellige syntaktiske analysene. Spørsmål 1.3 (10%) Vis hvordan en «shift reduce recognizer» kan gå frem for å finne en av de 3 analysene. Du behøver bare å finne en av analysene, ikke alle tre, og du behøver bare å vise de vellykkete valgene. Spørsmål 1.4 (5%) Hvorfor tror du vi bruker en «shift reduce recognizer» og ikke en «recursive descent recognizer» her? Spørsmål 1.5 (10%) Vis hvordan CKY algoritmen kan brukes til å anerkjenne at ordsekvensen i (1) er en setning ved å konstruere en CKY tabell for den. Nummerer symbolene i den rekkefølgen du legger dem inn i tabellen.
3 Oppgave 2 (20%) I norsk kan vi etter kopulaverb, som være og bli, ha et substantiv i ubestemt form uten noen determinativ foran, som for eksempel student i setning (2). 2) Kari er student Grammatikken G2 genererer denne setningen og noen til: VP > VI VP > VCOP NOM NP > PN NP > DET NOM NOM > N N > 'elev' 'student' 'professor' PN > 'Kari' 'Ola' DET > 'en' 'enhver' VI > 'sover' 'smiler' VTV > 'kjenner' 'liker' VCOP > 'er' 'blir' Du skal nå utstyre grammatikken med trekk (eng: features ) og utvide den. Du skal utvide klassen av NP til også å inneholde substantiv i ubestemt og bestemt form i entall og flertall med determinativer, som i Ubestemt Bestemt Entall En student Studenten Den studenten Flertall Studenter Mange studenter Noen studenter De studentene Disse studentene Du skal passe på at det blir riktig samsvar mellom determinativ og substantiv, og ikke f.eks. *en studenten, *mange student, *mange studentene, *de studenten. Du skal også passe på at det blir riktig samsvar i kopulakonstruksjonen. Riktig er f.eks. Kari er student Mange elever blir studenter Feil er f.eks. Kari er elever Mange elever blir student Mange elever blir studentene
4 Oppgave 3 (samlet 20%) Følgende lille fcfg fragment, no sem, inneholder regler for noen få norske setninger og tilordner dem semantiske representasjoner. % start S S[SEM=<?npsem(?vpsem)>] > NP[SEM=?npsem] VP[SEM=?vpsem] NP[SEM=<\X.X(?npsem)>] > PN[SEM=?npsem] NP[SEM=<?dsem(?nsem)>] > Det[SEM=?dsem] Nom[SEM=?nsem ] VP[SEM=?vpsem] > IV[SEM=?vpsem] VP[SEM=<\s.?npsem(\o.?tvsem(s,o))>] > TV[SEM=?tvsem] NP[SEM=?npsem] Nom[SEM=?nsem] > N[SEM=?nsem] PN[SEM=<ola>] > 'Ola' PN[SEM=<kari>] > 'Kari' IV[SEM=<sov>] > 'sov' IV[SEM=<smilte>] > 'smilte' TV[SEM=<likte>] > 'likte' TV[SEM=<beundret>] > 'beundret' Det[SEM=<\P Q.exists x.(p(x) & Q(x))>] > 'et' Det[SEM=<\P Q.all x.(p(x) > Q(x))>] > 'ethvert' N[SEM=<hus>] > 'hus' N[SEM=<barn>] > 'barn' N[SEM=<dyr>] > 'dyr' Spørsmål 3.1 (10%) Vis hvordan setningen 3) Kari beundret et dyr vil bli analysert i denne grammatikken, og følgelig hvilken semantisk representasjon den får. Spørsmål 3.2 (10%) Grammatikken skal utvides med PP ledd som modifiserer Nom ledd. For å få dette legger vi til reglene Nom[ ] > Nom[ ] PP[ ] PP[ ] > P[ ] NP[ ] P[ ] > 'fra' Fyll ut feltene med semantiske trekk slik at setning (4) får den semantiske representasjonen (5). 4) Kari beundret ethvert dyr fra et hus 5) all x.((dyr(x) & exists z.(hus(z) & fra(x,z))) > beundret(kari,x))
5 Oppgave 4 (samlet 20%) La grammatikk G4 være VP > VI VP > VS 'at' S NP > DET NOM NOM > N NOM > NOM REL REL > 'som' S/NP S/NP > NP/NP VP S/NP > NP VP/NP VP/NP > VTV NP/NP VP/NP > VS 'at' S/NP NP/NP > NP > 'dyret' 'barnet' 'Kari' 'Ola' N > 'dyr' 'barn' DET > 'et' 'ethvert' VI > 'sov' 'smilte' 'danset' VTV > 'kjente' 'likte' 'klappet' VS > 'trodde' 'visste' 'fortalte' Her er et symbol som S/NP å oppfatte som en enkel ikke terminal (eller mao. et enkelt kategorisymbol). Skrivemåten er valgt for lettere å se hva symbolene står for. S/NP kan oppfattes som en «S som mangler en NP». Tilsvarende er NP/NP en «NP som mangler en NP». Derfor kan den være tom. Spørsmål 4.1 (5%) Tegn opp treet grammatikken tilordner til ordsekvens (6). 6) Kari klappet et dyr som Ola fortalte at barnet likte Spørsmål 4.2 (15%) Vi ønsker å bruke denne grammatikken sammen med CKY algoritmen. Men skal vi gjøre det, må grammatikken være på Chomsky normalform (CNF). Finn en grammatikk på CNF for språket beskrevet av G4. Viss trinnene i omformingen. SLUTT