LF - Eksamen i INF1820

Like dokumenter
INF1820: Oppsummering

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #12

Kvalitet, tilgjengelighet og differensiering innen grunnutdanningen i matematikk

UNIVERSITETET I OSLO

IN1140: Introduksjon til språkteknologi. Forelesning #13

UNIVERSITETET I OSLO

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

UNIVERSITETET I OSLO

IN1140: Introduksjon til språkteknologi. Forelesning #7

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i TMA4140 Diskret matematikk

UNIVERSITETET I OSLO

LØSNINGSFORSLAG UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet. Oppgave 1 Mengdelære (10 poeng)

UNIVERSITETET I OSLO

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF 2820 V2016: Obligatorisk innleverinsoppgave 1

UNIVERSITETET I OSLO

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

EKSAMEN. Oppgavesettet består av 16 oppgaver. Ved sensur vil alle oppgaver telle like mye med unntak av oppgave 6 som teller som to oppgaver.

INF2820 V2017 Oppgavesett 6 Gruppe 7.3

IN1140 H2018 gruppeoppgaver Sannsynlighet og språkmodeller

UNIVERSITETET I OSLO

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2014. Jan Tore Lønning

IN1140: Introduksjon til språkteknologi. Forelesning #8

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

INF 2820 V2016: Obligatorisk innleveringsoppgave 3

UNIVERSITETET I OSLO

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Turn plan: Jugendfeber/ Mal din by - H16

Løsningsforslag til obligatorisk oppgave 3 INF1800 Logikk og beregnbarhet, høsten 2009

Eksamen INF2270 våren 2018

INF1820: Ordklasser INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

INF1820: Applikasjoner

Oppgave 1 (samlet 40%)

EKSAMEN. Oppgavesettet består av 9 oppgaver med i alt 21 deloppgaver. Ved sensur vil alle deloppgaver telle omtrent like mye.

Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Litt om kompilering og interpretering. Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Syntaks og semantikk

MAT1030 Diskret matematikk

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

EKSAMEN. Oppgavesettet består av 11 oppgaver med i alt 21 deloppgaver. Ved sensur vil alle deloppgaver telle omtrent like mye.

Forelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28)

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt

UNIVERSITETET I OSLO

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Oppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være:

UNIVERSITETET I OSLO

Velkommen til MAT1030!

MAT1030 Diskret Matematikk

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet. INF1080 Logiske metoder for informatikk

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Mandag til torsdag kolumbus.no bestilt av passasjerer fra stedet min. 30 min før anløpstid besøk bestilling.kolumbus.no

MAT1030 Diskret Matematikk

EKSAMEN. Emne: Emnekode: Matematikk for IT ITF Dato: Eksamenstid: til desember Hjelpemidler: Faglærer:

Eksamen INF2820 Datalingvistikk, H2018, Løsningsforslag

INF5820 Language technological applications. H2008 Jan Tore Lønning/Stephan Oepen

Leksikalsk semantikk II

INF1080 Logiske metoder for informatikk. 1 Små oppgaver [70 poeng] 1.1 Grunnleggende mengdelære [3 poeng] 1.2 Utsagnslogikk [3 poeng]

EKSAMEN. Oppgavesettet består av 9 oppgaver med i alt 20 deloppgaver. Ved sensur vil alle deloppgaver telle omtrent like mye.

EKSAMENSOPPGAVE. Adm.bygget, rom K1.04 og B154 Ingen. Vil det bli gått oppklaringsrunde i eksamenslokalet? Svar: JA / NEI Hvis JA: ca. kl.

Oppgave 1. Spørsmål 1.1 (10%) Gitt det regulære uttrykket: a((bcd)+(cd))*cd

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.

IN1140: Introduksjon til språkteknologi. Forelesning #8

UNIVERSITETET I OSLO

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Slides til 12.1 Formelt språk og formell grammatikk

Oppgaver til INF 5110, kapittel 5, med svarforslag Gjennomgått torsdag 26. febr Dette er versjon fra 28/7

UNIVERSITETET I OSLO

Løsningsforslag. Oppgavesettet består av 9 oppgaver med i alt 20 deloppgaver. Ved sensur vil alle deloppgaver telle omtrent like mye.

UNIVERSITETET I OSLO

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

Repetisjon. 1 binærtall. INF3110 Programmeringsspråk. Sist så vi ulike notasjoner for syntaks: Jernbanediagrammer. BNF-grammatikker.

INF 2820 V2016: Innleveringsoppgave 3 hele

INF1080 Logiske metoder for informatikk. 1 Små oppgaver [70 poeng] 1.1 Grunnleggende mengdelære [3 poeng] 1.2 Utsagnslogikk [3 poeng]

Transkript:

LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar og 0 poeng for hvert galt svar. Oppgavene Oppgavesettet består av oppgaver. Om du synes noe i oppgaveteksten er uklart, kan du gjøre dine egne forutsetninger, men skriv disse tydelig. Regulære uttrykk Hvilket av disse navnene gjenkjennes med det regulære uttrykket /[A-Z][a-z]+\.\s[A-Za-z]+\s[A-Za-z]+/?. Pres. Barack Obama 2. President B. Obama 3. Pres. B. Obama 4. President Obama

2 Regulært uttrykk for datoer Skriv et regulært uttrykk som gjenkjenner datoer av typen fredag 5/4, mandag 6/2 eller torsdag 30/5. Uttrykket ditt skal ikke gjenkjenne umulige datoer av typen mandag 36/2 eller fredag 25/4, men du trenger ikke å ta høyde for riktig antall dager i hver måned (slik som eksempelvis å utelukke 30/2). /(man tirs ons tors fre lør søn)dag\s([-9] [2][0-9] 3[0])\/([-9] [02])/ 3 Endelige tilstandsmaskiner Ta utgangspunkt i følgende endelig tilstandsmaskin: 0 0 0 0, q start 0 q q 2 q 3. Beskriv språket som gjenkjennes av denne maskinen. 2. Angi transisjonstabellen for maskinen.. Språket som består av strenger av 0 og men minst tre ere 2. 0 q0 q0 q q q q2 q2 q2 q3 q3: q3 q3 2

4 Bøyning og avledning Hvordan kan vi skille mellom bøyning og avledning? Illustrér med minst to eksempler på hver av disse hentet fra følgende tekst: En forelesning er en undervisningsform som er vanlig ved universiteter og høyskoler. Studentene sitter i en sal (såkalt auditorium) og hører på en foreleser (f.eks. professor eller lektor), som snakker om et faglig tema relatert til et gitt studium. Forelesningen kan også inneholde fremvisninger via projektor eller overhead. Avledning: fore+les+ning høy+skole fag+lig frem+visning Bøyning: universitet+er student+ene hør+er snakk+er forelesning+en Avledning vs bøyning: bøyning endrer aldri ordklasse (fag+lig) kun avledning har prefikser (frem+vis+ning) bøyningssuffikser har svakt trykk (snakk+er) bøyningssuffiksene ligger til slutt i ordet (forelesning+en) 5 Språkmodeller Den vedlagte tabellen angir formelen for en språkmodell (en såkalt bigrammodell) samt et lite tekstkorpus.. Hvilke bigrammer forekommer i korpuset? 3

<s> Per Per synger <s> Kari Kari synger synger <\s> <s> Ola Ola synger synger ikke ikke <\s> 2. Hvordan beregner vi sannsynligheten for et ord gitt det foregående ordet (P (wi wi )) fra et korpus? P(w w_n-) = C(w_n-, w_n) / C(w_n-) Feks P (synger Kari) = C(Kari, synger)/c(kari) 3. Du skal nå bruke bigrammodellen samt tekstkorpuset til å beregne sannsynligheten for setningen <s> Kari synger ikke <\s>. Vis hvilke sannsynligheter du trenger samt hvordan disse beregnes fra korpuset. Du trenger ikke å regne ut den totale sannsynligheten for setningen. P(Kari <s>) * P(synger Kari) * P(ikke synger) * P(<\s> ikke) C(<s> Kari)/C(<s>) * C(Kari synger)/c(kari) * C(synger ikke)/c(synger) * C(ikke </s>)/c(ikke) /3 * / * 2/3 * 2/2 6 Strukturell flertydighet Hvor mange analyser tildeler følgende grammatikk til setningen Kari gir Per en bok? S -> NP VP NP -> Per Kari Ola boka NP -> D N D -> en N -> bok PP -> P NP P -> med VP -> V NP VP -> V NP NP 4

VP -> VP PP V -> gir V -> slår Velg ett alternativ 2 0 3 7 Kontekstfrie grammatikker Setningen Per slår Ola med boka er strukturelt flertydig.. Beskriv de to ulike tolkningene med egne ord. Enten bruker Per boka til å slå med eller så holder Ola en bok mens han blir slått. 2. Den vedlagte grammatikken gir kun én analyse for denne setningen. Hvordan kan du utvide grammatikken slik at den kan representere flertydighet av denne typen? Svar vi utvider med følgende regel: NP > NP P P 3. Er grammatikken rekursiv? Hvis ja, på hvilken måte? Hvis nei, gi et eksempel på en rekursiv regel. Grammatikken er rekursiv. Reglene som inkluderer PP er er det man kaller direkte rekursive (V P > V P P P, NP > NP P P ) og gjør at vi kan legge til et vilkårlig antall preposisjonsfraser. 8 Konstituenttester Hvilke lingvistiske tester har vi for å avgjøre hvorvidt noe er en syntaktisk konstituent? Beskriv minst to slike tester og illustrér med minst ett eksempel for hver av dem. Erstatt med pronomen F.eks.: Han slår Ola med boka Per slår ham med boka Flytte som enhet 5

F.eks. Det er Ola som slår Per med boka Det er Per som blir slått av Ola Svar på spørsmål F.eks. Hvem slår Ola? Per Hvem blir slått av Per? Ola 9 Chunking Hva er chunking? Angi hvordan setningen fra forrige oppgave ( Per slår Ola med boka ) vil analyseres ved bruk av chunking. Chunking er en grunn syntaktisk analyse som deler setningen opp i deler, såkalte chunks. Disse består av et hode samt evt foranstilt materiale, men tar ikke ikke høyde for rekursjon. Setningen fra forrige oppgave analyseres i følgende chunks: Per slår Ola med boka 0 Leksikal semantikk Hvilken semantisk relasjon holder mellom følgende ord-par: Homonymi Synonymi Antonymi Hyponymi Meronymi sykkel - hjul blå - brun rask - hurtig levende - død dyr - hund 6

Maskinoversettelse Vedlagte figur viser den såkalte Vauquois-triangelen som beskriver tre regelbaserte metoder for maskinoversettelse. Hva kjennetegner de tre metodene?. direkte: ord-for-ord oversettelse med noe morfologisk analyse 2. transfer: syntaktisk analyse + syntaktiske transfer-regler 3. semantisk (interlingua): syntaktisk analyse + semantisk analyse til et interlingua (språkuavhengig semantisk representasjon, feks. logisk form) og generering fra denne 7