INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning

Like dokumenter
INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V Gang 16.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 20.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang 5.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 20.3 Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Obligatorisk oppgave 4, INF2820, 2014

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V Gang Jan Tore Lønning

UNIVERSITETET I OSLO

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.

3/5/2012. Chart alternativ datastruktur. Fundamentalregelen. Chart-parsing. Bottom-up FORMELL SPRÅKTEORI. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.

INF 2820 V2016: Innleveringsoppgave 3 hele

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning

INF 2820 V2018: Innleveringsoppgave 3

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Oppgave 1. La G1 være grammatikken med hovedsymbol S og følgende regler:

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V2012

INF 2820 V2016: Obligatorisk innleveringsoppgave 3

INF2820 Datalingvistikk V2012. Jan Tore Lønning

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning

2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen

INF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY

INF2820 Datalingvistikk V Gang 6.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang 16.3 Jan Tore Lønning

2/24/2012. Dynamic Programming. I dag. Example. Example PARSING. Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Oppgave 1. Spørsmål 1.1 (10%) Gitt det regulære uttrykket: a((bcd)+(cd))*cd

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, 27.2 Jan Tore Lønning

INF 2820 V2018: Innleveringsoppgave 2

Norsyg en syntaksbasert dyp parser for norsk

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820-V2018 Oppgavesett 10 Gruppe 18.4

Uke 7: Små barn, små setninger I

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 V2017 Oppgavesett 6 Gruppe 7.3

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

IN1140: Introduksjon til språkteknologi. Forelesning #7

Oppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være:

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

UNIVERSITETET I OSLO

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

3/1/2011. I dag. Recursive descent parser. Problem for RD-parser: Top Down Space. Jan Tore Lønning & Stephan Oepen

Eksamen INF2820 Datalingvistikk, H2018, Løsningsforslag

INF2820-V2014-Oppgavesett 15, gruppe 13.5

INF2820 Datalingvistikk V Gang 26.2 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Oppgave 1 (samlet 40%)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Statisk semantisk analyse - Kap. 6

INF 2820 V2016: Obligatorisk innleverinsoppgave 1

INF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Oppgave 1 (samlet 15%)

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Statisk semantisk analyse - Kap. 6

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning

Oppgave 1 (samlet 15%)

Transkript:

INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning

I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene Eksempler Trekkbaserte grammatikker for naturlige språk, trinn-for-trinn v.1.0 «Head»-trekk v.1.5 X-bar v.2 - Generaliseringer 2

Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj 15.1 Unifikasjon og subsumpsjon J&M, seksj. 15.2 Trekkstrukturer i NLTK NLTK-boka seksj. 9.2 Trekkbaserte grammatikker (=Unifikasjonsgrammatikker) Delvis: J&M, seksj15.3, NLTK boka seksj 9.3 3

1. Regler med trekkstrukturer S NP VP NP Det N V serve V serves En ikke-terminal suppleres med en partiell trekkstruktur Mulig deling mellom trekkstrukturene i en regel Terminalene er uendret 17. mars 2015 4

1B. NLTKs format S NP VP S NP[AGR=?x] VP[AGR=?x] NP Det N NP[AGR=?x] Det[AGR=?x] Nom[AGR=?x] V serves V[AGR=[NUM=SG, PERS=3rd]] serves NLTKs format er en implementasjon av denne formalismen Men som vi vil se senere, har implementasjonen en del begrensninger i forhold til formalismen 17. mars 2015 5

En generalisering av formalisme 1 Trekkstrukturgrammatikk Syntaktisk regel: En trekkstr. på v.s Null eller flere t.s. på h.s Deling mellom trekkstr.ene Leksikalsk regel: En trekkstr. på v.s En terminal på h.s. gives 18. mars 2015 6

En generalisering av formalisme 1 18. mars 2015 Hvis det er et trekk som alle strukturene i reglene har, f.eks. CAT (eller *TYPE*) dette trekket bare tar atomære verdier, så blir dette det samme som å ha en ikke-terminal + trekkstruktur Men dette formatet gir også muligheter for utvidelser: Regler med trekkstrukturer som mangler CAT-trekk Brukes i v. 1.5 under Regler med variable som verdier for hele trekkstrukturer Brukes i v. 2.0 under gives 7

Betingelser på grammatikalitet S, Hvert lokalt tre må tillates av en grammatikkregel NP, VP, DET, N, V, NP, DET, N, the restaurant serves many fish 17. mars 2015 8

Lokalt tre tillatt av regel eks 1 t1: S, Hvert lokalt tre må tillates av en grammatikkregel NP, VP, R1: S NP VP Regelen R1 svarer til et lokalt tre t2 R1 tillater t1 hvis t1 «utvider» t2, Mer formelt: hvis t2 subsummerer t1 17. mars 2015 9

Tolkning av grammatikk Et tre T med trekkstrukturer er tillatt av grammatikk G hvis og bare hvis. Hvis t 1, t 2,, t n er alle de lokale trærne i T, så fins det tilsvarende regler i G, si g 1, g 2,, g n s.a.: tre t i er tillatt av regel g i for i= 1, 2,, n Hvis T er et annet tre tillat av de samme reglene g 1, g 2,, g n, og T subsummerer T, så subsummerer også T T. "Det skal ikke være med mer i treet enn det reglene krever. " 17. mars 2015 10

Subsumpsjon av trær Vi kan utvide definisjonen av subsumpsjon fra trekkstrukturer til trær med trekkstrukturer på nodene Et tre T subsummerer et tre T dersom T er atomær og T = T, eller T har en mor M og døtre D 1, D 2,, D n, og T har en mor M og like mange døtre D 1, D 2,, D n, der M subsummerer M, og D i subsummerer D i for i = 1, 2,, n, og Alle delinger i T er også delinger i T. 11

Eksempler med grammatikk: S -> NP[AGR=?x] VP[AGR=?x] NP[AGR=?x] -> DET[AGR=?n] N[AGR=?n] VP[AGR=?x] -> V[AGR=?x] NP V[AGR = [NUM = 'pl']] -> 'serve' V[AGR = [NUM = 'pl', PERS = '3rd']] -> 'serves' DET[PERS = '3rd'] -> 'the' DET[PERS = '3rd', NUM = 'sg'] -> 'a' DET[PERS = '3rd', NUM = 'pl'] -> 'many' N[PERS = '3rd', NUM = 'sg'] -> 'resturant' N[PERS = '3rd', NUM = 'pl'] -> 'resturants' N[PERS = '3rd', NUM = 'sg'] -> 'hamburger' N[PERS = '3rd', NUM = 'pl'] -> 'hamburgers' N[PERS = '3rd', NUM = 'sg'] -> 'customer' N[PERS = '3rd', NUM = 'pl'] -> 'customers' N[PERS = '3rd'] -> 'fish' 12 17. mars 2015

Grammatikker to alternative format 1. Trekkstrukturer i reglene 2. Regler + likninger S NP VP NP Det NOM V serves 17. mars 2015 13

Lokalt tre tillatt av regel eks 1 S, Hvert lokalt tre må tillates av en grammatikkregel NP, VP, J&M-format: Det lokale treet lystrer alle likningene 17. mars 2015 14

Lokalt tre tillatt av regel eks 2 DET, Hvert lokalt tre må tillates av en grammatikkregel the Regler + likninger: Det lokale treet lystrer alle likningene DET the <DET AGR PERS>=3rd Trekkstr. i regel DET[AGR=[PERS= 3rd ]]-> the DET, the 17. mars 2015 15

Sammenlikning av formatene 1. Trekkstrukturer i reglene Utvid ikke-terminaler med partielle trekkstrukturer Variable i trekkstrukturene for deling («reentrancy») Brukt for eksempel i tidlig Head-driven Phrase Structure Grammars (HPSG) 2. Regler + likninger Legg likninger til CFG-reglene En likning mellom To stier, eller En sti og en atomær verdi Inspirert av PATR Lexical-Functional Grammar Blir det samme (før evt utvidelser) 17. mars 2015 16

I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene Eksempler Trekkbaserte grammatikker for naturlige språk, trinn-for-trinn v.1.0 «Head»-trekk v.1.5 X-bar v.2 - Generaliseringer 17

Trekkgrammatikker for naturlige språk Vi skal se hvordan trekk kan brukes for å beskrive naturlige språk mer effektivt enn en ren CFG Vi skal trinnvis gå fra en CFG til en trekkgrammatikk. For hvert trinn fanger vi en egenskap til v 1.0 Hode («head») v 1.5 X-bar (inkludert hode) v 2.0 Bruke variable for å få mer økonomiske regler 18

Hoder ( heads ) (husker du?) I en CFG-regel har alle elementer på høyresiden samme status I en NL regel har som oftest et ledd hovedrollen NP Det N PP P NP VP V NP VP VP PP a house to the house built the house built the house in a week I et PS-tre og en CFG-regel kan en frase være hode i en annen frase I noen modeller snakker en bare om ord som hodet 19

«Hodetrekk»(Head features) (v.1.0) En frase deler mange trekk med sitt hode Hensiktsmessig å samle det i et særskilt «head» trekk + tilsvarende regel med transitive verb gives 20

Flere regler (v.1.0) 21

Trekkgrammatikker for naturlige språk Vi skal se hvordan trekk kan brukes for å beskrive naturlige språk mer effektivt enn en ren CFG Vi skal trinnvis gå fra en CFG til en trekkgrammatikk. For hvert trinn fanger vi en egenskap til v 1.0 Hode («head») v 1.5 X-bar (inkludert hode) v 2.0 Bruke variable for å få mer økonomiske regler 22

X-bar (husker du?) En antagelse i flere grammatiske modeller/teorier En frase har tre nivåer: Full frase, eks. NP (= N ) Ord, eks N Midtnivå, eks. N (kalt Nominal i J&M) NP Det N N AP N N N PP VP V V V PP V V NP For generell form og mer informasjon, se Wikipedia 23

24

N =NP N =NOM DET A =AP N =NOM N =NOM P =PP A =AP N =NOM N P =PP 25

X-barskjema med et BAR-trekk (v.1.5) En del «nomenegenskaper» er delt mellom NP og hodet N (og N =Nom) En del «verbegenskaper» er delt mellom VP og V Vi representerer dette som trekk i «head»-trekket Hva med forskjellen mellom NP (=N ), Nom (=N ), N (ordet)? Flere muligheter. En av dem er å bruke et trekk for dette BAR: (Denne løsningen kaller vi her v.1.5) 26

Så langt (v.1.5) Mot 2.0: Dette er nesten en universell X-bar-regel for flere kategorier. Men vi må foreløpig si spesielt fra om kategoriene som inngår (DET og N) Et alternativ er å Leksikalisere i N at N kan kombineres med DET til N Sammen med en modifisert regel Vi samler informasjon om kombinasjoner i et VAL(ency)-trekk (Dette er *ikke* delt mellom mor og hodedatter) 27

Trekkgrammatikker for naturlige språk Vi skal se hvordan trekk kan brukes for å beskrive naturlige språk mer effektivt enn en ren CFG Vi skal trinnvis gå fra en CFG til en trekkgrammatikk. For hvert trinn fanger vi en egenskap til v 1.0 Hode («head») v 1.5 X-bar (inkludert hode) v 2.0 Bruke variable for å få mer økonomiske regler 28

Head-specifier regel Head-complement regel-0 v.2.0 house Eksempel på leksikalsk oppslag, eller egentlig: -Leksikalsk oppslag + -Leksikalsk regel som gir entallsform Merk at N og Det bare nevnes i leksikon ikke i reglene 29

Subkategorisering Tidligere 3 VP-regler for mønstrene: VP V sleep VP V NP love VP V NP NP give Men det er mange andre mønstre VP V NP PP[to] give VP V NP VP[inf] persuade VP V CP tell (that Mary left) VP V NP CP tell (John that Mary left) VP V AP grow VP V NP PP save etc. Skal vi ha separate regler for hvert tilfelle? Bedre: La verbet selektere sine argumenter 17. mars 2015 30

Head-complement-regler: Antall argumenter kan variere v.2.0 31

v.2.0 sleeps 32

v.2.0 gives 33

v.2.0 gives 34

v.2.0 persuades 35

Subcat er ikke et HEAD-trekk Siste tilnærming i J&M sec. 15.3 er ikke god <V <V 36

Komplementer vs. modifikatorer Komplement (argument): Kim gave the book to Mary Obligatorisk Eks, ugrammatisk: *Kim gave the book Kan ikke skifte med en annen preposisjon: *Kim gave the book from Mary Plasseres i X-bar-teori som Søster til X Datter til X Eks.: P P NP, eks. til skolen V V NP, eks. så Kari V V NP PP, eks. gave the book to Mary Husker du? 37

Komplementer vs. modifikatorer Modifikator: Kim sang in the garden Kan fjernes uten at det blir ugrammatisk Kan gjentas: sang in the garden with great joy Kan bruke annen preposisjon: sang with great joy Plasseres i X-bar-teori som Søster til X Datter til X Eks.: N N PP, eks. mannen med pistolen N AP N, eks. rød bil V V PP, eks. traff Kari på stasjonen Husker du? Kan noen ganger være vanskelig å avgjøre om det er komplement eller modifikator 38

39

Modifikatorer v.2.0 N AP N Vi legger inn et trekk i modifikatoren om Hva slags ledd den kan modifisere Siden dette har med kombinasjon å gjøre, legges det i VALboksen Vi må skille mellom modifikator til høyre og til venstre for hodet 40

Modifikatorer v.2.0 N AP N small 41

Modifikatorer N N PP v.2.1 with Head-specifier og komplement-reglene må utvides til å sende MOD-trekket fra hodet og oppover 42