INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning
I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene Eksempler Trekkbaserte grammatikker for naturlige språk, trinn-for-trinn v.1.0 «Head»-trekk v.1.5 X-bar v.2 - Generaliseringer 2
Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj 15.1 Unifikasjon og subsumpsjon J&M, seksj. 15.2 Trekkstrukturer i NLTK NLTK-boka seksj. 9.2 Trekkbaserte grammatikker (=Unifikasjonsgrammatikker) Delvis: J&M, seksj15.3, NLTK boka seksj 9.3 3
1. Regler med trekkstrukturer S NP VP NP Det N V serve V serves En ikke-terminal suppleres med en partiell trekkstruktur Mulig deling mellom trekkstrukturene i en regel Terminalene er uendret 17. mars 2015 4
1B. NLTKs format S NP VP S NP[AGR=?x] VP[AGR=?x] NP Det N NP[AGR=?x] Det[AGR=?x] Nom[AGR=?x] V serves V[AGR=[NUM=SG, PERS=3rd]] serves NLTKs format er en implementasjon av denne formalismen Men som vi vil se senere, har implementasjonen en del begrensninger i forhold til formalismen 17. mars 2015 5
En generalisering av formalisme 1 Trekkstrukturgrammatikk Syntaktisk regel: En trekkstr. på v.s Null eller flere t.s. på h.s Deling mellom trekkstr.ene Leksikalsk regel: En trekkstr. på v.s En terminal på h.s. gives 18. mars 2015 6
En generalisering av formalisme 1 18. mars 2015 Hvis det er et trekk som alle strukturene i reglene har, f.eks. CAT (eller *TYPE*) dette trekket bare tar atomære verdier, så blir dette det samme som å ha en ikke-terminal + trekkstruktur Men dette formatet gir også muligheter for utvidelser: Regler med trekkstrukturer som mangler CAT-trekk Brukes i v. 1.5 under Regler med variable som verdier for hele trekkstrukturer Brukes i v. 2.0 under gives 7
Betingelser på grammatikalitet S, Hvert lokalt tre må tillates av en grammatikkregel NP, VP, DET, N, V, NP, DET, N, the restaurant serves many fish 17. mars 2015 8
Lokalt tre tillatt av regel eks 1 t1: S, Hvert lokalt tre må tillates av en grammatikkregel NP, VP, R1: S NP VP Regelen R1 svarer til et lokalt tre t2 R1 tillater t1 hvis t1 «utvider» t2, Mer formelt: hvis t2 subsummerer t1 17. mars 2015 9
Tolkning av grammatikk Et tre T med trekkstrukturer er tillatt av grammatikk G hvis og bare hvis. Hvis t 1, t 2,, t n er alle de lokale trærne i T, så fins det tilsvarende regler i G, si g 1, g 2,, g n s.a.: tre t i er tillatt av regel g i for i= 1, 2,, n Hvis T er et annet tre tillat av de samme reglene g 1, g 2,, g n, og T subsummerer T, så subsummerer også T T. "Det skal ikke være med mer i treet enn det reglene krever. " 17. mars 2015 10
Subsumpsjon av trær Vi kan utvide definisjonen av subsumpsjon fra trekkstrukturer til trær med trekkstrukturer på nodene Et tre T subsummerer et tre T dersom T er atomær og T = T, eller T har en mor M og døtre D 1, D 2,, D n, og T har en mor M og like mange døtre D 1, D 2,, D n, der M subsummerer M, og D i subsummerer D i for i = 1, 2,, n, og Alle delinger i T er også delinger i T. 11
Eksempler med grammatikk: S -> NP[AGR=?x] VP[AGR=?x] NP[AGR=?x] -> DET[AGR=?n] N[AGR=?n] VP[AGR=?x] -> V[AGR=?x] NP V[AGR = [NUM = 'pl']] -> 'serve' V[AGR = [NUM = 'pl', PERS = '3rd']] -> 'serves' DET[PERS = '3rd'] -> 'the' DET[PERS = '3rd', NUM = 'sg'] -> 'a' DET[PERS = '3rd', NUM = 'pl'] -> 'many' N[PERS = '3rd', NUM = 'sg'] -> 'resturant' N[PERS = '3rd', NUM = 'pl'] -> 'resturants' N[PERS = '3rd', NUM = 'sg'] -> 'hamburger' N[PERS = '3rd', NUM = 'pl'] -> 'hamburgers' N[PERS = '3rd', NUM = 'sg'] -> 'customer' N[PERS = '3rd', NUM = 'pl'] -> 'customers' N[PERS = '3rd'] -> 'fish' 12 17. mars 2015
Grammatikker to alternative format 1. Trekkstrukturer i reglene 2. Regler + likninger S NP VP NP Det NOM V serves 17. mars 2015 13
Lokalt tre tillatt av regel eks 1 S, Hvert lokalt tre må tillates av en grammatikkregel NP, VP, J&M-format: Det lokale treet lystrer alle likningene 17. mars 2015 14
Lokalt tre tillatt av regel eks 2 DET, Hvert lokalt tre må tillates av en grammatikkregel the Regler + likninger: Det lokale treet lystrer alle likningene DET the <DET AGR PERS>=3rd Trekkstr. i regel DET[AGR=[PERS= 3rd ]]-> the DET, the 17. mars 2015 15
Sammenlikning av formatene 1. Trekkstrukturer i reglene Utvid ikke-terminaler med partielle trekkstrukturer Variable i trekkstrukturene for deling («reentrancy») Brukt for eksempel i tidlig Head-driven Phrase Structure Grammars (HPSG) 2. Regler + likninger Legg likninger til CFG-reglene En likning mellom To stier, eller En sti og en atomær verdi Inspirert av PATR Lexical-Functional Grammar Blir det samme (før evt utvidelser) 17. mars 2015 16
I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene Eksempler Trekkbaserte grammatikker for naturlige språk, trinn-for-trinn v.1.0 «Head»-trekk v.1.5 X-bar v.2 - Generaliseringer 17
Trekkgrammatikker for naturlige språk Vi skal se hvordan trekk kan brukes for å beskrive naturlige språk mer effektivt enn en ren CFG Vi skal trinnvis gå fra en CFG til en trekkgrammatikk. For hvert trinn fanger vi en egenskap til v 1.0 Hode («head») v 1.5 X-bar (inkludert hode) v 2.0 Bruke variable for å få mer økonomiske regler 18
Hoder ( heads ) (husker du?) I en CFG-regel har alle elementer på høyresiden samme status I en NL regel har som oftest et ledd hovedrollen NP Det N PP P NP VP V NP VP VP PP a house to the house built the house built the house in a week I et PS-tre og en CFG-regel kan en frase være hode i en annen frase I noen modeller snakker en bare om ord som hodet 19
«Hodetrekk»(Head features) (v.1.0) En frase deler mange trekk med sitt hode Hensiktsmessig å samle det i et særskilt «head» trekk + tilsvarende regel med transitive verb gives 20
Flere regler (v.1.0) 21
Trekkgrammatikker for naturlige språk Vi skal se hvordan trekk kan brukes for å beskrive naturlige språk mer effektivt enn en ren CFG Vi skal trinnvis gå fra en CFG til en trekkgrammatikk. For hvert trinn fanger vi en egenskap til v 1.0 Hode («head») v 1.5 X-bar (inkludert hode) v 2.0 Bruke variable for å få mer økonomiske regler 22
X-bar (husker du?) En antagelse i flere grammatiske modeller/teorier En frase har tre nivåer: Full frase, eks. NP (= N ) Ord, eks N Midtnivå, eks. N (kalt Nominal i J&M) NP Det N N AP N N N PP VP V V V PP V V NP For generell form og mer informasjon, se Wikipedia 23
24
N =NP N =NOM DET A =AP N =NOM N =NOM P =PP A =AP N =NOM N P =PP 25
X-barskjema med et BAR-trekk (v.1.5) En del «nomenegenskaper» er delt mellom NP og hodet N (og N =Nom) En del «verbegenskaper» er delt mellom VP og V Vi representerer dette som trekk i «head»-trekket Hva med forskjellen mellom NP (=N ), Nom (=N ), N (ordet)? Flere muligheter. En av dem er å bruke et trekk for dette BAR: (Denne løsningen kaller vi her v.1.5) 26
Så langt (v.1.5) Mot 2.0: Dette er nesten en universell X-bar-regel for flere kategorier. Men vi må foreløpig si spesielt fra om kategoriene som inngår (DET og N) Et alternativ er å Leksikalisere i N at N kan kombineres med DET til N Sammen med en modifisert regel Vi samler informasjon om kombinasjoner i et VAL(ency)-trekk (Dette er *ikke* delt mellom mor og hodedatter) 27
Trekkgrammatikker for naturlige språk Vi skal se hvordan trekk kan brukes for å beskrive naturlige språk mer effektivt enn en ren CFG Vi skal trinnvis gå fra en CFG til en trekkgrammatikk. For hvert trinn fanger vi en egenskap til v 1.0 Hode («head») v 1.5 X-bar (inkludert hode) v 2.0 Bruke variable for å få mer økonomiske regler 28
Head-specifier regel Head-complement regel-0 v.2.0 house Eksempel på leksikalsk oppslag, eller egentlig: -Leksikalsk oppslag + -Leksikalsk regel som gir entallsform Merk at N og Det bare nevnes i leksikon ikke i reglene 29
Subkategorisering Tidligere 3 VP-regler for mønstrene: VP V sleep VP V NP love VP V NP NP give Men det er mange andre mønstre VP V NP PP[to] give VP V NP VP[inf] persuade VP V CP tell (that Mary left) VP V NP CP tell (John that Mary left) VP V AP grow VP V NP PP save etc. Skal vi ha separate regler for hvert tilfelle? Bedre: La verbet selektere sine argumenter 17. mars 2015 30
Head-complement-regler: Antall argumenter kan variere v.2.0 31
v.2.0 sleeps 32
v.2.0 gives 33
v.2.0 gives 34
v.2.0 persuades 35
Subcat er ikke et HEAD-trekk Siste tilnærming i J&M sec. 15.3 er ikke god <V <V 36
Komplementer vs. modifikatorer Komplement (argument): Kim gave the book to Mary Obligatorisk Eks, ugrammatisk: *Kim gave the book Kan ikke skifte med en annen preposisjon: *Kim gave the book from Mary Plasseres i X-bar-teori som Søster til X Datter til X Eks.: P P NP, eks. til skolen V V NP, eks. så Kari V V NP PP, eks. gave the book to Mary Husker du? 37
Komplementer vs. modifikatorer Modifikator: Kim sang in the garden Kan fjernes uten at det blir ugrammatisk Kan gjentas: sang in the garden with great joy Kan bruke annen preposisjon: sang with great joy Plasseres i X-bar-teori som Søster til X Datter til X Eks.: N N PP, eks. mannen med pistolen N AP N, eks. rød bil V V PP, eks. traff Kari på stasjonen Husker du? Kan noen ganger være vanskelig å avgjøre om det er komplement eller modifikator 38
39
Modifikatorer v.2.0 N AP N Vi legger inn et trekk i modifikatoren om Hva slags ledd den kan modifisere Siden dette har med kombinasjon å gjøre, legges det i VALboksen Vi må skille mellom modifikator til høyre og til venstre for hodet 40
Modifikatorer v.2.0 N AP N small 41
Modifikatorer N N PP v.2.1 with Head-specifier og komplement-reglene må utvides til å sende MOD-trekket fra hodet og oppover 42