INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Like dokumenter
INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #7

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #8

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

LF - Eksamen i INF1820

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

INF1820: Ordklasser INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

EXFAC EURA Syntaks2 1

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Setningsledd. Norsk som fremmedspråk Side 131

IN1140: Introduksjon til språkteknologi. Forelesning #8

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Uke 7: Små barn, små setninger I

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

UNIVERSITETET I OSLO

Slides til 12.1 Formelt språk og formell grammatikk

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

En del av kildene i denne delen av oppgaven er av eldre art. Blant annet henviser jeg til Heggelund sin avhandling, med utgivelsesår 1981.

INF1820: Oppsummering

IN1140: Introduksjon til språkteknologi. Forelesning #12

Syntaks. Setningstruktur, form og funksjon, analyse Kap. 12. EXFAC EURA Syntaks1 0

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF 2820 V2016: Innleveringsoppgave 3 hele

3. Generell presentasjon av MT-programmet

ANDEBU KOMMUNE ANDEBU UNGDOMSSKOLE

INF1820 INF Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #2

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :

UNIVERSITETET I OSLO

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.

Oppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være:

norsk grammatikk 149BE6CADCAB6FFCFBAA3C DC4 Norsk Grammatikk 1 / 6

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Ordklasser Inndelingen ORDKLASSEINNDELINGEN

FORBEREDELSE TIL ÅRSPRØVE I ENGELSK 7. KLASSE FREDAG 19. MAI 2017

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Norsk minigrammatikk bokmål

Innhold. 1 Innledning Semantikk Talespråk og skriftspråk 47. Forkortelser Språket som kodesystem 17 1.

APPENDIKS D Geminittisk språk/grammatikk

2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.

"Det er fort gjort og skrive feil." En presentasjon av en automatisk grammatikkontroll for bokmål

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen

Uke 10: Jakten på de forsvunnede subjektet: Om barns tidlige subjektsløse setninger.

For økt elevengasjement i norsk 8 10

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF1820 V2014 Oppgave 3b CFGer og semantikk

Parsing basert på LFG: Et MlT/Xerox-system applisert på norsk

INF 2820 V2018: Innleveringsoppgave 2

Grammatikk En innføring av Anne Lene Berge

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Overblikk over komplementer i kinesisk

Ivar Utne, ; RETTA ; forslag om oppg. II (tekstslingvistikk) FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F

Fasit til oppgaver i Språk i skolen, kapittel 4. Versjon: 15. mai 2015

UNIVERSITETET I OSLO

Norsyg en syntaksbasert dyp parser for norsk

Overblikk over komplementer i kinesisk

INF2820 Datalingvistikk V gang, Jan Tore Lønning

SANDEFJORD KOMMUNE ANDEBU UNGDOMSSKOLE

INF 2820 V2016: Obligatorisk innleverinsoppgave 1

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning

INF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning

PLAN FOR DAGENE BARNEHAGENORSK: VELKOMMEN TIL 5. SAMLING! FEBRUAR

Mannen min heter Ingar. Han er også lege. Han er privatpraktiserende lege og har et kontor på Grünerløkka sammen med en kollega.

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning

UKEPLAN FOR 7A, UKE 23 TIME

Lokal læreplan engelsk 4.klasse Lærebok: Stairs 4

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Satsingsområder: Lesing, skriving og regning Tilpasset opplæring Digital kompetanse

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1

Grammatikk Adverb. Forteller oss noe nytt om ord eller setninger

Oppgave 1 (samlet 40%)

Norske partikkelverb og oversettelse til spansk

Transkript:

INF1820: Introduksjon til språk-og kommunikasjonsteknologi Åttende forelesning Lilja Øvrelid 13 mars, 2017 1 I dag: Syntaks 2

Bakgrunn Syntaks: studiet av prinsipper og regler for setningsdannelse Beskrivelse av naturlige språk via sett med generelle (universelle) regler Gammel disiplin Pãṇini: sanskrit grammatiker (4 BC) Mange teorier: mye til felles, en del forskjeller Government and Binding (GB) Minimalism Program (MP) Head-driven phrase structure grammar (HPSG) Lexical Functional Grammar (LFG) Categorial Grammar Dependency Grammar... 3 Generativ grammatikk Noam Chomsky: Syntactic Structures (1957) Syn på språk inspirert av naturvitenskap: språket er en mengde setninger mengde: en samling objekter, f.eks.: {a, b, c}, a {a, b, c}, d / {a, b, c} Eksplisitt beskrivelse av denne mengden Alle nordmenn liker ikke fotball Liker ikke alle nordmenn fotball *Nordmenn alle ikke liker fotball *Liker nordmenn fotball ikke alle 4

Grammatiske beskrivelser Generativ? den grammatiske beskrivelsen skal generere alle og bare de grammatiske setningene i språket. Alle nordmenn liker ikke fotball Liker ikke alle nordmenn fotball *Nordmenn alle ikke liker fotball *Liker nordmenn fotball ikke alle 5 Grammatiske beskrivelser Ekstensjonell (oppregning) vs. intensjonell (beskrivelse): ekstensjonell: liste opp alle setninger: {... Alle nordmenn liker fotball, Alle nordmenn liker ikke fotball, Alle nordmenn liker fotball og friidrett, Alle nordmenn liker ikke fotball og friidrett... } 6

Grammatiske beskrivelser Problem med ekstensjonell beskrivelse: i prinsippet uendelig antall setninger sier ingenting om setningers struktur Alle nordmenn liker fotball Alle nordmenn liker fotball 7 Grammatiske beskrivelser En grammatikk er en beskrivelse av et språk Inneholder: hvordan en språklig enhet ser ut form rollen enheten spiller i forhold til andre språklige enheter funksjon Samme form kan ha ulik funksjon: Hun kjøpte et pent hus. Huset er pent. Hun synger pent. Form og funksjon for større enheter enn ord Et pent hus er ikke alltid dyrere. Vi bodde i et pent hus. 8

Grammatiske beskrivelser Setningers struktur: Mer enn bare den lineære rekkefølgen Hierarkisk ordnede fraser: funksjon - enkeltord og større grupper: Jeg liker fotball Alle nordmenn liker fotball flertydighet - samme (lineære) ordstreng, ulik frasestruktur: Hun så gutten med teleskopet [så gutten med teleskopet] [gutten med teleskopet] 9 Grammatiske beskrivelser En generativ grammatikk: genererer alle og bare de grammatiske setningene i et språk tildeler hver setning en strukturell beskrivelse En (generativ) grammatisk beskrivelse er en eksplisitt redegjørelse for mengden setninger i et språk Syntaktiske regler 10

Generativ grammatikks metodologi Data: våre språklige intuisjoner Hypotetisk-deduktiv metode hypotetisk: formulerer hypoteser deduktiv: deduserer (utleder) testbare konsekvenser fra hypotesene hypoteser kan ikke verifiseres, men styrkes Den svenske professsoren (en vits): Det var en gang en svensk professor som arbeidet ut i fra en hypotese om at lopper hører med beina. Han hadde en dressert loppe. Når professoren sa Hopp!, så hoppet loppen. Så gjorde professoren følgende forutsigelse: Hvis jeg river beina av loppen, blir den døv. Han gjorde det. Når han deretter sa Hopp! til loppen, hoppet den ikke. Professoren konkluderte som følger: Hypotesen om at lopper hører med beina stemmer. 11 Syntaks

Syntaks Studiet av hvordan setninger bygges opp av ord og ordkombinasjoner, såkalte konstituenter Syntaktisk form - konstituenter beskrives i form av ordklasser, fraser: fraser - større konstituenter over ordnivå fraser navngis etter hodet - det sentrale, obligatoriske medlemmet, referanse Syntaktisk funksjon - konstituenter beskrives i form av sin funksjon i setningen som helhet Subjekt (Direkte og indirekte) Objekt Adverbial 12 Syntaks ord fraser setninger Setningen - inneholder en finitt verbform og (som regel) et subjekt Spis! Bea lukket vinduet fort. Frasen - bygger opp setningen eller andre fraser (hierarkisk) og navngis etter hodet NP (noun phrase) VP (verb phrase) PP (prepositional phrase) etc. 13

Syntaktiske regler Kombinerer ord til fraser og fraser til setninger Beskriver forholdet mellom grupper av ord (ordklasser) og plassering i setningen DT liker å komme foran et substantiv Syntaktiske funksjoner: subjekt, objekt Andre begrensninger som påvirker grammatikalitet *Bea fant *Bea fant fort *Bea fant i bilen Bea fant nøkkelen 14 Syntaktiske regler Beskriver hierarkisk gruppering av ord gamle menn og kvinner kan forlate skipet [gamle menn] og [kvinner] [gamle [menn og kvinner]] 15

Syntaktiske regler Strukturell flertydighet For sale: an antique desk suitable for lady with thick legs and large drawers We will oil your sewing machine and adjust tension in your home for $10.00 Flertydighet grunnet flere mulige strukturer for en setning Forklarer hvordan gruppering av ord relaterer til betydning 16 Grammatikalitet Språkbrukere kan utføre grammatikalitetsbedømninger Grammatisk er ikke det samme som meningsfull Colorless green ideas sleep furiously *Furiously green sleep ideas colorless Syntaktisk korrekt, semantisk nonsens Bekrefter skillet mellom syntaks og semantikk 17

Syntaktisk struktur Konstituenter Konstituenter grupperinger av ord i en setning, fungerer som en enhet The dog ate my homework The dog ate my homework Hvordan kan vi avgjøre konstituentstatus? Lingvistiske tester 18

Konstituenter Lingvistiske tester: stå alene -testen: What did the dog eat? My homework *ate my erstattes med pronomen The dog ate it The dog ate my homework and the cat did too Flyttes som enhet : It was my homework that the dog ate. My homework was eaten by the dog. 19 Konstituenter Eksempel: The dog played in the garden Where did the dog play? In the garden (stå alene) The dog played there (erstattes med pronomen) In the garden is where the dog played (flytter som enhet) 20

Fraser Fraser: syntaktiske kategorier Et enkelt ord kan bygges ut til en gruppe ord, slik at den nye gruppen har samme funksjon i setningen (en konstituent) Kan substitueres for hverandre Fraser: The dog ate the cake The dog ate the birthday cake The dog ate the delicious birthday cake The dog ate the delicious birthday cake that was meant for Bea (adledd) hode (adledd: utfylling) (the delicious birthday) cake (that was meant for Bea) 21

Substantivfraser (NP) Hodet er et substantiv Fungerer typisk som subjekt eller objekt i setningen Eksempler: determinativ + substantiv: the dog, en hund egennavn: Barack Obama, Japan pronomen: he, they, han, henne Kongruens feks tall, kjønn, bestemthet Hodet bestemmer kongruens 22 Preposisjonsfraser (PP) Hodet er en preposisjon Etterfølges av en NP-utfylling (preposisjonsobjekt) Eksempler: prep + NP in the garden, over the rooftops foranstilt adledd (Adj) dypest ned i skuffen 23

Adjektivfraser (AdjP) Hodet er et adjektiv Kan ha foranstilt adledd: adverb eller andre adjektiv Noen adjektiv tar etterstilt utfylling (som verb) Eksempler: Adj: crazy, red, brilliant foranstilt adledd: almost crazy, pretty big etterstilt adledd: crazy about dogs, lik sin far 24 Verbfraser (VP) Hodet er et verb i finitt eller infinitt form Eksempler: verb sover, danset verb + NP: spiste kaken verb + NP + NP: ga ham kaken verb + NP + PP: la alle papirene i skuffen Kan komplettere: Jeg/Barnet/Den rare mannen... 25

Trær og regler Syntaktiske kategorier Frasale kategorier: NP, VP, AdjP, PP Leksikale kategorier: N, V, P, Adj, Adv Frasestrukturtre (Phrase Structure (PS) tree) S NP VP Det N V NP the dog ate Det N my homework 26

Frasestrukturtrær The dog ate my homework leksikale kategorier finne umiddelbare konstituenter finne hodet ikke-leksikale kategorier (fraser) top down vs bottom up 27 Frasestrukturtrær 1. Lineær rekkefølge i setningen 2. Syntaktiske kategorier for ord og grupper av ord 3. Hierarkisk struktur noder som forbindes av grener Tremetaforer: rot, løv ( leaves ), grener Familiemetaforer: mor, datter, barn, søster Dominans: ikke-refleksiv, asymmetrisk unik rot: kun en node som ikke domineres av noen annen node 28

Frasestrukturregler Informasjonen i et frasestrukturtre kan også representeres som frasestrukturregler Generaliserer over vår syntaktiske kunnskap Spesifiserer de velformede strukturene i et språk 1. S NP VP 2. NP D N 3. VP V NP 29 Frasestrukturregler Noen flere regler: intransitive verb 1. The cat purred 2. The woman laughed VP V 30

Frasestrukturregler Noen flere regler: PP i VP 1. The dog played in the garden 2. The cat ate the cake on the terrace VP VP PP PP P NP 31 Frasestrukturregler Noen flere regler: leddsetninger (innledes av subjunksjon complementizer (C)): 1. My brother said that the dog purred 2. We wondered whether the cat ate the cake VP V CP CP C S 32

Rekursive strukturer mengden av setninger i et naturlig språk antas å være uendelig språkets kreativitet Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv. 33 Rekursive strukturer endelig og eksplisitt grammatisk beskrivelse trenger mekanisme som kan generere (i prinsipp) uendelige strukturer rekursive strukturer: inneholder en delstruktur av samme type som helheten progammeringsspråk: feks Python frasestrukturgrammatikk: en trestruktur er rekursiv dersom den inneholder en node som dominerer en annen node med samme etikett 34

Rekursive strukturer Rekursive regler gjør at grammatikken kan generere et uendelig antall strukturer The dog played in the garden on Monday The dog played in the garden on Monday for an hour The dog played in the garden on Monday for an hour with a stick VP V PP?? VP VP PP 35 Rekursive strukturer Andre rekursive regler The dog with the collar barked The dog with the collar around its neck barked The dog with the collar around its neck on the sofa barked... NP NP PP 36

Bar-kategorier Annet eksempel på rekursjon: adjektiver The kindhearted intelligent handsome boy NP Adj NP? NEI Determinativer og adjektiver har forskjellig status innenfor substantivfrasen kun én determinativ, flere adjektiv adjektiver modifiserer substantivet direkte, determinativet har rekkevidde over Adj+N Introduserer et nivå mellom NP og N: N NP Det N N Adj N N N 37 Setninger Alle fraser har hode hva med setningen? The dog will eat the cake The dog has eaten the cake The dog is eating the cake The dog might eat the cake VP Aux VP Spesifiserer tidsramme for hendelsen beskrevet av verbet Aux er hodet: alle hendelser er lokalisert i tid 38

Seleksjon Seleksjon: beskriver krav visse hoder har på sine syntaktiske omgivelser verb selekterer forskjellige komplementer The dog found the cake (NP) vs. *The dog found My brother said that the cat ate it (CP) vs *My brother said The cat purred () vs *The cat purred my brother 39 Transformasjoner Vi har kunnskap om at visse setninger er relatert Strukturelle forskjeller er helt systematisk relatert til en forskjell i betydelse Deklarative setninger vs. ja/nei-spørsmål The cat is purring Is the cat purring? Kan modelleres ved transformasjonelle regler: Flytt Aux til S To steg: 1. Frasestrukturreglene genererer den grunnleggende strukturen ( d(eep)-structure ) 2. Transformasjonelle regler kan endre ( s(urface)-structure ) 40

Transformasjoner Andre eksempler: aktiv-passiv The dog ate the cake The cake was eaten by the dog eksistensialkonstruksjoner The dog was in the garden There was a dog in the garden topikalisering Vi skal treffes i morgen I morgen skal vi treffes utbryting ( cleft ) The dog ate the cake It was the dog that ate the cake 41 Universell Grammatikk Generativ grammatikk: språket er lokalisert i den menneskelige hjerne Mål: en modell av denne indre språkmodulen (UG) Kan brukes til å beskrive alle naturlige språk, forutsi grammatikalitet Språk: enkle variasjoner over samme grunnleggende design Frasestruktur Fraser: hoder og komplementer Setningers hode er Aux (eller T(ense)) som spesifiserer tempus, bøyningssamsvar og modalitet Forskjeller, feks ulik leddstilling: parametre 42