INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Like dokumenter
INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #7

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #8

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

LF - Eksamen i INF1820

INF1820: Ordklasser INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

EXFAC EURA Syntaks2 1

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF 2820 V2016: Innleveringsoppgave 3 del 1

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Setningsledd. Norsk som fremmedspråk Side 131

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Uke 7: Små barn, små setninger I

IN1140: Introduksjon til språkteknologi. Forelesning #8

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

IN1140: Introduksjon til språkteknologi. Forelesning #12

UNIVERSITETET I OSLO

En del av kildene i denne delen av oppgaven er av eldre art. Blant annet henviser jeg til Heggelund sin avhandling, med utgivelsesår 1981.

INF1820: Oppsummering

INF 2820 V2016: Innleveringsoppgave 3 hele

Syntaks. Setningstruktur, form og funksjon, analyse Kap. 12. EXFAC EURA Syntaks1 0

Slides til 12.1 Formelt språk og formell grammatikk

ANDEBU KOMMUNE ANDEBU UNGDOMSSKOLE

3. Generell presentasjon av MT-programmet

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

FORBEREDELSE TIL ÅRSPRØVE I ENGELSK 7. KLASSE FREDAG 19. MAI 2017

norsk grammatikk 149BE6CADCAB6FFCFBAA3C DC4 Norsk Grammatikk 1 / 6

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1

INF1820 INF Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt

"Det er fort gjort og skrive feil." En presentasjon av en automatisk grammatikkontroll for bokmål

Norsk minigrammatikk bokmål

INF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning

2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning

APPENDIKS D Geminittisk språk/grammatikk

Overblikk over komplementer i kinesisk

For økt elevengasjement i norsk 8 10

INF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :

Overblikk over komplementer i kinesisk

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning

norsk grammatikk bok C2FFB2EE7079E5C7671E474DBC1B7657 Norsk Grammatikk Bok

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF5820. Language technological applications. H2010 Jan Tore Lønning

Parsing basert på LFG: Et MlT/Xerox-system applisert på norsk

UNIVERSITETET I OSLO

INF 2820 V2018: Innleveringsoppgave 2

UNIVERSITETET I OSLO

Ivar Utne, ; RETTA ; forslag om oppg. II (tekstslingvistikk) FORSLAG TIL SVAR PÅ EKSAMENSOPPGAVER FOR NOSP102-F

INF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning

Lokal læreplan engelsk 4.klasse Lærebok: Stairs 4

Ordklasser Inndelingen ORDKLASSEINNDELINGEN

INF 2820 V2016: Obligatorisk innleverinsoppgave 1

Satsingsområder: Lesing, skriving og regning Tilpasset opplæring Digital kompetanse

PLAN FOR DAGENE BARNEHAGENORSK: VELKOMMEN TIL 5. SAMLING! FEBRUAR

Vekeplan 4. Trinn. Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD. Norsk Matte Symjing Ute Norsk Matte M&H Norsk

NORSKPRØVEN 2014 ny muntlig prøve. Sett inn sted, dato og foredragsholder Kurs i vurdering av ny muntlig prøve, i regi av Vox

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1

Oppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være:

Grammatikk En innføring av Anne Lene Berge

Uke 10: Jakten på de forsvunnede subjektet: Om barns tidlige subjektsløse setninger.

SANDEFJORD KOMMUNE ANDEBU UNGDOMSSKOLE

Norsyg en syntaksbasert dyp parser for norsk

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

UKEPLAN FOR 7A, UKE 23 TIME

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Spørsmål 1.1 (10%) Lag en ikke-deterministisk endelig tilstandsautomat (NFA) som beskriver dette språket.

INF1820 V2014 Oppgave 3b CFGer og semantikk

UKE TEMA SKRIVE GRAMMATIKK VERK ARBEIDMETODER. flertall

Grammatikk Adverb. Forteller oss noe nytt om ord eller setninger

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen

Fasit til oppgaver i Språk i skolen, kapittel 4. Versjon: 15. mai 2015

Transkript:

INF1820: Introduksjon til språk-og kommunikasjonsteknologi Niende forelesning Lilja Øvrelid 13 mars, 2014

SYNTAKS studiet av prinsipper og regler for setningsdannelse gammel disiplin Pãṇini: sanskrit grammatiker (4 BC)

SYNTAKS studiet av prinsipper og regler for setningsdannelse gammel disiplin Pãṇini: sanskrit grammatiker (4 BC) mange teorier: mye til felles, en del forskjeller Government and Binding (GB) Minimalism Program (MP) Head-driven phrase structure grammar (HPSG) Lexical Functional Grammar (LFG) Categorial Grammar Dependency Grammar...

GENERATIV GRAMMATIKK Noam Chomsky: Syntactic Structures (1957) syn på språk inspirert av naturvitenskap: språket er en mengde setninger mengde: en samling objekter, f.eks.: {a, b, c}, a {a, b, c}, d / {a, b, c} setning: abstrakt, teoretisk begrep. Vi har evnen til å avgjøre grammatikalitet

GENERATIV GRAMMATIKK Noam Chomsky: Syntactic Structures (1957) syn på språk inspirert av naturvitenskap: språket er en mengde setninger mengde: en samling objekter, f.eks.: {a, b, c}, a {a, b, c}, d / {a, b, c} setning: abstrakt, teoretisk begrep. Vi har evnen til å avgjøre grammatikalitet mål: eksplisitt beskrivelse av denne mengden Alle nordmenn liker ikke fotball Liker ikke alle nordmenn fotball *Nordmenn alle ikke liker fotball *Liker nordmenn fotball ikke alle

GENERATIV GRAMMATIKK universell grammatikk (UG): beskrive det som er felles og kjennetegnende for alle naturlige språk: One reason to study language - and for me personally the most compelling reason - is that it is tempting to regard language, in the traditional phrase, as a mirror of mind. [...] by studying language we may discover abstract principles that govern its structure and use, principles that are universal by biological necessity and not mere historical accident, that derive from the mental characteristics of the species. (Chomsky: Reflections on Language (1975))

GENERATIV GRAMMATIKK generativ? den grammatiske beskrivelsen skal generere alle og bare de grammatiske setningene i språket. Alle nordmenn liker ikke fotball Liker ikke alle nordmenn fotball *Nordmenn alle ikke liker fotball *Liker nordmenn fotball ikke alle

GRAMMATISKE BESKRIVELSER ekstensjonell (oppregning) vs. intensjonell (beskrivelse): ekstensjonell: liste opp alle setninger: {... Alle nordmenn liker fotball, Alle nordmenn liker ikke fotball, Alle nordmenn liker fotball og friidrett, Alle nordmenn liker ikke fotball og friidrett...}

GRAMMATISKE BESKRIVELSER problem med ekstensjonell beskrivelse: i prinsippet uendelig antall setninger sier ingenting om setningers struktur Alle nordmenn liker fotball Alle nordmenn liker fotball

GRAMMATISKE BESKRIVELSER en grammatikk er en beskrivelse av et språk inneholder informasjon om: form: hvordan en språklig enhet ser ut funksjon: rollen enheten spiller i forhold til andre språklige enheter

GRAMMATISKE BESKRIVELSER en grammatikk er en beskrivelse av et språk inneholder informasjon om: form: hvordan en språklig enhet ser ut funksjon: rollen enheten spiller i forhold til andre språklige enheter samme form kan ha ulik funksjon: Hun kjøpte et pent hus. Huset er pent. Hun synger pent.

GRAMMATISKE BESKRIVELSER en grammatikk er en beskrivelse av et språk inneholder informasjon om: form: hvordan en språklig enhet ser ut funksjon: rollen enheten spiller i forhold til andre språklige enheter samme form kan ha ulik funksjon: Hun kjøpte et pent hus. Huset er pent. Hun synger pent. form og funksjon for større enheter enn ord Et pent hus er ikke alltid dyrere. Vi bodde i et pent hus.

GRAMMATISKE BESKRIVELSER setningers struktur: mer enn bare den lineære strukturen hierarkisk ordnede fraser: enkeltord og større grupper kan fungere likt: Jeg liker fotball Alle nordmenn liker fotball flertydighet - samme (lineære) ordstreng, forskjellig frasestruktur: Hun så gutten med teleskopet [gutten med teleskopet] [så gutten med teleskopet]

GRAMMATISKE BESKRIVELSER en generativ grammatikk: genererer alle og bare de grammatiske setningene i et språk tildeler hver setning en strukturell beskrivelse en (generativ) grammatisk beskrivelse er en eksplisitt redegjørelse for mengden setninger i et språk syntaktiske regler

GENERATIV GRAMMATIKKS METODOLOGI data: våre språklige intuisjoner hypotetisk-deduktiv metode hypotetisk: formulerer hypoteser deduktiv: deduserer (utleder) testbare konsekvenser fra hypotesene hypoteser kan ikke verifiseres, men styrkes

GENERATIV GRAMMATIKKS METODOLOGI data: våre språklige intuisjoner hypotetisk-deduktiv metode hypotetisk: formulerer hypoteser deduktiv: deduserer (utleder) testbare konsekvenser fra hypotesene hypoteser kan ikke verifiseres, men styrkes Biologiprofesssoren (en vits): Det var en gang en biologiprofessor som arbeidet ut i fra en hypotese om at lopper hører med beina. Han hadde en dressert loppe. Når professoren sa Hopp!, så hoppet loppen. Så gjorde professoren følgende forutsigelse: Hvis jeg river beina av loppen, blir den døv. Han gjorde det. Når han deretter sa Hopp! til loppen, hoppet den ikke. Professoren konkluderte som følger: Hypotesen om at lopper hører med beina stemmer.

GENERATIV GRAMMATIKKS METODOLOGI siste 20 årene: en empirisk revolusjon innenfor lingvistikk og datalingvistikk andre typer data tilgjengelig: digitaliserte språklige data korpusdata muliggjør andre typer generaliseringer (frekvens, sannsynlighet, etc.)

SYNTAKS Studiet av hvordan setninger bygges opp av ord og ordkombinasjoner syntaktisk form - ord og fraser ( konstituenter ) beskrives i form av ordklasser: fraser - større enheter over ordnivå fraser navngis etter hodet - det sentrale, obligatoriske medlemmet, referanse syntaktisk funksjon - konstituenter beskrives i form av sin funksjon i setningen som helhet subjekt (direkte og indirekte) objekt adverbial

SYNTAKS ORD FRASER SETNINGER setningen - inneholder et verb og (som regel) et subjekt Spis! Bea lukket vinduet fort. frasen - bygger opp setningen eller andre fraser (hierarkisk) og navngis etter hodet NP (noun phrase) VP (verb phrase) PP (prepositional phrase) etc.

SYNTAKTISKE REGLER beskriver kombinasjonen av ord til fraser og fraser til setninger beskriver forholdet mellom grupper av ord (ordklasser) og plassering i setningen artikler liker å komme foran et substantiv syntaktiske funksjoner: subjekt, objekt andre begrensninger som påvirker grammatikalitet *Bea fant *Bea fant fort *Bea fant i bilen Bea fant nøkkelen

SYNTAKTISKE REGLER beskriver hierarkisk gruppering av ord alle gamle menn og kvinner kan forlate skipet [gamle menn] og [kvinner] [gamle [menn og kvinner]] gamle menn og kvinner gamle menn og kvinner

SYNTAKTISKE REGLER strukturell flertydighet For sale: an antique desk suitable for lady with thick legs and large drawers We will oil your sewing machine and adjust tension in your home for $10.00 flertydighet grunnet flere mulige strukturer for en setning forklarer hvordan gruppering av ord relaterer til betydning

KONSTITUENTER konstituenter ord eller grupperinger av ord (fraser) i en setning, fungerer som en enhet The dog ate my homework The dog ate my homework Hvordan kan vi avgjøre konstituentstatus? Lingvistiske tester

KONSTITUENTER Lingvistiske tester: stå alene -testen: What did the dog eat? My homework *ate my erstattes med pronomen Where is your homework? The dog ate it The dog ate my homework and the cat did too Flyttes som enhet : It was my homework that the dog ate. My homework was eaten by the dog.

KONSTITUENTER Eksempel: The dog played in the garden Where did the dog play? In the garden (stå alene) The dog played there (erstattes med pronomen) In the garden is where the dog played (flytter som enhet)

FRASER: SYNTAKTISKE KATEGORIER Et enkelt ord kan bygges ut til en gruppe ord, slik at den nye gruppen har samme funksjon i setningen (en konstituent) Kan substitueres for hverandre The dog ate the birthday cake The dog ate the delicious birthday cake The dog ate the delicious birthday cake that was meant for Bea Fraser: (adledd) hode (adledd: utfylling) (the delicious birthday) cake (that was meant for Bea)

SUBSTANTIVFRASER (NP) Hodet er et substantiv Fungerer typisk som subjekt eller objekt i setningen Eksempler: determinativ + substantiv: the dog, en hund egennavn: Barack Obama, Japan pronomen: he, they, han, henne Kongruens feks tall, kjønn, bestemthet Hodet bestemmer kongruens

PREPOSISJONSFRASER (PP) Hodet er en preposisjon Etterfølges av en NP-utfylling (preposisjonsobjekt) Eksempler: prep + NP in the garden, over the rooftops foranstilt adledd (Adj) dypest ned i skuffen

ADJEKTIVFRASER (ADJP) Hodet er et adjektiv Kan ha foranstilt adledd: adverb eller andre adjektiv Noen adjektiv tar etterstilt utfylling (som verb) Eksempler: Adj crazy, red, brilliant foranstilt adledd almost crazy, pretty big etterstilt crazy about dogs, lik sin far

VERBFRASER (VP) Hodet er et verb i finitt eller infinitt form Eksempler: verb sover, danset verb + NP: spiste kaken verb + NP + NP: ga ham kaken verb + NP + PP la alle papirene i skuffen Kan komplettere Jeg/Barnet/Den rare mannen... dersom verbet er finitt setning

SYNTAKTISKE KATEGORIER Frasale kategorier: NP, VP, AdjP, PP Leksikale kategorier: N, V, P, Adj, Adv S NP VP Det N V NP The dog ate Det N my homework Frasestrukturtre (Phrase Structure (PS) tree)

FRASESTRUKTURTRÆR The dog ate my homework leksikale kategorier finne umiddelbare konstituenter ikke-leksikale kategorier (fraser)

FRASESTRUKTURTRÆR 1. Lineær rekkefølge i setningen 2. Syntaktiske kategorier for ord og grupper av ord 3. Hierarkisk struktur

FRASESTRUKTURREGLER Informasjonen i et frasestrukturtre kan også representeres som frasestrukturregler Generaliserer over vår syntaktiske kunnskap Spesifiserer de velformede strukturene i et språk 1. S NP VP 2. NP D N 3. VP V NP

FRASESTRUKTURREGLER Noen flere regler: intransitive verb 1. The cat purred 2. The woman laughed VP V

FRASESTRUKTURREGLER Noen flere regler: PP i VP 1. The dog played in the garden 2. The cat ate the cake on the terrace VP VP PP PP P NP

FRASESTRUKTURREGLER Noen flere regler: leddsetninger (innledes av subjunksjon complementizer (C)): 1. My brother said that the dog purred 2. We wondered whether the cat ate the cake VP VCP CP C S

REKURSIVE STRUKTURER mengden av setninger i et naturlig språk antas å være uendelig språkets kreativitet Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv.

REKURSIVE STRUKTURER endelig og eksplisitt grammatisk beskrivelse trenger mekanisme som kan generere (i prinsipp) uendelige strukturer rekursive strukturer: inneholder en delstruktur av samme type som helheten progammeringsspråk: feks Python frasestrukturgrammatikk: en trestruktur er rekursiv dersom den inneholder en node som dominerer en annen node med samme etikett

REKURSIVE STRUKTURER Rekursive regler gjør at grammatikken kan generere et uendelig antall strukturer The dog played in the garden on Monday The dog played in the garden on Monday for an hour The dog played in the garden on Monday for an hour with a stick VP VPP?? VP VP PP

REKURSIVE STRUKTURER Andre rekursive regler The dog with the collar barked The dog with the collar around its neck barked The dog with the collar around its neck on the sofa barked... NP NP PP

BAR-KATEGORIER Annet eksempel på rekursjon: adjektiver The kindhearted intelligent handsome boy NP Adj NP? NEI Determinativer og adjektiver har forskjellig status innenfor substantivfrasen kun én determinativ, flere adjektiv adjektiver modifiserer substantivet direkte, determinativet har rekkevidde over Adj+N Introduserer et nivå mellom NP og N: N NP Det N N Adj N N N

SETNINGER Alle fraser har hode hva med setningen? The dog will eat the cake The dog has eaten the cake The dog is eating the cake The dog might eat the cake VP Aux VP Spesifiserer tidsramme for hendelsen beskrevet av verbet Aux er hodet: alle hendelser er lokalisert i tid

SELEKSJON Relasjonen mellom hodet i en frase og søstrene (komplementer) Komplementerer betydelsen: find a puppy Seleksjon: beskriver krav visse hoder har på sine syntaktiske omgivelser verb selekterer forskjellige komplementer The dog found the cake (NP) vs. *The dog found My brother said that the cat ate it (CP) vs *My brother said The cat purred () vs *The cat purred my brother

TRANSFORMASJONER Vi har kunnskap om at visse setninger er relatert Strukturelle forskjeller er helt systematisk relatert til en forskjell i betydelse Deklarative setninger vs. ja/nei-spørsmål The cat is purring Is the cat purring? Kan modelleres ved transformasjonelle regler: Flytt Aux til S To steg: 1. Frasestrukturreglene genererer den grunnleggende strukturen ( d(eep)-structure ) 2. Transformasjonelle regler kan endre ( s(urface)-structure )

TRANSFORMASJONER Andre eksempler: aktiv-passiv The dog ate the cake The cake was eaten by the dog eksistensialkonstruksjoner The dog was in the garden There was a dog in the garden topikalisering Vi skal treffes i morgen I morgen skal vi treffes utbryting ( cleft ) The dog ate the cake It was the dog that ate the cake

UNIVERSELL GRAMMATIKK Generativ grammatikk: språket er lokalisert i den menneskelige hjerne Mål: en modell av denne indre språkmodulen (UG) Kan brukes til å beskrive alle naturlige språk, forutsi grammatikalitet Språk: enkle variasjoner over samme grunnleggende design Frasestruktur Fraser: hoder og komplementer Setningers hode er Aux (eller T(ense)) som spesifiserer tempus, bøyningssamsvar og modalitet Forskjeller, feks ulik leddstilling: parametre