INF1820 INF1820 2013-02-22. Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt



Like dokumenter
INF1820: Ordklasser INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

Ordklasser Inndelingen ORDKLASSEINNDELINGEN

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.

UKE TEMA SKRIVE GRAMMATIKK VERK ARBEIDMETODER. flertall

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

Grammatikk En innføring av Anne Lene Berge

Norsk minigrammatikk bokmål

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #6

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

Setningsledd. Norsk som fremmedspråk Side 131

APPENDIKS D Geminittisk språk/grammatikk

INF1820: Oppsummering

IN1140: Introduksjon til språkteknologi. Forelesning #6

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt

EXFAC EURA Syntaks2 1

Innhold. 1 Innledning Semantikk Talespråk og skriftspråk 47. Forkortelser Språket som kodesystem 17 1.

For økt elevengasjement i norsk 8 10

Stikkordregister. avgrensa handling, 124 avleiingsmorfem, 46 avleiingsuffiks, stadium, 70

IN1140: Introduksjon til språkteknologi. Forelesning #6

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #5

Uke Fagemne Læringsmål Arbeidsmåte Vurdering Kunne oversiktslesing-skanning

PRONOMEN... 2 Personlege pronomen... 2 Subjektsform... 2 Objektsform... 4 Refleksiv form... 5 Oppsummering av personlege pronomen...

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Register. Соседи 1. Marit Bjerkeng

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

Oppgåver til kapittel 3

INF1820: Ordklassetagging

Kom godt i gang. Ordboksverktøyet 1.0

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

Dere skal kunne om ordklasser.

TID TEMA KOMPETANSEMÅL ARBEIDSMETODER VURDERINGSFORMER RESSURSER

Introduksjon i ordklasseteori og tegnklasser

Grammatiske termer til bruk i skoleverket

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #7

UKEPLAN FOR 7B, UKE 23 MANDAG TIRSDAG ONSDAG

"Det er fort gjort og skrive feil." En presentasjon av en automatisk grammatikkontroll for bokmål

UKEPLAN FOR 7A, UKE 23 TIME

Kapittel 4: Logikk (predikatlogikk)

7. trinn Målark Chapter 1 Bokmål

NU-søknaden og bachelor i nordsamisk som fremmedspråk UiT uferdig skisse

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

RENDALEN KOMMUNE Fagertun skole. Årsplan i norsk for 7. trinn

INF 2820 V2016: Innleveringsoppgave 3 del 1

Fasit til oppgaver i Språk i skolen, kapittel 4. Versjon: 15. mai 2015

Morfologi. Studiet av ordenes struktur Kap. 11. EXFAC EURA 2. Morfologi1 1

Satsingsområder: Lesing, skriving og regning Tilpasset opplæring Digital kompetanse

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1

Uke 7: Små barn, små setninger I

Retningslinjer for morfologisk og syntaktisk annotasjon i Norsk dependenstrebank. Kari Kinn, Per Erik Solberg og Pål Kristian Eriksen

BRUKE VARIERTE LESESTRATEGIER FOR Å LESE ULIKE TYPER TEKST I ULIKT TEMPO

FORBEREDELSE TIL ÅRSPRØVE I ENGELSK 7. KLASSE FREDAG 19. MAI 2017

Innhold NorskPluss Kort botid

Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I TYSK 8. TRINN SKOLEÅR Periode 1: UKE Kompetansemål: Kjennetegn på måloppnåelse:

Halvårsplan i norsk for 7.trinn

UNIVERSITETET I OSLO

en bil en/ei flaske et hus

SKOLEEKSAMEN I. SOS4010 Kvalitativ metode. 19. oktober timer

Ordklasser. Av Kim Freddy Føreland

IN1140: Introduksjon til språkteknologi. Forelesning #8

LF - Eksamen i INF1820

Ústav germanistiky, nordistiky a nederlandistiky

-Jeg kan skrive en hilsen med mottaker, dato og avsender. Besøke bibliotek Skole/byen Alfabetisere

Godt språk i nynorske fagtekstar. Pernille Fiskerstrand

Innhold. Forord Om å bruke Norsk for deg: Grammatikkoppgaver Hovedfokus: Substantiv... 17

NORSK FOR INTERNASJONALE STUDENTER

Forord Om å bruke Nå begynner vi! Hei! Presentasjon av familien til Johanne En vanlig dag... 41

Årsplan i norsk - 6. klasse

Slides til 12.1 Formelt språk og formell grammatikk

ÅRSPLAN I NORSK FOR 7. TRINN, SKOLEÅRET

Syntaks. Setningstruktur, form og funksjon, analyse Kap. 12. EXFAC EURA Syntaks1 0

Støttetekst til Hagen (2000)

Forkortelser og tegnbruk...19

UNIVERSITETET I OSLO DET HUMANISTISKE FAKULTET. Hjemmeeksamen/heimeeksamen i. LING2104 Morfologi og syntaks 2

norsk grammatikk 149BE6CADCAB6FFCFBAA3C DC4 Norsk Grammatikk 1 / 6

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I NORSK 9. TRINN SKOLEÅR

Leksehjelp for foresatte

Fagplan i engelsk 7. trinn

Grammatikk Adverb. Forteller oss noe nytt om ord eller setninger

ÅRSPLAN I NORSK. 8. klasse 2015/ 16

KORT REPETISJON AV ORDSTILLING:

Årsplan i norsk for 6. klasse

Vårplan i norsk for 7.klasse Kaldfjord skole. Vi tar forbehold om endringer!

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Årsplan i engelsk 7.trinn

Setningskløyving i norsk

a) Sett strek mellom ordene og forklaringene som betyr omtrent det samme. b) Sett inn riktig ord uten å

Halvårsplan høsten 2019

Oppgaver Oppgavetype Vurdering Status 1 FR generell informasjon Flervalg Automatisk poengsum Levert

Mellomtrinnsteam Lismarka skole NORSKPLAN ETTER L-2006 ZEPPELIN LÆREVERK TRINN A PLAN SIDE 1 Tema Tid Mål Kriterier Kilder

ÅRSPLAN Laudal og Bjelland skole

Vite hva sakprosa er du leser. Vite hva dikt kan handle om ser for deg når

norsk grammatikk bok C2FFB2EE7079E5C7671E474DBC1B7657 Norsk Grammatikk Bok

Halvårsplan VK-klassen vår 2014

Oppgaver til kapittel 4

Transkript:

dairoku: del 6, kougi: forelesning Arne Skjærholt 第 六 講 義 Arne Skjærholt 第 六 講 義

Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags kontekst et ord forekommer i, og av og til også uttale: en. record, content, discount. Ordklassetagging er en helt sentral oppgave i de fleste datalingvistiske applikasjoner: TTS, shunking, parsing...

Substantiv Adjektiv Verb Adverb 2013-02-22 Ordklassene er en taksonomi. Det vil si at det er en fullstendig, gjensidig utelukkende klassifikasjon av ord. Alle ord havner i én og bare én klasse. Vi trenger en form for kriterier for å bestemme ordklassene. Substantiv Verb Adverb Adjektiv

Formelle Annet navn: morfologiske kriterier. Hvilke bøyningsformer har ordet? Formelle

Funksjonelle Annet navn: syntaktiske kriterier. Hvordan kan ordet kombineres med andre ord? Funksjonelle

Betydningsmessige Annet navn: semantiske kriterier. Hva er typiske betydninger hos ord i klassen? Betydningsmessige

rød, røde, rødt, rødere, rødest en rød bil, huset er rødt Egenskap Vi forholder også til den prototypiske (dvs. normale) bruken av ordet. rød, røde, rødt, rødere, rødest en rød bil, huset er rødt Egenskap

rød, røde, rødt, rødere, rødest en rød bil, huset er rødt Egenskap de røde tapte borgerkrigen Vi forholder også til den prototypiske (dvs. normale) bruken av ordet. rød, røde, rødt, rødere, rødest en rød bil, huset er rødt Egenskap de røde tapte borgerkrigen

Substantiv Bøyes i bestemthet og tall. Bestemthet merkes enten med bøyning eller bestemmer, entall er umerket og flertall markeres med endelse (for det meste). Substantivet er kjerne i substantivfrasen, med modifikatorer: en alldeles fantastisk vakker stol Substantiv De betegner ting. Mennesker, dyr, objekter, fenomener, og ideer.

Egennavn Egennavnene er et unntak. De har vanligvis ikke bøyning (på norsk), men har eller semantisk og syntaktisk mye til felles med fellesnavnene. Egennavn

Fellesnavn Fellesnavn er enten konkrete eller abstrakte. Konkrete er ting som finnes ute i verden, mens abstrakter er begreper eller ideer. Men det er selvfølgelig uklare tilfeller: en mørkhåret skjønnhet/dø i skjønnhet; spenstig som en ungdom/i min ungdom... Fellesnavn

Tellbarhet De fleste substantiver er tellbare, men noen er ikke-tellbare eller massebetegnende. Ord som kjøtt, smør, støv Igjen, noen ord kan brukes på begge måter: Jeg liker øl/det står to øl i kjøleskapet; et vakkert tre/bordet er av tre. Tellbarhet

Verb Bøyes (på norsk) i tid, delt inn i finitte vs. infinitte former. Kan stå alene som predikat. Kan klassifiseres etter transitivitet: Hvor mange argumenter tar verbet? Betegner handlinger, aktiviteter, tilstander. Verb Merk: Dette gjelder kun hovedverb. Hjelpeverb oppfører seg annerledes.

Aktivitetsverb Uttrykker en aktiv handling, og forutsetter en agens, men vi regner også verb uten eksplisitt agens, som blåse, regne, ulme, til denne klassen også. Aktivitetsverb

Overgangsverb Uttrykker at det skjer noe med subjektet (som er patiens). Typiske eksempler er dø, forsvinne, sovne, vokse. Overgangsverb

Tilstandsverb En begrenset klasse på norsk, men vanlig på andre språk. Norske eksempler: eie, bli, leve, ligge. Tilstandsverb

Adjektiv Samsvarsbøyes i bestemthet, kjønn og tall, kan gradbøyes. Modifikator til substantiv. Betegner egenskaper. Det typiske adjektivet angir en permanent egenskap (liten, stor, bred, lang, smal), men noen er også mer kortvarige (sint, trøtt, gammel, ung, ren, skitten). Adjektiv Gradbøyingen angir punkt på en skala, men noen ord er vanskelige å gradbøye: død, gift, gratis, lovlig, nybakt.

Antonymer Noen av de sentrale adjektivene kommer i par med motsatt betydning: liten og stor, høy og liten, lang og kort Antonymer

Adverb Noen kan gradbøyes, men de fleste er ubøyelige. Modifiserer verb, avjektiv, adverb og hele setninger. Angir omstendigheter: rom, tid, måte... Adverb

Preposisjoner Bøyes ikke. Kjerne i preposisjonsfrasen, tar substantiv. Betegner relasjoner. Preposisjoner Sammen med verb finner vi av og til preposisjoner uten utfylling: bryte sammen, sovne inn, drikke opp. Dette kalles for verbalpartikkel. Partikkelen danner en semantisk og syntaktisk enhet med verbet, men kan være vanskelig å skille fra en PP som selekteres av verbet.

Pronomen Stor variasjon i form og bøyning, så vanskelig å klassifisere morfologisk. Som substantiv. Ikke eget innhold, men står for noe annet i konteksten. Pronomen Mange typer: personlig, refleksivt, resiprokt, spørrende (interrogativer).

Antesedenten Det som pronomenet faktisk betyr. Bestemmes utifra konteksten, kan være veldig tvetydig, og er vanskelig å avgjøre automatisk. Antesedenten

Determinativ Bøyes i kjønn og tall. Bestemmer til substantiv. Spesifiserer substantivets referanse. Determinativ 3 hovedtyper: possessiver (min boka, boka di), demonstrativer (den bilen, dette treet), kvantorer (noen, ingen, en, alle tallordene, visse enkelte).

Konjunksjoner Bøyes ikke. Binder sammen to like ting til å lage en ting av samme type. Grammatisk funksjon. Konjunksjoner

Subjunksjoner Bøyes ikke. Innleder leddsetninger: underordner en setning under en annen. Grammatisk funksjon. Subjunksjoner

Innholdsord Funksjonsord Innholdsord er de som refererer utenfor språket, mens funksjonsordene refererer ikke utenfor språket. Dette skillet svarer stort sett til skillet mellom åpne og lukkede ordklasser, men er ikke helt én til én. For eksempel er hjelpeverb funksjonsord. Innholdsord Funksjonsord

Ordklassetagging Lam og piggvar på bryllupsmenyen To måter å gjøre tagging på. Regelbaserte metoder, der ordene tilordnes alle mulige tagger (f.eks. med en FST-basert metode) og så fjernes alternativer som er umulige. OBT virker sånn. Lam og piggvar på bryllupsmenyen Det andre alternativet er statistiske modeller som direkte finner den mest sannsynlige taggsekvensen for en ordsekvens. Det skal vi se på de neste to ukene.

Ordklassetagging Lam/subst og/konj piggvar/subst på/prep bryllupsmenyen/subst To måter å gjøre tagging på. Regelbaserte metoder, der ordene tilordnes alle mulige tagger (f.eks. med en FST-basert metode) og så fjernes alternativer som er umulige. OBT virker sånn. Lam/subst og/konj piggvar/subst på/prep bryllupsmenyen/subst Det andre alternativet er statistiske modeller som direkte finner den mest sannsynlige taggsekvensen for en ordsekvens. Det skal vi se på de neste to ukene.

Ordklassetagging Ordklassetagging Oppgaven er å automatisk tilordne riktig ordklasse tagg til alle ordene i en setning. Stort sett er ord entydige, men hvis du velger en tilfeldig engelsk ordform er 11.5% tvetydige, men i løpende tekst er 40% av ordene du ser tvetydige. Ordklassetagging