INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Like dokumenter
INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Ordklasser INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

IN1140: Introduksjon til språkteknologi. Forelesning #6

INF1820 INF Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt

IN1140: Introduksjon til språkteknologi. Forelesning #6

IN1140: Introduksjon til språkteknologi. Forelesning #6

IN1140: Introduksjon til språkteknologi. Forelesning #5

Norsk minigrammatikk bokmål

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Ordklasser Inndelingen ORDKLASSEINNDELINGEN

Setningsledd. Norsk som fremmedspråk Side 131

2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

Sjekkliste B2-nivå. 1 Har du brukt stor/liten forbokstav, punktum (.), komma (,) og spørsmålstegn (?) riktig?

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

Grammatikk En innføring av Anne Lene Berge

APPENDIKS D Geminittisk språk/grammatikk

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1

INF1820: Oppsummering

UKE TEMA SKRIVE GRAMMATIKK VERK ARBEIDMETODER. flertall

Stikkordregister. avgrensa handling, 124 avleiingsmorfem, 46 avleiingsuffiks, stadium, 70

FORBEREDELSE TIL ÅRSPRØVE I ENGELSK 7. KLASSE FREDAG 19. MAI 2017

Fasit til oppgaver i Språk i skolen, kapittel 4. Versjon: 15. mai 2015

"Det er fort gjort og skrive feil." En presentasjon av en automatisk grammatikkontroll for bokmål

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Kom i gang veiledning

EXFAC EURA Syntaks2 1

Grammatikk Adverb. Forteller oss noe nytt om ord eller setninger

IN1140: Introduksjon til språkteknologi. Forelesning #12

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

BESTEMT ELLER UBESTEMT FORM?

UKEPLAN FOR 7A, UKE 23 TIME

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

SETNINGSLEDD... 2 Verbal... 2 Subjekt... 2 Objekt... 5 Indirekte objekt... 6 Predikativ... 8 Adverbial... 9

NORSK FOR INTERNASJONALE STUDENTER

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

NORSK FOR INTERNASJONALE STUDENTER

Morfologi. Studiet av ordenes struktur Kap. 11. EXFAC EURA 2. Morfologi1 1

UKEPLAN FOR 7B, UKE 23 MANDAG TIRSDAG ONSDAG

INF1820: Ordklassetagging

Begrep Forklaring Eksempel

NORSK FOR INTERNASJONALE STUDENTER

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1

Register. Соседи 1. Marit Bjerkeng

Ordklasser. Av Kim Freddy Føreland

Dere skal kunne om ordklasser.

For økt elevengasjement i norsk 8 10

Grammatiske termer til bruk i skoleverket

GRAMMATIKK.

KORT REPETISJON AV ORDSTILLING:

IN1140: Introduksjon til språkteknologi. Forelesning #7

Forkortelser og tegnbruk...19

LF - Eksamen i INF1820

Innhold. 1 Innledning Semantikk Talespråk og skriftspråk 47. Forkortelser Språket som kodesystem 17 1.

UNIVERSITETET I OSLO

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Fagplan i engelsk 7. trinn

7. trinn Målark Chapter 1 Bokmål

Oppgåver til kapittel 3

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Skriftlig eksamen (Written Exam) (3 timer)

IN1140: Introduksjon til språkteknologi. Forelesning #2

Læringsmål for trinnet: Kva skal elevane lære, kunne, mestre innanfor kompetansemålet Eleven Skal Kunne

Eksamen Norwegian Beginning Level (3-timer/3-hours)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Uke 7: Små barn, små setninger I

Gruppe:G Navn: UKEPLAN Uke 1

Halvårsplan i norsk for 7.trinn

Oppgaver til kapittel 4

Retningslinjer for morfologisk og syntaktisk annotasjon i Norsk dependenstrebank. Kari Kinn, Per Erik Solberg og Pål Kristian Eriksen

INF 2820 V2016: Innleveringsoppgave 3 del 1

IN1140: Introduksjon til språkteknologi. Forelesning #3

Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I SPANSK 10. TRINN SKOLEÅR

Halvårsplan høsten 2019

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

UKEPLAN UKE 38 UKE: 38 DATO: GRUPPE: E

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

METODISK VEILEDNING OM LÆREPLAN OG RAMMEVERK 1. Metodisk veiledning. Grammatikkens plass i norskopplæringen

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Fagplan, 6. trinn, Norsk.

Årsplan i engelsk 7.trinn

Halvårsplan VK-klassen vår 2014

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

samspill Alder 2-3 år Alder 3-4 år Alder 4-5 år Hole kommune språkprosjekt

Forord Om å bruke Nå begynner vi! Hei! Presentasjon av familien til Johanne En vanlig dag... 41

a) Sett strek mellom ordene og forklaringene som betyr omtrent det samme. b) Sett inn riktig ord uten å

UNIVERSITETET I OSLO DET HUMANISTISKE FAKULTET. Hjemmeeksamen/heimeeksamen i. LING2104 Morfologi og syntaks 2

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

norsk grammatikk bok C2FFB2EE7079E5C7671E474DBC1B7657 Norsk Grammatikk Bok

Satsingsområder: Lesing, skriving og regning Tilpasset opplæring Digital kompetanse

Innhold NorskPluss Kort botid

UKEPLAN UKE 41 UKE: 41 DATO: GRUPPE: E

Grammatisk ordliste Servus!

ORD OG BEGREPER (for 2 uker) Norsk 46 Norsk 47 Verb 46 Verb 47 Engelsk Tema. en blyant å skru a pencil å kreve. et slips å male a tie pyramider

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Språk Skriving Læringsmål Vurdering

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Transkript:

INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femte forelesning Lilja Øvrelid 13 februar, 2017 1

Lingvistikk Bindestreksdisipliner: psykolingvistikk, neurolingvistikk, sosiolingvistikk, datalingvistikk 2

Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags kontekster et ord forekommer i Sier noe om uttale (record, content, discount) Helt essensiell i en rekke språkteknologiske applikasjoner: Talesyntese Morfologisk analyse Chunking, syntaktisk parsing Word Sense Disambiguation Informasjonsekstraksjon 3

Ordklasser? http://beta.visl.sdu.dk/visl/nor/edutainment/games/ 4

Ordklasser Substantiv Adjektiv Verb Adverb Taksonomi - uttømmende, gjensidig utelukkende, styrt av et prinsipp Alle ord havner i en klasse og ingen ord havner i mer enn én klasse Vi trenger kriterier for ordklasseinndeling 5

Ordklassekriterier 3 slags kriterier: 1. formelle eller morfologiske kriterier hvilke bøyningsformer har ordet? hare - haren og redd - reddere *harare och *redden 2. funksjonelle eller syntaktiske kriterier hvordan kan ordet kombineres med andre ord? en redd hare och redd for ilden *en redd och *en hare for ilden 3. betydningsmessige eller semantiske kriterier hva er typiske betydninger hos ord i ordklassen? hare - dyr, levende vesen redd - egenskap 6

Ordklassekriterier Adjektivet rød: form: rød, rødt, røde, rødere, rødest funksjon: et rødt eple (attributiv funksjon), Håret hennes er rødt (predikativ funksjon) betydning: betegner en egenskap, typisk for adjektiv MEN: De røde tapte borgerkrigen?? normale (prototypiske) bruken vekting av kriteriene 7

Ordklasser: substantiv Substantiv olje, bord, jente, sorg 1. bøyes i bestemthet og tall bestemthet: kan knytte til seg bestemt artikkel som suffiks: bilen, greina, huset, tanken tall: (de fleste har) forskjellige endelser for entall og flertall: bil-biler, grein-greiner, tanke-tanker 2. kjerne i substantivfraser, med modifikatorer: en alldeles fantastisk vakker stol 3. betegner ting - mennesker, objekter, vesen, steder, fenomener och abstrakte enheter Unntak - egennavn bøyes ikke 8

Ordklasser: substantiv Substantivene er enten fellesnavn eller egennavn Fellesnavn: substantivene på forrige side Egennavn: ord som Adam, Eva, Haugesund, Dagros, Norge 9

Ordklasser: substantiv Fellesnavnene har enten konkret eller abstrakt betydning Konkrete: en slags gjenstandsbetydning, betegner konkrete størrelser, f.eks. blomst, bok, bord, mann, tang, tårn Abstrakte: ikke gjenstandsbetydning, betegner abstrakte begreper eller forestillinger (handlinger, tilstands, egenskaper), f.eks. fred, ro, slag, tvil, vennskap, verdighet, alderdom Ikke alltid så lett å skille: en mørkhåret skjønnhet dø i skjønnhet spenstig som en ungdom i min ungdom en fin tegning flink i tegning 10

Ordklasser: substantiv Vi kan også skille mellom tellelige og ikke-tellelige/massebetegnende substantiver Tellelige: bil, bord, okse, stang Ikke-tellelige: kjøtt, smør, støv Både tellelig og ikke-tellelig betydning: et vakkert tre bordet er laget av tre mange høye fjell støtt som fjell mange steiner mye stein 11

Ordklasser: substantiv Egennavn refererer til en enkelt gjenstand eller et bestemt individ, f.eks.ida, Torggata, Colosseum, Apple Navn på dyr, land, byer, gater, bygninger, elver, steder, planeter, foreninger, firmaer, fly, tog, kunstverk Vanligvis unik referanse Egennavn i flertallsform viser til helheten, f.eks. De forente stater, Hebridene Noen substantiver kan fungere som begge deler: Bibelen er verdens mestselgende roman Hun leste i sin bibel Egennavn som fellesnavn: Hemsedal er et skisportens mekka... en quisling, et eldorado, et watergate 12

Ordklasser: verb Verb (hovedverb) sparke, sove, håpe, arbeide, bygge, leve 1. bøyes i tid (presens-preteritum) inndeles i finitte vs. infinitte former finitte: imperativ, presens, preteritum: spark, sparker, sparket infinitte: infinitiv, perfektum partisipp (å) sparke, (ha) sparket transitivitet: transitiv - intransitiv 2. kan stå alene som predikat 3. betegner handlinger, aktiviteter och tilstander Unntak - hjelpeverb: må, skal, bli 13

Ordklasser: verb Kan grupperes basert på semantisk og grammatisk forhold Tre hovedgrupper a) Aktivitetsverb uttrykker en aktiv handling, dvs. at noen gjør eller utfører noe. Forutsetter en agens Ida arbeider hele dagen De gravde et hull De fleste går til jobben Fredrik spiller bass 14

Ordklasser: verb Tre hovedgrupper (forts.) b) Endrings-eller overgangsverb uttrykker et forløp eller en endringsprosess, dvs subjektet er patiens og gjennomgår eller opplever en forandring eller overgang Faren døde like etter krigen Bilen forsvant nedover gata Barna sovnet fort Plantene vokser hele året 15

Ordklasser: verb Tre hovedgrupper (forts.) c) Tilstandsverb uttrykker en tilstand, subjektet er i gitt tilstand uten å forandres Han ble i London resten av livet De bor nå i Mumbai Thon eier snart hele byen De lever et lykkelig liv sammen Boken som ligger på bordet, tilhører meg 16

Ordklasser: adjektiv Adjektiv: rød, snill, vanskelig, levende 1. samsvarsbøyes i bestemthet, kjønn och tall, gradbøyes 2. modifikator (adledd) til substantiv 3. betegner egenskaper 17

Ordklasser: adjektiv De mest typiske egenskapene er permanente (kvaliteter): Størrelse, allment: stor, liten, vertikalt: høy, lav, kort, horisontalt: bred, smal, lang Form: rett, krokete, rund, flat Farge/lys: svart, gul, lys, mørk, dus Lydstyrke: høy, lav, skarp Smak: sur, søt, bitter Noen adjektiver uttrykker midlertidige egenskaper: Livstilstand: gammel, ung, levende, frisk, syk Sinnstilstand: sint, trøtt, glad, redd Temperatur: varm, kald, lunken Andre egenskaper: lat, arbeidsom, ren, skitten, rask, sein 18

Ordklasser: adjektiv Gradbøyes ved bøyningsendelse eller mer mest. Betydningen angir et punkt på en skala. Men mange adjektiv har en mer presis betydning som er vanskelig å gradere, f.eks. død, gift, gratis, nybakt, lovlig Noen av de mest sentrale adjektivene opptrer i par med motsatt betydning antonymer: høy lav stor liten lang kort 19

Ordklasser: adverb Adverb: her, ofte, derfor, trolig, ikke, kanskje, nå, vanligvis 1. ubøyelige 2. står som modifikatorer til verb, adjektiv, adverb och setninger 3. betegner forskjellige omstendigheter - rom, tid, måte m.m. 20

Ordklasser: adverb Tidsadverb uttrykker relativ tid, dvs. et tidspunkt i forhold til et annet Han kom etterpå (etter et tidspunkt i fortiden) Han kom da (på et tidspunkt i fortiden) Kom etterpå! (etter dette tidspunktet) Kommer han nå? (på dette tidspunktet) Du skal komme etterpå (etter et tidspunkt i framtiden) Du skal komme da (på et omtalt tidspunkt i framtiden) 21

Ordklasser: adverb Måtesadverb uttrykker måten noe blir gjort på Hun gjennomgikk pensum stykkevis De lå andføttes Gradsadverb uttrykker mengde, intensitet eller grad ved verbhandlingen Jeg fryser litt Nå har du tullet nok 22

Ordklasser: preposisjoner Preposisjoner: ved, på, under, i, foran, av 1. ubøyelige 2. kjerne i preposisjonsfraser, tar substantiv 3. betegner relasjoner, f.eks. romlige Hytta ligger ved sjøen Elevene var svake i engelsk Taket på huset ble nettopp reparert 23

Ordklasser: preposisjoner Varierende semantisk innhold Lokalisere gjenstander og begivenheter i rom og tid Boka ligger på bordet Den lå bak skapet Vi drar i mai Kan også uttrykke måte eller middel: Hun satt i dype tanker Hun svarte med et lite smil Hun åpnet døren med en rusten nøkkel 24

Ordklasser: preposisjoner Preposisjon uten utfylling: verbalpartikkel De sovnet inn Han brøt sammen etter løpet Vi drakk opp all vinen Danner en semantisk og syntaktisk enhet med verbet 25

Ordklasser: pronomen Pronomen: jeg, hun, dere, seg, hverandre, hvem, man 1. av svært ulik form, uregelmessig bøyning 2. som substantiv, kan fungere som setningsledd alene 3. lite eget innhold, fr betydning fra sammenhengen (konteksten) Jeg liker grammatikk Man skal respektere hverandre Hvem tok vesken? 26

Ordklasser: pronomen Pronomen får sitt innhold enten fra et element i selve talesituasjonen eller fra et nominalt ledd (typisk substantiv) i konteksten. Leddet som gir pronomen innhold er pronomenets antesedent Se her Er du sulten? Gro Harlem Brundtland er en tidligere norsk politiker. Hun var norges første kvinnelige statsminister... 27

Ordklasser: pronomen Personlige pronomen kan bøyes, egne former for første, andre og tredje person, samt entall og flertall Nominativ Akkusativ 1.pers.ent. jeg meg 2.pers.ent. du deg 3.pers.ent han ham 3.pers.ent hun henne 3.pers.ent den/det den/det 1.pers.flt. vi oss 2.pers.flt. dere dere 3.pers.flt. de dem 28

Ordklasser: pronomen Refleksivt pronomen er seg på norsk. Har antesedent i samme setning, oftest subjektet i setningen Brukes kun i tredje person. I første og andre person brukes akkusativformen Jeg vasker meg Hun vasker seg Vi vasker oss 29

Ordklasser: pronomen Resiproke pronomen er hverandre på norsk. Uttrykker en gjensidig relasjon, slik at A og B beundrer hverandre impliserer at A beundrer B og B beundrer A Vi beundrer hverandre De beundrer hverandre 30

Ordklasser: pronomen Interrogative pronomen (spørreord) Hvem når vi spør etter et menneske, ellers er det hva Hvem er det? Hva vil du ha å drikke? Hun spurte hvem det var 31

Ordklasser: determinativ Determinativ (artikler): min, din, denne, alle, noen 1. bøyning i kjønn og tall 2. bestemmer til substantiv 3. bestemmer, spesifiserer substantivets referanse 32

Ordklasser: Determinativ 3 hovedtyper: a) Possessiver: angir eiendom eller tilhørighet, bøyes i person Det er min bok Her har du boken din b) Demonstrativer: viser til eller peker på en bestemt person eller ting som kan iakttas eller er omtalt Den hytta ligger fint til Dette treet er kjempestort c) Kvantorer: uttrykker mengde eller kvantitet, noen med bøyning (noen, ingen, en) og noen uten (to, tre, visse, enkelte, utallige) Hun har spist opp all maten Ida har kjøpt noen bøker 33

Ordklasser: Konjunksjoner Konjunksjoner: og, eller, men, for, så 1. ubøyelige 2. binder sammen ledd av samme slag, f.eks. ord, fraser og setninger 3. grammatisk funksjon, betegner relasjoner fullstendig ro og absolutt trygghet (nominalfrase og nominalfrase) konkret og abstrakt betydning (adjektivfrase och adjektivfrase) han var på ski og hun var i kirken (setning og setning) 34

Ordklasser: subjunksjoner Subjunksjoner: å, at, om, som, før 1. ubøyelige 2. innleder leddsetninger - underordner en setning under en annen 3. grammatisk funksjon, betegner relasjoner Hun elsker å danse Vi tror at det verste snart er over Der er hunden som spiste kaken 35

Inndeling av ordklasser åpne vs. lukkede ordklasser åpne: substantiv, verb og adjektiv inneholder mange tusen ord, kan enkelt fylle på med nye Eksempel: nye bilmodeller - nye farger (brannbilrød) lukkede: inneholder mange færre ord enn de åpne kan ikke fritt skape nye ord gjennom orddannelse innholdsord vs. funksjonsord innholdsord: substantiv, verb, adjektiv rikt betydningsinnhold, refererer utenfor språket funksjonsord: mer allment betydningsinnhold, refererer ikke utenfor språket. Finnes fremst i de lukkede ordklassene. Ikke helt én-til-én, feks hjelpeverb. 36

Korpuser

Korpusdata Modellere språklig kunnskap Trenger språklige data Introspeksjon Faktisk språkbruk korpusdata Språkteknologi: programmer som generaliserer over språklige mønstre Korpusdata helt sentralt 37

Språklige data: korpusdata Et korpus (tekstkorpus) er en strukturert samling tekster Elektronisk lagret Siste 30 årene innenfor lingvistikk og datalingvistikk: empirisk revolusjon Større og større tekstmengder tilgjengelig Empiriske data for lingvistiske studier (motsetning til introspeksjon) Treningsmateriale for datalingvistiske modeller av språklige fenomener 38

Ordklassetaggede korpuser Brown-korpuset for engelsk (1979): 87 ordklassetagger 1 mill. ord, utvalg fra 500 tekster hentet fra forskjellige sjangere Automatisk tagget og manuelt rettet Penn Treebank (1993) 45 ordklassetagger Wall Street Journal, Brown-korpuset, Switchboard, ATIS Ordklassetagger, syntaktisk struktur (frasestruktur) 39

Ordklassetaggede korpuser Norsk dependenstrebank Trebank for norsk Utviklet ved Nasjonalbiblioteket Manuelt tagget ordklasser samt mye morfologisk informasjon 1 Det det pron nøyt ent pers 3 2 er være verb pres 3 hun hun pron fem ent pers hum 3 nom 4 som som sbu 5 eier eie verb pres 6 og og konj 7 driver drive verb pres 8 stedet sted subst appell nyt be ent 40

Eksempler fra Penn (J&M): The/DT Grand/JJ jury/nn commented/vbd on/in a/dt number/nn of/in other/jj topics/nns./. There/EX are/vbp 70/CD children/nns there/rb Although/IN preliminary/jj findings/nns were/vbd reported/vbn more/rbr than/in a/dt year/nn ago/in,/, the/dt latest/jjs results/nns appear/vbp in/in today/nn s/pos New/NNP England/NNP Journal/NNP of/in Medicine/NNP 41

Tagging følger en manual Noen avgjørelser vanskelige Eks: skillet mellom preposisjoner (IN), partikler (RP) og adverb (RB) Mrs./NNP Shaefer/NNP never/rb got/vbd around/rp to/to joining/vbg All/DT we/prp gotta/vbn do/vb is/vbz go/vb around/in the/dt corner/nn Chateau/NNP Petrus/NNP costs/vbz around/rb 250/CD Manualen: preposisjoner er assosiert med en etterfølgende subtstantivfrase. Around tagges som adverb i betydningen omtrent 42

Ordklassetagging

Ordklassetagging Oppmerking av ordklasseinformasjon for hvert ord i et korpus Språkteknologi: automatiske systemer Flertydighet vanskeliggjør dette betydelig Ordnivå: Tokenisering 43

Tokenisering Tokenisering Tokenisering handler om å dele inn en tekst i ord og setninger. Tidligere har vi gjort det enkelt og bare splittet på mellomrom. Men dette er problematisk: Tar ikke hensyn til tegnsetting og gir ord som cents. said, positive. Crazy?. Her kunne vi tatt bort tegnsetting, men tegnsetting forekommer også innad i ord: m.p.h. cap n, AT&T. Tall inneholder komma i engelsk: 555,000 Det kan være ønskelig å ekspandere forkortede former som for eksempel I,m, you re, they ve til henholdsvis I am, you are, they have. Da er det viktig å skille mellom slike former og genitiv s (Mary s) eller anførselstegn ( Oh no, he said) 44

Ordklassetagging Input: streng av ord og en spesifisert mengde tagger Output: en tagg per ord Book/VB that/dt flight/nn./. Does/VBZ that/dt flight/nn serve/vb dinner/nn?/. Flertydighet: book, that 45

Flertydighet De fleste engelske ord er entydige Men mange av de mest frekvente ordene er flertydige Tall fra Brown-korpuset: 11.5% av engelske ordtyper er flertydige 40% av Brown tokens er flertydige Heldigvis er ikke alle lesninger like sannsynlige 46

Algoritmer for ordklassetagging To hovedkategorier: 1. Regelbaserte taggere: stor database med håndskrevne regler. Eksempel: book er substantiv, og ikke verb, dersom etterfølger en determinativ 2. Probabilistiske taggere: bruker et ordklassetagget korpus ( treningskorpus ) til å beregne sannsynlighet for en gitt tagg i en gitt kontekst 47

Eksempel på en MSc-oppgave i Språkteknologi Optimizing a PoS tag set for Norwegian Dependency Parsing trener ulike ordklassetaggere for norsk (NDT) modifiserer taggsettet for syntaktisk parsing viser hvordan et mer finkornet taggsett kan gi bedre resultater for parsing 48