INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Like dokumenter
IN1140: Introduksjon til språkteknologi. Forelesning #3

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til spra k-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt

INF INF1820. Lectio secunda INF1820. Arne Skjærholt. Lectio secunda

Morfologi. Studiet av ordenes struktur Kap. 11 Om morfer (selvsagt) og litt større ting. EXFAC EURA 2. Morfologi1 1

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Ordklasser INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

INF1820: Oppsummering

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #10

IN1140: Introduksjon til språkteknologi. Forelesning #10

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

LF - Eksamen i INF1820

FORBEREDELSE TIL ÅRSPRØVE I ENGELSK 7. KLASSE FREDAG 19. MAI 2017

Norsk minigrammatikk bokmål

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

IN1140: Introduksjon til språkteknologi. Forelesning #12

INF2820 Datalingvistikk V2018 Forelesning 4, 5.2 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 4, 6.2 Jan Tore Lønning

Morfologi. Studiet av ordenes struktur Kap. 11. EXFAC EURA 2. Morfologi1 1

Øvinger september Wiebke Ramm, Kjetil Rå Hauge

Ordklasser Inndelingen ORDKLASSEINNDELINGEN

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

7. trinn Målark Chapter 1 Bokmål

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820 V2014 Oppgave 3b CFGer og semantikk

INF 2820 V2016: Innleveringsoppgave 3 del 1

IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser

2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.

INF2820 Datalingvistikk V2012. Jan Tore Lønning

2 Substantiv Genus Bøyning Substantiv med bare entallsformer Substantiv med bare flertallsformer 17 2.

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140 H2018 gruppeoppgaver Sannsynlighet og språkmodeller

UKEPLAN FOR 7A, UKE 23 TIME

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Engelsk gruppe 2 høsten 2015

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

Grammatikk En innføring av Anne Lene Berge

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Lesekurs i praksis. Oppgaver på «Nivå 2» Vigdis Refsahl

INF1820: Introduksjon til språk-og kommunikasjonsteknologi


10. trinn Uke Tema Arbeidsmåter Kompetansemål Vurdering, vurdert opp mot måloppnåelse 35-38

Læringsmål for trinnet: Kva skal elevane lære, kunne, mestre innanfor kompetansemålet Eleven Skal Kunne

INF1820 INF Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt

UKEPLAN FOR 7B, UKE 23 MANDAG TIRSDAG ONSDAG

Over oppslagsord Over uttrykk på alfabetisk plass Britisk og amerikansk engelsk Dekker hverdagsspråk, slang og formelt språk Fagord

Innhold. 1 Innledning Semantikk Talespråk og skriftspråk 47. Forkortelser Språket som kodesystem 17 1.

Eksamen i LING 1112 Morfologi og syntaks 1. Våren 2013

INF1820 V2013 Oppgave 3b CFGer og semantikk

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Oppgave 1 (samlet 15%)

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

Setningsledd. Arne Martinus Lindstad Tekstlaboratoriet Universitetet i Oslo.

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

Register. Соседи 1. Marit Bjerkeng

Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I SPANSK 10. TRINN SKOLEÅR Periode 1: UKE Kompetansemål:

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

norsk grammatikk bok C2FFB2EE7079E5C7671E474DBC1B7657 Norsk Grammatikk Bok

Lokal læreplan engelsk 4.klasse Lærebok: Stairs 4

Fagplan, 6. trinn, Norsk.

lytte etter og bruke engelske språklyder gjennom praktiskestetiske gi eksempler på noen situasjoner der det kan være nyttig å kunne engelsk

Kom i gang veiledning

Enkel beskrivelse av islandsk språk

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

Enkel Norsk Grammatikk

Kyrkjekrinsen skole Plan for perioden:

Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I ENGELSK 8. TRINN SKOLEÅR

METODISK VEILEDNING OM LÆREPLAN OG RAMMEVERK 1. Metodisk veiledning. Grammatikkens plass i norskopplæringen

INF 2820 V2018: Innleveringsoppgave 3

Satsingsområder: Lesing, skriving og regning Tilpasset opplæring Digital kompetanse

Sigrunn Askland (UiA)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Overblikk over komplementer i kinesisk

Lokal læreplan Engelsk 7. trinn

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Halvårsplan høst 2.klasse. Læreverk vi bruker: My English book Flash cards Cd. Engelsk

UNIVERSITETET I OSLO

NORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1

6. trinn. Målark Chapter 1 Bokmål. Kan godt. Kan litt. Kan ganske godt. Read and listen. Jeg kan lytte til en tekst og forstå hvor handlingen foregår.

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

Grunnleggende ferdigheter/momenter fra lokal læreplan

IN1140: Introduksjon til språkteknologi. Forelesning #7

samtaler om ulike fritidsaktiviteter

Transkript:

INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tredje forelesning Lilja Øvrelid 30 januar, 2017 1 Språklige data

Vitenskapsteori Empiricism is a theory of knowledge which asserts that knowledge comes via the senses experience Rationalism is any view appealing to reason as a source of knowledge or justification (Eng Wikipedia) Paradigmeskifter lingvistikk og datalingvistikk Rasjonalistene: teori-drevet, symbolske metoder Empiristene: data-drevet, statistiske metoder big data -disiplin 2 Språklige data Modellere språklig kunnskap Trenger språklige data Introspeksjon Faktisk språkbruk korpusdata Språkteknologi: programmer som generaliserer over språklige mønstre Korpusdata helt sentralt Menneskelig språkprossessering: hvordan modelleres språk i hjernen? 3

Språk og hjerne Språk og hjerne 4

Språk og hjerne Neurolingvistikk lingvistisk fagområde som studerer de mekanismer i den menneskelige hjerne som kontrollerer språk (-forståelse, -produksjon og - tilegnelse) Hjernen: Storehjernen er organisert i lapper : pannelappen, tinninglappen, isselappen, bakhodelappen. Storehjernen har to halvdeler som arbeider sammen gjennom corpus collosum (over 200 millioner aktive nerveceller) 5 Hvor er språk lokalisert? Data fra atypisk språk Afasi språkvansker etter hjerneskade forskjellige typer avhengig av hvor skaden har oppstått 6

Hvor er språk lokalisert? Brocas afasi Ugrammatisk språk, problemer med forståelse av syntaktisk komplekse konstruksjoner Yes... ah... Monday... er... Dad and Peter H... (his own name), and Dad... er... hospital... and ah... Wednesday... Wednesday, nine o clock... and oh... Thursday... ten o clock, ah doctors... two... an doctors... and er... teeth... yah 7 Hvor er språk lokalisert? Wernickes afasi Semantisk usammenhengende, men stort sett syntaktisk korrekt I felt worse because I can no longer keep in mind from the mind of the minds to keep me from mind and up to the ear which can be to find among ourselves. 8

Måling av aktivitet i hjernen Moderne teknologi (MRI, CT, ERP) kan gi et enda mer nøyaktig bilde Forandringer i hjerneaktivitet 9 Neurolingvistiske data: Neurolingvistiske data: hvor språket sitter empirisk støtte for teoretiske hypoteser Informasjon om organisering av språket: modulært organisert separate moduler Ord i nettverk semantisk, uttale table - chair tool - pool Funksjonsord adskilt fra innholdsord (Broca s afasi) 10

Korpusdata Språklige data: korpusdata Et korpus (tekstkorpus) er en strukturert samling tekster Elektronisk lagret Kan brukes til: Empiriske data for lingvistiske studier (motsetning til introspeksjon) Treningsmateriale for datalingvistiske modeller av språklige fenomener 11

Språklige data: korpusdata Korpus laget for å representere et visst språk eller språklig variant Språklige data to muligheter: 1. Arkivere alle setninger i et språk: UMULIG 2. Plukke ut et mindre utvalg ( sample ) av språket: MULIG 2 er mulig men ikke trivielt Et korpus må konstrueres slik at det minimerer fordommer ( bias ) og maksimerer representativitet 12 Et tenkt korpus for norsk Vi må inkludere forskjellige typer tekster: Skrift og tale? [registere] Fra forskjellige deler av landet? Et utvalg av dialekter? [regionale dialekter] Kun fra 2000-tallet? Hva med 1990? Eller 1950? [tidsperioder] Språk produsert av både menn og kvinner? Alle aldersgrupper, inkludert barn? Hva med utdanningsnivå? Sosial status? [demografi] Skal vi inkludere nyhetsstoff? Hva med kronikker, romaner og e-post? Tegneserier og tekstmeldinger? [sjanger] 13

Et tenkt korpus for norsk Svarer JA på alle spørsmålene... men vi må også ta hensyn til fordeling, feks 50% tekst og 50% tale? 20% nyhetsstoff og 15% romaner? etc. Representativt korpus 1. ekstra-lingvistiske faktorer (feks demografi) 15% av innbyggerene bor i Oslo, så vi kan fordele korpuset etter dette 20% av befolkningen er over 60, la oss inkludere 20% av 60+ tekster 2. lingvistisk fordeling 20% av alle norske tekster er romaner 20% av korpuset 20-åringer leser og skriver dobbelt så mye som 60+, dobbelt så mange tekster produsert av/for 20-åringer 14 Et tenkt korpus for norsk For (2): Ikke gitt at vi har denne typen informasjon om befolkningen For (1): Ikke tilfredsstillende heller, demografi er ikke en nøyaktig indikator for språkbruk Umulig å oppnå et objektivt representativt korpus. Men vi prøver allikevel... 15

Eksisterende korpuser NLTK kommer med flere innebygde korpuser >>> import nltk >>> from nltk.book import * *** Introductory Examples for the NLTK Book *** Loading text1,..., text9 and sent1,..., sent9 Type the name of the text or sentence to view it. Type: texts() or sents() to list the materials. text1: Moby Dick by Herman Melville 1851 text2: Sense and Sensibility by Jane Austen 1811 text3: The Book of Genesis text4: Inaugural Address Corpus text5: Chat Corpus text6: Monty Python and the Holy Grail text7: Wall Street Journal text8: Personals Corpus text9: The Man Who Was Thursday by G. K. Chesterton 1908 16 Eksisterende korpuser Tilgjengelig for nedlasting: Project Gutenberg (Forsøk på) representative korpuser Brown 1M ord British National Corpus (BNC), 100M ord (register, domene, forskjellige tidsperioder, sjanger, demografi osv) American National Corpus, under bygging Store korpuser: Gigaword ( 1.7 milliarder ord, nyhetstekster) Common crawl (flere petabytes) 17

Eksisterende korpuser Korpuser for andre språk enn engelsk Arabisk Gigaword Chinese news Norsk Aviskorpus norske nyheter 1998-2014 ca. 1.5 millarder ord NoWaC ( Norwegian Web as Corpus ) web-dokumenter fra.no-domener ca 700 millioner ord NoTa-korpuset transkripsjoner av samtaler og intervju fra informanter født og oppvokst i Oslo-området transkribert tekst og tale 18 Eksisterende korpuser Parallelle korpuser EUROPARL, OPUS 19

Annotering Korpuser inneholder forskjellige typer informasjon og har gjennomgått forskjellige former for (automatisk/manuell) annotering Delt opp i enheter som tilsvarer et ord, sk tokens: ord, tall, tegnsetting tokenisering Stemming eller lemmatisering: reduksjon til baseform 20 Annotering Korpuser med manuell annotering Mennesker merker opp lingvistisk informasjon Ordklasse (feks Brown) The/at Fulton/np County/np Grand/jj Jury/nn said/vbd Friday/nr an/at investigation/nn... Syntaks (trebanker, feks Penn Treebank) Ordsemantikk, diskursrelasjoner etc. (S (NP (ADJ Happy) (N linguists)) (VP (V make) (NP (Det a) (N diagram)))) 21

Manuelt annotert korpus for maskinlæring Et manuelt annotert korpus Ordbetydning SKIM the pages for a clearer insight: Reading She SKIMS through the novel which seems to fascinate them: Reading Remove the vanilla pod, SKIM the jam, and let it cool: Removing We SKIMMED across the surface of that sodding lake whilst all around us gathered the dark hosts of hell: Self motion Trene en klassifiserer: Tren på Reading, Removing og Self motion instanser Appliser på ny instans: hvilken klasse ligner den mest på? A red grouse SKIMMED low over the heather:??? 22 Oppsummering: språklige data Menneskelig språkprosessering afasi-studier måling av hjerneaktivitet Korpusdata representativitet størrelse annotering Utstrakt bruk i språkteknologiske modeller 23

Morfologi Morfologi 24

Morfologi Hvordan ord er bygd opp Hvordan ord bøyes Hvordan ord dannes Hvordan ord deles i ordklasser 25 Ordet Relativ grei betydning i dagligtale I språkteknologi kan det derimot brukes på flere forskjellige måter Kari og Ola gikk på tur i skogen, for de liker å gå på tur. Det var for øvrig en stor skog. 25 ord (tokens) men også 21 ord (typer) eller 17 ord (leksem) 26

Tokenisering Dele opp en tekst i løpende ord Første skritt i nesten alle språkteknologiske oppgaver Definisjon: a string of contiguous alphanumeric characters with space on either side; may include hyphens and apostrophes, but no other punctutation marks (Kucera & Francis, 1967) 27 Tokenisering: problemer Punktum del av forkortelser: f.eks. både forkortelse og setningsslutt (Kjøper gamle møbler, bøker, klær, etc.) Apostrof the children vs. the children s toys I ll, isn t, don t 28

Tokenisering: problemer Bindestrek Ett eller flere ord? Oslo-borgeren skrive- og leseopplæring Mellomrom Annet: Egennavn: New York Faste fraser: i fjor, blant annet Tall: 100 000 10,26 og 10:26 URL er 29 Ordet Kunnskap om ord viktig del av det å beherske et språk Kobling mellom en lydsekvens og en spesifikk betydning Vilkårlig kobling: samme lyd - forskjellig betydning (to, two) forskjellig lyd - samme betydning (sofa, couch) Lagret i mentalt leksikon: fonologisk representasjon betydning (ortografi) ordklasse etc. 30

Ordet Viktig skille i språk: Innholdsord: substantiver, verb og adjektiv Betegner konsepter som objekter, handlinger, egenskaper og ideer barn, skrive, spennende, anarkisme Åpen klasse: stadig nye ord, feks hverdagsintegrering, ståhjuling Funksjonsord: konjunksjoner, preposisjoner, artikler og pronomen Betegner grammatiske relasjoner, lite eller ingen semantisk innhold the, a bestemthet, of eierskap Lukket klasse: ikke ofte nye tilskudd, (hen?) 31 Ordet Skillet mellom innholdsord og funksjonsord Neurolingvistikk: afasikere slips-of-tongue hos normale språkbrukere turn to tend out i stedet for tend to turn out Barnespråk: overgeneralisering... og det var mange manner der 32

Ordet Og nå: GJETTEKONKURRANSE 33 Ordet Hvilken skal ut? gulest gul gulere rød 34

Ordet Hvilken skal ut? penger grammatikk rød ere 35 Ordet Hvilken skal ut? ing het else an 36

Morfemet Morfemet Ord har intern struktur som er regelstyrt U-mulig, u-rolig, u-intelligent hva betyr u-? *mulig-u, *rolig-u Ord kan bestå av flere meningsbærende enheter Morfemet elementær enhet (gr. morphe form) Morf+ologi vitenskapen om (ord)former 37

Morfemet Et ord kan bestå av ett eller flere morfemer: ett morfem: boy, desire, morph to morfemer: boy+ish, desire+able, morph+ology tre morfemer: boy+ish+ness, desire+able+ity fire morfemer: gentle+man+li+ness, un+desire+able+ity mer enn fire morfemer: un+gentle+man+li+ness, anti+dis+establish+ment+ari+an+ism 38 Morfemet Morfemet er den elementære (minste) lingvistiske enheten Kan ikke analyseres videre Språk består i hovedsak av diskrete enheter som kan kombineres (kreativitet) et bloggbart tema 39

Morfemet Vår morfologiske kunnskap har to hovedkomponenter Frie morfemer: ord. boy, desire, gentle, man Bundne morfemer: affikser. prefikser: un-, pre-, bi- suffikser: -ing, -ish, -ness Språk benytter affikser i varierende grad: engelsk: dance (v.), dance (n.) tyrkisk: suffiks -ak, dur to stop, durak stopping place Noen språk har infikser Bontov (Filippinene): fikas sterk, fumikas å være sterk un-fuckin-believable Noen språk har sirkumfikser Tysk: ge+lieb+t har elsket 40 Morfemet Morfologisk komplekse ord består av : Rot + en eller flere affikser (hus+lig) En rot er et ordelement som ikke kan deles opp i mindre (meningsbærende) deler Ofte, men ikke nødvendigvis et ord som kan stå alene: *ceive som i conceive *ling som i linguist 41

Orddannelse Orddannelse Kunnskap om morfologi innebærer kunnskap om regler for orddannelse Kombinerer morfemer til komplekse ord (kjærlig-het, (jern+bane)+(arbeid+er)) Adj + -het Substantiv Verb + -er Substantiv (en som gjør Verb) 42

Avledning En avledning er et ord som er dannet fra et annet ord ved hjelp av et avledningsaffiks (prefiks eller suffiks), Avledningsbasen kan være et rotord (barn) eller en avledning (barnslig) Avledningsaffiksene er bundne morfemer med klart semantisk innhold (som innholdsord, men er ikke ord) Avledningsaffikser u-- negasjon: umulig, uvel, urolig for- - foran: forelese, forbokstav, formann -er - den som utfører handlingen: fisker, baker 43 Avledning Avledningsaffikser bidrar med betydning Når et suffiks blir lagt til endres som regel ordklassen Det er siste del av ordet som bestemmer ordklasse, derfor endrer ikke prefikser ordklassen (villig - uvillig, arbeide - bearbeide) Suffikser -er: Verb Substantiv, f.eks. fisker, baker -ing: Verb Substantiv, f.eks. bading, baking, banning -lig: Substantiv Adjektiv, f.eks. alvorlig, hyggelig, latterlig, vanlig -n: Adjektiv Verb, f.eks. gulne, lysne, stivne 44

Bøyning markerer kategorier som tempus, numerus, kasus, etc. Bøyningskategorier i norsk Genus (kjønn): alle substantiver har fast genus og ord som står til substantivet samsvarsbøyes (en snill katt, et snilt beltedyr) Tall: entall og flertall bil-biler Bestemthet: uttrykkes i hovedsak ved suffiks (bilen, huset) eller (jf. engelsk bestemt artikkel the) Kasus: uttrykker den funksjonen en frase har som setningsledd. To kasus i norsk: nominativ og akkusativ. I hovedsak på pronomen hun-henne... 45 Bøyning I norsk har vi følgende bøyningskategorier (forts.): Grad: tre grader uttrykkes ved bøyning, positiv, komparativ, superlativ (fin-finere-finest) Tempus: angir tidspunktet for handlingen eller tilstanden som setningen beskriver. I norsk uttrykkes to tempus ved bøyning: presens (nåtid) og preteritum (fortid) spiser-spiste Diatese: den semantiske relasjonen subjektet har til verbet i setningen, kan dannes med endelsen -s Vi hører musikken helt hit - Musikken høres helt hit 46

Bøyning Sammenlignet med en rekke andre språk har norsk og engelsk forholdsvis lite bøyningsmorfologi morfologi konkurrerer med syntaks Engelsk vs russisk: Victor defends Maxim Maxim defends Victor Maksim za si s cajet Viktora = Maksim Viktora za si s cajet = Viktora za si s cajet Maksim 47 Bøyning vs. avledning Forskjeller på bøyning og avledning: 1. Ved bøyning skifter ordet aldri ordklasse, ved avledning skifter ordet som oftest ordklasse barn - barnet barn - barnslig 2. Alle prefikser er avledningsaffikser, suffikser derimot kan brukes både til bøyning og avledning 3. Bøyning er mer produktiv 48

Bøyning vs. avledning Forskjeller på bøyning og avledning (forts.): 4. Bøyningssuffikser i norsk har alltid svakt trykk (bilen, spiste), mens avledningssuffikser kan ha sterkt trykk (sentral) eller bitrykk tenkbar 5. Bøyningsendelser ligger alltid i slutten av ordet, men avledningsendelsene kommer tidligere (når vi har begge deler) galskapen 49 Sammensetninger En tredje form for orddannelse, svært vanlig i germanske språk, her: norsk Ord som består av deler som hver for seg også er egne ord To ledd: Forledd husetterfram- Etterledd tak prøve på Etterleddet bestemmer vanligvis ordklasse (fredlyse, rustfri) 50

Sammensetninger De fleste sammensetninger er determinative: etterleddet gir hovedbetydning, mens forleddet avgrenser. bilhjul, hjulbåt Flere forskjellige relasjoner: tømmerhytte hytte av tømmer (materiale) feriehytte hytte for ferie (hensikt) fjellhytte hytte på fjellet (sted) sommerhytte hytte for sommerbruk (tid for bruk) selvbetjeningshytte hytte med selvbetjening (måten man bruker hytten på) 51 Oversikt på tavla 52

Morfologisk typologi Isolerende språk 53

Syntetiske språk, (feks de fleste indo-europeiske): de aller fleste ord formes ved affiksering til en rot. Agglutinerende: Ethvert affiks representerer et distinkt trekk (feks fortid, flertall) ethvert trekk korresponderer til ett affiks Bøyningsspråk ( Inflectional ) (feks romanske språk): flere grammatiske kategorier kan være representert i ett affiks 54 Agglutinerende språk 55

Bøyningsspråk 56 Polysyntetiske språk 57