INF1820: Ordklassetagging

Størrelse: px
Begynne med side:

Download "INF1820: Ordklassetagging"

Transkript

1 NF1820: Ordklassetagging NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Arne Skjærholt 6. mars

2 NF1820: Ordklassetagging Ordklassetagging Never gonna give you up Never gonna let you down Problemet: Gitt en inputsekvens av ord, hva er den riktige sekvensen tagger for ordene? RB: adverb; MD+TO: modal with infinitival to; VB: verb base form; PRP: personal pronoun; RP: particle Never gonna give you up Never gonna let you down

3 NF1820: Ordklassetagging Ordklassetagging Never/RB gonna/md+to give/vb you/prp up/rp Never/RB gonna/md+to let/vb you/prp down/rp Problemet: Gitt en inputsekvens av ord, hva er den riktige sekvensen tagger for ordene? RB: adverb; MD+TO: modal with infinitival to; VB: verb base form; PRP: personal pronoun; RP: particle Never/RB gonna/md+to give/vb you/prp up/rp Never/RB gonna/md+to let/vb you/prp down/rp

4 NF1820: Ordklassetagging Ordklassetagging Flertydighet De fleste ord er entydige: 11,5% av ordtyper er flertydige. Men 40% av tokens er flertydige. Det vil si: ord som forekommer ofte er oftere flertydige enn mindre vanlige ord. Men ikke alle betydninger er like vanlige, og vanlige i denne sammenhengen tilsvarer sannsynlighet. Dette kommer vi til å benytte oss av. Flertydighet

5 NF1820: Ordklassetagging Ordklassetagging Ordklassekriterier Litt repetisjon: Ordklasseinndelingen organiserer alle ord, slik at et ord tilhører nøyaktig én ordklasse (det er en taksonomi) styrt av visse kriterier. Morfologisk: hare/haren vs. redd/*redd-en Syntaktisk: en redd hare/redd for ilden vs. *en redd/*hare for ilden Semantisk: hare: dyr, levende vesen; redd: egenskap Ordklassekriterier

6 NF1820: Ordklassetagging Ordklassetagging Ordklassekriterier Formelle/morfologiske Funksjonelle/syntaktiske Betydningsmessige/semantiske Litt repetisjon: Ordklasseinndelingen organiserer alle ord, slik at et ord tilhører nøyaktig én ordklasse (det er en taksonomi) styrt av visse kriterier. Morfologisk: hare/haren vs. redd/*redd-en Syntaktisk: en redd hare/redd for ilden vs. *en redd/*hare for ilden Semantisk: hare: dyr, levende vesen; redd: egenskap Ordklassekriterier Formelle/morfologiske Funksjonelle/syntaktiske Betydningsmessige/semantiske

7 NF1820: Ordklassetagging Utfallsrom Ω, mengden av mulige utfall En delmengde E Ω kalles en hendelse P tilordner sannsynlighet [0,1] til hendelser Snakke litt om eksemplene fra forrige gang. Utfallsrom Ω, mengden av mulige utfall En delmengde E Ω kalles en hendelse P tilordner sannsynlighet [0,1] til hendelser

8 NF1820: Ordklassetagging Betinget sannsynlighet P (A B) P (A B) = P (B) P (A B) = P (A)P (B A) P (A B) = P (A B)P (B) P (A)P (B A) = P (A B)P (B) Betinget sannsynlighet P (A B) = P (A B) P (B) P (A B) = P (A)P (B A) P (A B) = P (A B)P (B) P (A)P (B A) = P (A B)P (B)

9 NF1820: Ordklassetagging Bayes teorem Eksempelet: En skole har 40% jenter og 60% gutter. Alle guttene går i bukser, halvparten av jentene bruker skjørt, resten bukser. Hva er sannsynligheten for at en i bukser er en jente? Bayes teorem

10 NF1820: Ordklassetagging Bayes teorem P (B A)P (A) P (A B) = P (B) Eksempelet: En skole har 40% jenter og 60% gutter. Alle guttene går i bukser, halvparten av jentene bruker skjørt, resten bukser. Hva er sannsynligheten for at en i bukser er en jente? Bayes teorem P (A B) = P (B A)P (A) P (B)

11 NF1820: Ordklassetagging Argmax: Den x som gir størst f (x) x 0 = argmax x X f (x) betyr at f (x) f (x 0) for alle x X Argmax: Den x som gir størst f (x) x0 = argmax x X f (x) betyr at f (x) f (x 0 ) for alle x X

12 NF1820: Ordklassetagging Argmax: Den x som gir størst f (x) x 0 = argmax x X f (x) betyr at f (x) f (x 0) for alle x X def argmax(f, xs): max_f = f(x[0]) max_x = x[0] for x in xs[1:]: new_f = f(x) if new_f > max_f: max_f = new_f max_x = x return (max_x, max_f) Argmax: Den x som gir størst f (x) x0 = argmax x X f (x) betyr at f (x) f (x 0 ) for alle x X def argmax(f, xs): max_f = f(x[0]) max_x = x[0] for x in xs[1:]: new_f = f(x) if new_f > max_f: max_f = new_f max_x = x return (max_x, max_f)

13 NF1820: Ordklassetagging Tagging Utfallsrommet er alle taggsekvenser n, gitt den observerte setningen w1 n, og vil finne den taggsekvensen som er mest sannsynlig (har høyest sannsynlighet) gitt ordsekvensen: ˆt 1 n = argmax x P (tn 1 wn 1 ). Tagging

14 NF1820: Ordklassetagging ˆt 1 n = argmax P ( n wn 1 ) n Men denne sannsynligheten er faktisk ganske vanskelig å regne på, så vi bruker Bayes teorem og omformer uttrykket. Sannsynligheten til ordsekvensen kan strykes, siden den sannsynligheten er konstant for en gitt inputstreng. ˆt 1 n = argmax P ( n wn 1 ) n

15 NF1820: Ordklassetagging ˆt 1 n = argmax P ( n wn 1 ) n P (w1 n = argmax tn 1 )P (tn 1 ) n P (w1 n) Men denne sannsynligheten er faktisk ganske vanskelig å regne på, så vi bruker Bayes teorem og omformer uttrykket. Sannsynligheten til ordsekvensen kan strykes, siden den sannsynligheten er konstant for en gitt inputstreng. ˆt 1 n = argmax P ( n wn 1 ) n = argmax t n 1 P (w n 1 tn 1 )P (tn 1 ) P (w n 1 )

16 NF1820: Ordklassetagging ˆt 1 n = argmax P ( n wn 1 ) n P (w1 n = argmax tn 1 )P (tn 1 ) n P (w1 n) = argmaxp (w1 n tn 1 )P (tn 1 ) n Men denne sannsynligheten er faktisk ganske vanskelig å regne på, så vi bruker Bayes teorem og omformer uttrykket. Sannsynligheten til ordsekvensen kan strykes, siden den sannsynligheten er konstant for en gitt inputstreng. ˆt 1 n = argmax P ( n wn 1 ) n = argmax t n 1 P (w n 1 tn 1 )P (tn 1 ) P (w n 1 ) = argmaxp (w1 n tn 1 )P (tn 1 ) n

17 NF1820: Ordklassetagging n P ( n ) = P (t i t i 1) i n P (w1 n tn 1 ) = P (w i t i) 1 Men vi er ikke helt i mål enda. Først gjør vi den samme antagelsen for P ( n ) som vi gjorde for språkmodeller: neste tagg avhenger kun av foregående tagg. Dette kalles for Markovantagelsen. En lignende antagelse gjør vi for ordsekvensen gitt taggsekvensen: hvert ord avhenger kun av taggen på det ordet. Dette siste uttrykket er heller ikke åpenbart bedre, men med en lur algoritme (Viterbi-algoritmen) går det bra. Viterbi er pensum i NF4820. n P ( n ) = P (t i t i 1 ) n P (w1 n tn 1 ) = P (w i t i ) i 1

18 NF1820: Ordklassetagging n P ( n ) = P (t i t i 1) i n P (w1 n tn 1 ) = P (w i t i) 1 n ˆt 1 n = argmax P (t i t i 1)P (w i t i) n i=1 Men vi er ikke helt i mål enda. Først gjør vi den samme antagelsen for P ( n ) som vi gjorde for språkmodeller: neste tagg avhenger kun av foregående tagg. Dette kalles for Markovantagelsen. En lignende antagelse gjør vi for ordsekvensen gitt taggsekvensen: hvert ord avhenger kun av taggen på det ordet. Dette siste uttrykket er heller ikke åpenbart bedre, men med en lur algoritme (Viterbi-algoritmen) går det bra. Viterbi er pensum i NF4820. n P ( n ) = P (t i t i 1 ) n P (w1 n tn 1 ) = P (w i t i ) ˆt n 1 = argmax t n 1 i 1 n P (t i t i 1 )P (w i t i ) i=1

19 NF1820: Ordklassetagging ˆP (t t ) = c(t,t) c(t ) ˆP (w t) = c(w,t) c(t) Sannsynlighetene estimerer vi akkurat som i språkmodellene (med MLE). Sannsynligheten P (t t ) kalles ofte for transisjonssannsynligheten, og P (w t) for emisjonssannsynligheten. ˆP (t t ) = c(t,t) c(t ) ˆP (w t) = c(w,t) c(t)

20 NF1820: Ordklassetagging Q tilstander V vokabular t : Q Q P e : Q V P Q,V,t,e En annen måte å se HMMer på er som en probabilistisk FSA, noe som forklarer bruken av transisjon. Når maskinen kommer inn i en tilstand genererer den et ord (emisjonen) som er det vi ser. Dette er også grunnen til at vi snakker om hidden: den faktiske tilstandssekvensen er ukjent for oss (skjult). t: transisjonsfunksjonen, e emisjonsfunksjonen, q s starttilstand, q f sluttilstand. Q tilstander V vokabular t : Q Q P e : Q V P Q,V,t,e

21 NF1820: Ordklassetagging

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags

Detaljer

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell

Detaljer

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning INF5820 Natural Language Processing - NLP H2009 [email protected] HMM Tagging INF5830 Lecture 3 Sep. 7 2009 Today More simple statistics, J&M sec 4.2: Product rule, Chain rule Notation, Stochastic variable

Detaljer

INF1820: Oppsummering

INF1820: Oppsummering Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #5: Språkmodeller

IN1140: Introduksjon til språkteknologi. Forelesning #5: Språkmodeller IN1140: Introduksjon til språkteknologi Forelesning #5: Språkmodeller Lilja Øvrelid Universitetet i Oslo 27 september 2018 Agenda 2 Forrige uke Tilstandsmaskiner og regulære uttrykk Oblig 1b inn neste

Detaljer

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar

INF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #12

IN1140: Introduksjon til språkteknologi. Forelesning #12 IN1140: Introduksjon til språkteknologi Forelesning #12 Lilja Øvrelid Universitetet i Oslo 15 november 2018 Tema for i dag 2 I dag Repetisjon Digital prøveeksamen Neste uke Gjennomgang av eksamensoppgave

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #13

IN1140: Introduksjon til språkteknologi. Forelesning #13 IN1140: Introduksjon til språkteknologi Forelesning #13 Samia Touileb Universitetet i Oslo 22. november 2018 Vinnerne av obligkonkurransen 2 De har scoret flest oblig-poeng igjennom semesteret (av maksimalt

Detaljer

Slides til 12.1 Formelt språk og formell grammatikk

Slides til 12.1 Formelt språk og formell grammatikk Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen

Detaljer

INF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione

INF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione Arne Skjærholt Terza lezione Arne Skjærholt Terza lezione Regulære uttrykk Regex Regulære uttrykk (regular expressions) er et godt eksempel på det som kalles finite-state methods (hvorfor det heter det

Detaljer

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK 19. januar 2017 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En

Detaljer

INF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY

INF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY INF5830, H2009, Obigatorisk innlevering 2 Innleveringsfrist 4.11 1 Oppgave: Unære produksjoner i CKY For bottom-up parsere, som CKY, har vi forutsatt at grammatikken er på CNF. For de ikke-leksikalske

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 20. januar 2012 2 Non-Determinism Speech and Language Processing - Jurafsky and Martin

Detaljer

Tema 1: Hendelser, sannsynlighet, kombinatorikk Kapittel ST1101 (Gunnar Taraldsen) :19

Tema 1: Hendelser, sannsynlighet, kombinatorikk Kapittel ST1101 (Gunnar Taraldsen) :19 Tema 1: Hendelser, sannsynlighet, kombinatorikk Kapittel 2.1-2.7 ST1101 (Gunnar Taraldsen) 2019-01-12 17:19 Sentrale definisjoner og regneregler Definisjoner: Stokastisk forsøk, utfallsrom, hendelser (snitt,

Detaljer

LF - Eksamen i INF1820

LF - Eksamen i INF1820 LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UIVERSITETET I OSLO et matematisk-naturvitskapelige fakultet Eksam i: IF1820 Introduksjon til språk- og kommunikasjonsteknologi Eksamsdag: 17. juni 2016 Tid for eksam: 14.30 18.30 Oppgavesettet er på 6

Detaljer

Sannsynlighetsregning og kombinatorikk

Sannsynlighetsregning og kombinatorikk Sannsynlighetsregning og kombinatorikk Introduksjon Formålet med sannsynlighet og kombinatorikk er å kunne løse problemer i statistikk, somoftegårutpååfattebeslutninger i situasjoner der tilfeldighet rår.

Detaljer

Oppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være:

Oppgave 2. Eksamen INF2820, 2015, oppgave 2. La gramatikk G være: 2 Eksamen INF2820, 2015, oppgave 2 Oppgave 2 La gramatikk G være: S > NP VP VP > VI VP > VTV NP VP > VS CP CP > C S NP > 'dyret' 'barnet' 'Kari' 'Ola' VI > 'sov' 'smilte' 'danset' VTV > 'kjente' 'likte'

Detaljer

Oppgave 1 (samlet 15%)

Oppgave 1 (samlet 15%) 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser

IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser 1 NLTK og språkmodeller Målet med denne oppgaven er å programmere to språkmodeller (en unigrammodell og trigrammodell) ved hjelp av Python s Natural

Detaljer

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt

INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon Previously... Alle rare ordene Alle rare morfene Previously... Coming up... Morfologi med datamaskin (computational morphology) Hvordan analysere

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #6

IN1140: Introduksjon til språkteknologi. Forelesning #6 IN1140: Introduksjon til språkteknologi Forelesning #6 Samia Touileb Universitetet i Oslo 04. oktober 2018 Tema for i dag 2 Ordklasser Ordklassetaggede korpuser Ordklassetagging Ordklasser? 3 Parts-of-speech

Detaljer

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo

. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk. Sverre Stausland Johnsen Universitetet i Oslo .. Grammatiske problem med å beskrive ordklassen adverb og setningsleddet adverbial i norsk Sverre Stausland Johnsen Universitetet i Oslo [email protected] Universitetet i Stavanger 15. januar

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #6

IN1140: Introduksjon til språkteknologi. Forelesning #6 IN1140: Introduksjon til språkteknologi Forelesning #6 Samia Touileb Universitetet i Oslo 26. september 2019 Tema for i dag 2 Ordklasser Ordklassetaggede korpuser Ordklassetagging Ordklasser? 3 Parts-of-speech

Detaljer

Kompleksitet. IN algoritmer og datastrukturer Plenumstime / repetisjon

Kompleksitet. IN algoritmer og datastrukturer Plenumstime / repetisjon Kompleksitet IN2010 - algoritmer og datastrukturer Plenumstime / repetisjon Dagens agenda Kompleksitet - hva er det? Avgjørelsesproblemer Kompleksitetsklassene P og NP Reduksjoner - å redusere et problem

Detaljer

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning INF2820 Datalingvistikk V2016 Jan Tore Lønning I dag Automater og regulære uttrykk Litt Python Implementasjon av DFA i Python Naiv NFA-algoritme Smart NFA-algoritme Pythonimplementasjon av smart NFA 1.

Detaljer

IN1140: Introduksjon til språkteknologi. Forelesning #2

IN1140: Introduksjon til språkteknologi. Forelesning #2 IN1140: Introduksjon til språkteknologi Forelesning #2 Samia Touileb Universitetet i Oslo 30. august 2018 Tema forrige uke 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Tema for

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

Rekurrens. MAT1030 Diskret matematikk. Rekurrens. Rekurrens. Eksempel. Forelesning 16: Rekurrenslikninger. Dag Normann

Rekurrens. MAT1030 Diskret matematikk. Rekurrens. Rekurrens. Eksempel. Forelesning 16: Rekurrenslikninger. Dag Normann MAT1030 Diskret matematikk Forelesning 16: likninger Dag Normann Matematisk Institutt, Universitetet i Oslo INGEN PLENUMSREGNING 6/3 og 7/3 5. mars 008 MAT1030 Diskret matematikk 5. mars 008 Mandag ga

Detaljer

Lineærtransformasjoner

Lineærtransformasjoner Kapittel 8 Lineærtransformasjoner I forrige kapittel begynte vi å formulere lineær algebra på en generell måte, ved å gi en abstrakt definisjon av vektorrom For å beskrive sammenhenger mellom forskjellige

Detaljer

a) Ved numerisk metode er det løst en differensiallikning av et objekt som faller mot jorden. Da, kan vi vi finne en tilnærming av akselerasjonen.

a) Ved numerisk metode er det løst en differensiallikning av et objekt som faller mot jorden. Da, kan vi vi finne en tilnærming av akselerasjonen. Oppgave 1 a) Ved numerisk metode er det løst en differensiallikning av et objekt som faller mot jorden. Da verdier av er kjent gjennom resultater i form av,, kan vi vi finne en tilnærming av akselerasjonen.

Detaljer

MA2401 Geometri Vår 2018

MA2401 Geometri Vår 2018 MA2401 Geometri Vår 2018 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Løsningsforslag Øving 4 4.1 1 Dette resultatet følger fra ytre vinkel-teoremet og lineært par-teoremet.

Detaljer

Oppgave 2. INF5110 oppgave 2 på eksamen v04 med teori. FirstMengder. Arne Maus Ifi. Eks. 4.9 Beregning av First-mengde. terminal

Oppgave 2. INF5110 oppgave 2 på eksamen v04 med teori. FirstMengder. Arne Maus Ifi. Eks. 4.9 Beregning av First-mengde. terminal Oppgave 2 INF5110 oppgave 2 på eksamen v04 med teori rne Maus Ifi FirstMengder Def { terminal First () = { a finnes avledning * a α } Dessuten: Om er utnullbar, så er ε First() Eks. 4.9 eregning av First-mengde

Detaljer

Analysedrypp I: Bevis, mengder og funksjoner

Analysedrypp I: Bevis, mengder og funksjoner Analysedrypp I: Bevis, mengder og funksjoner Hensikten med Analysedrypp er å bygge en bro mellom MAT1100 og MAT1110 på den ene siden og MAT2400 på den andre. Egentlig burde det være unødvendig med en slik

Detaljer

Dokument-embeddings / Markov-kjeder. Fredrik Jørgensen, Schibsted Media/UiO

Dokument-embeddings / Markov-kjeder. Fredrik Jørgensen, Schibsted Media/UiO Dokument-embeddings / Fredrik Jørgensen, Schibsted Media/UiO Oversikt 1. 2. Dokument-embeddings: Repetisjon + ord => dokumenter Markovkjeder: Vi bygger en robot-journalist! 1. Dokument-embeddings Word2Vec:

Detaljer

Følgelig vil sannsynligheten for at begge hendelsene inntreffer være null,

Følgelig vil sannsynligheten for at begge hendelsene inntreffer være null, Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 3, blokk I Løsningsskisse Oppgave 1 Hvis hendelsene A og B er uavhengige, vil enhver kunnskap om hvorvidt A har

Detaljer

Kapittel 2: Sannsynlighet [ ]

Kapittel 2: Sannsynlighet [ ] Kapittel 2: Sannsynlighet [2.6-2.8] TMA4240 Statistikk (F2 og E7) 2.6, 2.7, 2.8: Betinget sannsynlighet [23.august 2004] [email protected] p.1/18 Oppsummering fra 2.1-2.5 FENOMEN Eksperiment

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et

Detaljer

Fagdag 5-08.01.09. 2) Du skal fylle ut en tippekupong. På hvor mange måter kan dette gjøres?

Fagdag 5-08.01.09. 2) Du skal fylle ut en tippekupong. På hvor mange måter kan dette gjøres? Fagdag Plan Fagdag - 08.01.0 1,2 time: Repetisjon kapittel 3 - Sannsynlighet Oppgaver Teori (lesestoff) 3, time: Arbeide med.1 og.2: 16, 17, 18, 1 3, time: Ekstra vurdering før terminoppgjør Repetisjon

Detaljer

Oppgave 1. Spørsmål 1.1 (10%) Gitt det regulære uttrykket: a((bcd)+(cd))*cd

Oppgave 1. Spørsmål 1.1 (10%) Gitt det regulære uttrykket: a((bcd)+(cd))*cd 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal besvare alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

9 Lineærtransformasjoner TMA4110 høsten 2018

9 Lineærtransformasjoner TMA4110 høsten 2018 9 Lineærtransformasjoner MA4 høsten 8 I forrige kapittel begynte vi å formulere lineær algebra på en generell måte, ved å gi en abstrakt definisjon av vektorrom For å beskrive sammenhenger mellom forskjellige

Detaljer

Obs. Læreren må være klar over at det er mulig å få riktig svar ved å regne feil her,

Obs. Læreren må være klar over at det er mulig å få riktig svar ved å regne feil her, Oppgave 1 b 3b Hva er 3a 8a b hvis a 2? A 5 B 7 C 8 D 24 E 70 Er det nødvendig å finne tall for a og b? Hvor i uttrykket finnes a b? b Hva blir verdien av første ledd når a 2? Skriv om potensen i andre

Detaljer

Notat om Peanos aksiomer for MAT1140

Notat om Peanos aksiomer for MAT1140 Notat om Peanos aksiomer for MAT1140 1 Tall Hva er egentlig tall? Tanken her, er ikke å si hva tall er, hva deres interne struktur muligens kan være, men å si hva vi kan gjøre med dem, sett utenifra. Vi

Detaljer

MAT1030 Forelesning 22

MAT1030 Forelesning 22 MAT1030 Forelesning 22 Grafteori Dag Normann - 14. april 2010 (Sist oppdatert: 2010-04-14 12:45) Kombinatorikk Oppsummering av regneprinsipper Ordnet utvalg med repetisjon: n r Ordnet utvalg uten repetisjon:

Detaljer

Kombinatorikk. MAT1030 Diskret Matematikk. Oppsummering av regneprinsipper

Kombinatorikk. MAT1030 Diskret Matematikk. Oppsummering av regneprinsipper MAT1030 Diskret Matematikk Forelesning 22: Grafteori Dag Normann Matematisk Institutt, Universitetet i Oslo Kombinatorikk 14. april 2010 (Sist oppdatert: 2010-04-14 12:43) MAT1030 Diskret Matematikk 14.

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 22: Grafteori Dag Normann Matematisk Institutt, Universitetet i Oslo 14. april 2010 (Sist oppdatert: 2010-04-14 12:42) Kombinatorikk MAT1030 Diskret Matematikk 14.

Detaljer

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk :

Oppgave 1 Vi har gitt følgende grammatikk for noe vi kan kalle speilengelsk : Eksempelspørsmål Spørsmål av denne typen kan forventes til eksamen, men kanskje ikke så mange. I hvert fall ville dette pluss spørsmål fra første del av pensum blitt for mye for en tretimers eksamen. Oppgave

Detaljer

Matchinger i ikke-bipartite grafer

Matchinger i ikke-bipartite grafer Matchinger i ikke-bipartite grafer Stein Krogdahl, Notat til INF 3/4130 Sist revidert september 2006 Vi skal i dette notatet se på det å finne matchinger i generelle grafer, uten noe krav om at grafen

Detaljer

MA2401 Geometri Vår 2018

MA2401 Geometri Vår 2018 MA2401 Geometri Vår 2018 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag 3.5 2 La l være ei linje, A et punkt på l og B et annet punkt på l. Vi skal vise at det finnes nøyaktig

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011 ÅMA110 Sannsynlighetsregning med statistikk, våren 2011 Kp. 2 Sannsynlighetsregning (sannsynlighetsteori) 1 Grunnbegrep Stokastisk forsøk: forsøk med uforutsigbart utfall Enkeltutfall: et av de mulige

Detaljer

Sannsynlighetsregning og Statistikk

Sannsynlighetsregning og Statistikk Sannsynlighetsregning og Statistikk Leksjon 2. Leksjon 2 omhandler begreper og regneregler for sannsynligheter. Dette er behandlet i kapittel 3.1 og 3.2 i læreboka. Du bør når du har fullført leksjon 2

Detaljer

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF 2820 V2015: Obligatorisk innleveringsoppgave 3 INF 2820 V2015: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 17.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Del 1 RD Parsing Oppgave 1:

Detaljer

APPENDIKS D Geminittisk språk/grammatikk

APPENDIKS D Geminittisk språk/grammatikk 1 APPENDIKS D Geminittisk språk/grammatikk Jeg har latt overskriften på dette appendikset bli sående i sin opprinnelige form, selv om jeg kun har maktet å gi et nokså usystematisk og mangelfullt innblikk

Detaljer

Kapittel 5: Mengdelære

Kapittel 5: Mengdelære MAT1030 Diskret Matematikk Forelesning 10: Mengdelære Dag Normann Matematisk Institutt, Universitetet i Oslo Kapittel 5: Mengdelære 17. februar 2010 (Sist oppdatert: 2010-02-17 12:41) MAT1030 Diskret Matematikk

Detaljer

MAT1030 Diskret Matematikk

MAT1030 Diskret Matematikk MAT1030 Diskret Matematikk Forelesning 10: Mengdelære Dag Normann Matematisk Institutt, Universitetet i Oslo 17. februar 2010 (Sist oppdatert: 2010-02-17 12:40) Kapittel 5: Mengdelære MAT1030 Diskret Matematikk

Detaljer

ØVINGER 2017 Løsninger til oppgaver. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir

ØVINGER 2017 Løsninger til oppgaver. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir ØVINGER 017 Løsninger til oppgaver Øving 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir S = {M, K}. Med to etterfølgende myntkast blir utfallsrommet S = {MM, MK,

Detaljer

Kapittel 2: Sannsynlighet

Kapittel 2: Sannsynlighet Kapittel 2: Sannsynlighet 2.1, 2.2: Utfallsrom og hendelser 2.3, 2.4: Kombinatorikk og sannsynlighet 2.5, 2.6, 2.7: Regneregler, betinget sanns. 2.8: Bayes regel Eirik Mo Institutt for matematiske fag,

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 2 Sannsynlighetsregning (sannsynlighetsteori) 1 Grunnbegrep Stokastisk forsøk: forsøk med uforutsigbart utfall Enkeltutfall: et av de mulige

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femte forelesning Lilja Øvrelid 13 februar, 2017 1 Lingvistikk Bindestreksdisipliner: psykolingvistikk, neurolingvistikk, sosiolingvistikk, datalingvistikk

Detaljer

Obligatorisk oppgave 1 i MAT1140, Høst Løsninger med kommentarer

Obligatorisk oppgave 1 i MAT1140, Høst Løsninger med kommentarer Obligatorisk oppgave 1 i MAT1140, Høst 2014. Oppgave 1 er med kommentarer En funksjon f : R R er en polynomfunksjon hvis f kan defineres som f(x) = a 0 + a 1 x + + a n x n hvor n 0 og a 0,..., a n er reelle

Detaljer

1 Mandag 8. februar 2010

1 Mandag 8. februar 2010 1 Mandag 8. februar 2010 Vi er ferdig med en-variabel-teorien, og vi kan begynne å jobbe med funksjoner i flere variable. Det første vi skal gjøre er å gå gjennom de vanlige analysene vi gjør for funksjoner

Detaljer

Løsningsforslag, eksamen statistikk, juni 2015

Løsningsforslag, eksamen statistikk, juni 2015 Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling.

Detaljer

Partielle ordninger, Zorns lemma og utvalgsaksiomet

Partielle ordninger, Zorns lemma og utvalgsaksiomet MAT1140, H-15 Partielle ordninger, Zorns lemma og utvalgsaksiomet I dette notatet skal vi se på Zorns lemma, som er et kraftig redskap for å bevise eksistensen av matematiske objekter. Beviset for Zorns

Detaljer

Eksamen 28.11.2011. REA3022 Matematikk R1. Nynorsk/Bokmål

Eksamen 28.11.2011. REA3022 Matematikk R1. Nynorsk/Bokmål Eksamen 28.11.2011 REA3022 Matematikk R1 Nynorsk/Bokmål Nynorsk Eksamensinformasjon Eksamenstid: Hjelpemiddel på Del 1: Hjelpemiddel på Del 2: Vedlegg: 5 timar: Del 1 skal leverast inn etter 2 timar. Del

Detaljer

Utvalgsaksiomet, velordningsprinsippet og Zorns lemma

Utvalgsaksiomet, velordningsprinsippet og Zorns lemma Utvalgsaksiomet, velordningsprinsippet og Zorns lemma Dag Normann Universitetet i Oslo Matematisk Institutt Boks 1053 - Blindern 0316 Oslo 13. mars 2007 I dette notatet skal vi gi et bevis for ekvivalensen

Detaljer

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 5, blokk I Løsningsskisse Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag.

Detaljer

MA2401 Geometri Vår 2018

MA2401 Geometri Vår 2018 MA2401 Geometri Vår 2018 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Løsningsforslag Øving 1 2.4 7 I Fanos geometri (se side 18 i læreboka) er punktene gitt ved symbolene

Detaljer