INF2820 Datalingvistikk V Gang 24.4 Jan Tore Lønning

Størrelse: px
Begynne med side:

Download "INF2820 Datalingvistikk V Gang 24.4 Jan Tore Lønning"

Transkript

1 INF2820 Datalingvistikk V Gang 24.4 Jan Tore Lønning

2 I dag: Tekstklassfisering To eksempler fra NLTK: Navn Filmanmeldelser, sentiment analysis Eksperimentering Evaluering Naive Bayes, hovedprinsipper Litt om sentiment analysis 2

3 Tekstklassifisering Kap. 6 Naive Bayes Classification and Sentiment I Jurafsky og Martin, 3.ed. (bare på nett foreløpig) Ikke seksjon 6.9 Statistical significance testing Vil også bruke noen slides derfra Kap 6 Learning to classify text I NLTK-boka Ikke seksjon 6.4 Decision trees Ikke 6.6 Maximum entropy classifier Bruke implementasjonen 21. april

4 Supervised classification A given set of classes, S={s 1, s 2,, s k } A well defined class of objects, O A classifier maps objects in O to classes in S Some features f 1, f 2,, f n For each feature: a set of possible values V 1, V 2,, V n The set of feature vectors: V= V 1 V 2 V n Each object in O is represented by some member of V: Written (v 1, v 2,, v n ), or (f 1 =v 1, f 2 =v 2,, f n =v n ) A classifier,, can be considered a mapping from V to S

5 Classification 5

6 NLTK-eksempel 1 In [2]: def gender_features(word):...: return{'last letter': word[-1]} In [3]: gender_features('shrek') Out[3]: {'last letter': 'k'} In [4]: from nltk.corpus import names In [5]: labeled_names = ([(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')]) 6

7 NLTK-eksempel 1, forts. In [6]: import random In [8]: random.shuffle(labeled_names) Bruk samme splitt gjennom flere eksperimenter for sammenlikning. Kan bety: splitt før uttrekning av trekk In [9]: featuresets = [(gender_features(n), gender) for (n, gender) in labeled_names] In [10]: train_set, test_set = featuresets[500:], featuresets[:500] 7

8 NLTK-eksempel 1, forts. In [11]: classifier = nltk.naivebayesclassifier.train(train_set) In [12]: classifier.classify(gender_features('neo')) Out[12]: 'male' In [13]: classifier.classify(gender_features('ada')) Out[13]: 'female' In [31]: print(nltk.classify.accuracy(classifier, test_set)) 0.79 Hvorfor får jeg 0.79 og boka 0.75? 8

9 I eksempelet A given set of classes, S={s 1, s 2,, s k } = { male, female } A well defined class of objects, O = { Ada, Albert, } = alle strenger av bokstaver Some features f 1, f 2,, f n, bare f 1 som er last_letter For each feature: a set of possible values V 1, V 2,, V n V 1 ={a, b, c,., z} The set of feature vectors: V= V 1 V 2 V n Each object in O is represented by some member of V: Written (v 1, v 2,, v n ), or (eks u ) (f 1 =v 1, f 2 =v 2,, f n =v n ) (eks last_letter : u ) A classifier,, can be considered a mapping from V to S

10 NLTK-eksempel 2 In [56]: def gender_features2(name):...: features = {}...: features["first_letter"] = name[0].lower()...: features["last_letter"] = name[-1].lower()...: for letter in 'abcdefghijklmnopqrstuvwxyz':...: features["count({})".format(letter)] = name.lower().count(letter)...: features["has({})".format(letter)] = (letter in name.lower())...: return features In [59]: featuresets2 = [(gender_features2(n), gender) for (n, gender) in labeled_names] In [60]: train_set2, test_set2 = featuresets2[500:], featuresets2[:500] In [61]: classifier2 = nltk.naivebayesclassifier.train(train_set2) In [62]: print(nltk.classify.accuracy(classifier2, test_set2))

11 Sammenlikning av features NLTK-boka trykt utgave gender_features (gf1) gir acc gender_features2 (gf2) gir acc Dette tyder på Flere trekk ikke alltid best Fare for at gender_features2 is overfitting : Tilpasser seg for mye til treningssettet Nettutgaven: gf1_acc: 0.77, gf2_acc: Vi: gf1_acc: 0.79, gf2_acc: april

12 Et mer komplisert bilde 10 eksperimenter viser et mer komplisert bilde Ikke trekk forhastede konklusjoner fra små forskjeller Variasjon Statistikk kan si noe om når forskjeller er store nok Accuracy: Exp.no gf1 gf april

13 NLTK-bokas forbedring def feat_suff_1_2(word): return {'suffix1': word[-1], 'suffix2': word[-2:]} Exp.no gf1 gf2 feat_suff_1_

14 Merk forskjellen def feat_suff_1_2(word): return {'suffix1': word[-1], 'suffix2': word[-2:]} =/= def feat_two_last(word): return {'suffix1': word[-1], 'suffix2': word[-2]} Accuracy: Exp.no f_suff_1_2 f_two_las april

15 I dag: Tekstklassfisering To eksempler fra NLTK: Navn Filmanmeldelser, sentiment analysis Eksperimentering Evaluering Naive Bayes, hovedprinsipper Litt om sentiment analysis 15

16 Movie reviews 1 > from nltk.corpus import movie_reviews > documents = [(list(movie_reviews.words(fileid)), category) for category in movie_reviews.categories() for fileid in movie_reviews.fileids(category)] > random.shuffle(documents) > all_words = nltk.freqdist(w.lower() for w in movie_reviews.words()) > word_features = [w for (w,_) in all_words.most_common(2000)] > wrong_features = list(all_words)[:2000] #feil_i_boka 21. april

17 Movie reviews 2 > def document_features(word_features, document): document_words = set(document) features = {} for word in word_features: features['contains({})'.format(word)] = (word in document_words) #True or False return features > featuresets = [(document_features(word_features, d), c) for (d,c) in documents] > train_set, test_set = featuresets[100:], featuresets[:100] > classifier = nltk.naivebayesclassifier.train(train_set) > print(nltk.classify.accuracy(classifier, test_set)) april

18 Movie reviews 3 Egenskaper To klasser: neg, pos Trekk ( features ): De 2000 mest frekvente ord i korpus Verdier: True/False Teller ikke antall forekomster Alle trekk som ikke er i dokumentet (= de fleste), får verdien False Kommentarer Strengt tatt bør trekk bare bestemmes av treningskorpus: (Her gir det ikke stor forskjell for resultatene) (ga 0.85 her!) Feil i boka (nettet) word_features Interessant å eksperimenter med trekk mm. 18

19 I dag: Tekstklassfisering To eksempler fra NLTK: Navn Filmanmeldelser, sentiment analysis Eksperimentering Evaluering Naive Bayes, hovedprinsipper Litt om sentiment analysis 19

20 Eksperimentelt oppsett Tren på Training Set Bruk Dev(-Test) Set for gjentatt testing i utviklingsfasen Spar Test Set til endelig testing Unngå overlæring 20

21 Fremgangsmåte 1. Tren klassifikator på treningssettet 2. Test den på utviklingssettet (dev-set) 3. (Ikke første runde:) Sammenlikn med tidligere var dette bedre? 4. Feilanalyse: Studer hvilke feil den gjør på dev-sett 5. Gjør endringer til klassifikatoren 6. Gjenta fra (1) ================== Når du er fornøyd, test på testsett (ingen vei tilbake) 21

22 Cross-validation Små testsett gir stor variasjon i resultatene En metode for å få større testsett er å bruke n- fold kryssvalidering: Del materialet inn i n like store deler (f.eks. n = 10) Foreta n mange eksperimenter: I eksperiment m, bruk del m som testsett og de n-1 andre delene som treningssett Dette gir n mange resultater: Vi kan ta gjennomsnittet av dem Vi kan se på variasjonen mellom resultatene: Dette sier noe om hvor sikre resultatene er statistikk! 22

23 Hvis vi både vil gjøre feilanalyse (se på feilene) of bruke kryssvalidering: Ta til side endelig testsett Bruke kryssvalidering for devsettene. 21. april

24 I dag: Tekstklassfisering To eksempler fra NLTK: Navn Filmanmeldelser, sentiment analysis Eksperimentering Evaluering Naive Bayes, hovedprinsipper Litt om sentiment analysis 24

25 Evalueringsmål: accuracy Hva vil det si at accuracy er 0.81? Av et testsett på 500 gjør klassifikatoren riktig 500*0,81 = 405 ganger og tar feil 500*0,19 = 95 ganger Et godt mål hvis: Klassene er like viktige Omtrent like store Gjelder for Navn: kvinne/mann Filmanmeldelse: pos/neg 25

26 Men For noen oppgaver er ikke klassene like viktige: Verre om et viktig brev havner i spamboksen enn om vi får et spambrev i vanlig post For noen oppgaver er det stor forskjell på størrelsene 26

27 Informasjonsgjenfinning Tradisjonell informasjonsgjenfinning ( information retrieval ), f.eks. bibliotek: Du er interessert i å finne de 5 dokumentene som handler om et fenomen ut av dokumenter. Systemet leverer 5 dokumenter. Alle er irrelevante. Nøyaktighet ( accuracy ) = / = 0,9999 Men uinteressant Fokusere i stedet på De dokumentene som systemet skal finne De dokumentene det finner Mindre interessant: De dokumentene som ikke er relevante 27

28 Confusion -matrise Vær nøye med hva som er kolonner og hva som er søyler: 21. april 2017 NLTKs ConfusionMatrix snur rundt på dette 28

29 Evalueringsmål Class ifier Is in C Yes NO Yes tp fp No fn tn Accuracy: (tp+tn)/n Precision:tp/(tp+fp) Recall (gjenfinning): tp/(tp+fn) F-score kombinerer recall og precision F 1 er harmonic mean Generell form for en 01 bestemmer vektlegging av P vs R 29

30 Flere klasser Accuracy: Presisjon, gjenfinning of f-score kan vi regne ut for hver klasse, jfr. figur 21. april

31 I dag: Tekstklassfisering To eksempler fra NLTK: Navn Filmanmeldelser, sentiment analysis Eksperimentering Evaluering Naive Bayes, hovedprinsipper Litt om sentiment analysis 31

32 Naive Bayes sannsynlighetsbasert Et objekt v (vektor) Finn sannsynligheten for hver klasse,,, Et tall mellom 0 og 1 Summen av dem er 1 Velg klassen som har størst sannsynlighet i symboler arg max P sm f1 v1, f2 v2,..., s m S f n v n 32

33 Naive Bayes: Model 33 Bayes formel For lite data, har kanskje ikke sett Vi antar en forenklende betingelse (som ikke er helt riktig) Satt sammen, skal vi velge klassen n i m i i m S s n n m S s s v f P s P v f v f v f s P m m ) ( arg max,...,, arg max n n m m n n n n m v f v f v f P s P s v f v f v f P v f v f v f s P,...,, ) (,...,,,...,, n i m i i m n n s v f P s v f v f v f P ,...,, f n v n v f v f,...,,

34 Naive Bayes, Trening1 Hvordan finner vi hva som er mest sannsynlig? Maximum Likelihood på treningsdata ˆ C( s, o) Ps m m C( o) her er C(s m, o) antall forekomster av objekter o i klassen s m Eksempel 855 positive og 1045 negative anmeldelser Da er, 34

35 Naive Bayes (Bernoulli): Trening 2 Maximum Likelihood ˆ C( fi vi, Pf v s i i m C( s m s ) m ) Her er C(f i =v i, s m ) antall treningsobjekter v hvor objektet v tilhører klassen s m og trekket f i har verdien v i C(s m ) antall objekter i klassen s m Dette er standardmetode for Naïve Bayes, Også kalt Bernoullii-varianten (0/1, False/True) Brukes i NLTK J&M, 3.ed. presenterer en annen variant kalt Multinomial NB 35

36 I dag: Tekstklassfisering To eksempler fra NLTK: Navn Filmanmeldelser, sentiment analysis Eksperimentering Evaluering Naive Bayes, hovedprinsipper Litt om sentiment analysis 36

37 Negasjon This isn t a bad film I quite enjoied it. Nobody could dislike this film. Det som er innenfor en negasjon spiller ikke samme rolle som ellers. Ideelt: Finne alle negerende uttrykk (not, isn t, nothing, ) Finne deres rekkevidde J&M: frem til nærmeste skilletegn Finne ut hva vi skal gjøre med dem J&M: lage nye ord: NOT_bad, NOT_film, NOT_dislike 37

38 (Spesielt for film He plays a boring professor Følger ikke at filmen er boring abberline, a widower, has prophetic dreams he unsuccessfully tries to quell with copious amounts of absinthe and opium. Følger ikke at filmen unsuccessfully Viser noe av utilstrekkeligheten med ordbaserte metoder.) 38

39 Sentiment -leksikon Med lite treningsdata kan det være hjelp i et sentiment -leksikon: lister med positivt og negativt ladete ord. NLTK (Hu and Liu s opinion lexicon ): from nltk.corpus import opinion_lexicon opinion_lexicon.words() opinion_lexicon.positive() opinion_lexicon.negative() Hvordan kan vi bruke dette? 39

40 Om to uker, 8.5 Mer om Naive Bayes Flere eksempler på bruk 40

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning INF2820 Datalingvistikk V2018 10. Gang, del 2 19.3 Jan Tore Lønning TEKSTKLASSIFISERING 2 I dag: tekstklassifisering Tekstklassifisering og maskinlæring Eksempel: NLTK "Names" Ekseperimentelt oppsett 1

Detaljer

Informasjonsgjenfinning

Informasjonsgjenfinning INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 18. september Outline 1 Hva er IR? Tradisjonell evaluering Invertert indeks 2 Rangering Evaluering av rangering 3 Grunnleggende egenskaper Vektorer

Detaljer

IN2110 Obligatorisk innlevering 1a

IN2110 Obligatorisk innlevering 1a IN2110 Obligatorisk innlevering 1a Oppsett Leveres innen fredag 15. februar kl. 23.59 i Devilry. For IN2110 har vi laget et utviklingsmiljø for Python som inneholder programvare og data for de obligatoriske

Detaljer

1. Explain the language model, what are the weaknesses and strengths of this model?

1. Explain the language model, what are the weaknesses and strengths of this model? Øving 2 Task 1 Language Model 1. Explain the language model, what are the weaknesses and strengths of this model? En language model er en model som brukes til å forenkle spørringer etter ord i dokumenter.

Detaljer

Dokument-embeddings / Markov-kjeder. Fredrik Jørgensen, Schibsted Media/UiO

Dokument-embeddings / Markov-kjeder. Fredrik Jørgensen, Schibsted Media/UiO Dokument-embeddings / Fredrik Jørgensen, Schibsted Media/UiO Oversikt 1. 2. Dokument-embeddings: Repetisjon + ord => dokumenter Markovkjeder: Vi bygger en robot-journalist! 1. Dokument-embeddings Word2Vec:

Detaljer

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning INF2820 Datalingvistikk V2018 10. Gang 19.3 del 1 Jan Tore Lønning I dag: to deler A. Active chart-parsing Fortsatt fra sist B. Tekstklassifisering 2 CHART-PARSING 3 I dag chart-parsing Chart-parsing:

Detaljer

IN1140 H2018 gruppeoppgaver Sannsynlighet og språkmodeller

IN1140 H2018 gruppeoppgaver Sannsynlighet og språkmodeller IN1140 H2018 gruppeoppgaver Sannsynlighet og språkmodeller 1 Sannsynlighetsteori 1. I sannsynlighetsteori, hva er: (a) Utfallsrommet (b) Betinget sannsynlighet (c) Hendelse (d) Uavhengige hendelser (e)

Detaljer

Mer om WSD Ordlikhet. Ordlikhet INF5820 H2008. Jan Tore Lønning. Institutt for Informatikk Universitetet i Oslo. 17. september

Mer om WSD Ordlikhet. Ordlikhet INF5820 H2008. Jan Tore Lønning. Institutt for Informatikk Universitetet i Oslo. 17. september INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 17. september Outline 1 Utfyllende om glatting Andre WSD-metoder Bootstrapping 2 Samforekomstvektor Kontekstassosiasjon Vektorlikhet Glatting

Detaljer

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning INF2820 Datalingvistikk V2016 10. Gang 30.3 Jan Tore Lønning I dag Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj

Detaljer

IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser

IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser 1 NLTK og språkmodeller Målet med denne oppgaven er å programmere to språkmodeller (en unigrammodell og trigrammodell) ved hjelp av Python s Natural

Detaljer

Generalisering til mange klasser - feilrettingsmetodene

Generalisering til mange klasser - feilrettingsmetodene Mange klasser Generalisering til mange klasser - feilrettingsmetodene Kesslers konstruksjon - omskriving av c-klasseproblemet til et toklasseproblem. Her innføres en sammensatt vektvektor a og et sett

Detaljer

Oppgave 1 (samlet 15%)

Oppgave 1 (samlet 15%) 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk Utgave 3: Kap. 3

TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk Utgave 3: Kap. 3 1 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk Utgave 3: Kap. 3 Terje Rydland - IDI/NTNU 2 if (be): else (not_to_be): 3 Læringsmål og pensum

Detaljer

if (be): else (not_to_be): TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk Utgave 3: Kap.

if (be): else (not_to_be): TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk Utgave 3: Kap. 1 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk Utgave 3: Kap. 3 Terje Rydland - IDI/NTNU 2 if (be): else (not_to_be): 3 Læringsmål og pensum

Detaljer

Sentimentanalyse for norsk tekst NRK

Sentimentanalyse for norsk tekst NRK Sentimentanalyse for norsk tekst SANT @ NRK Erik Velldal og Lilja Øvrelid Institutt for informatikk, Universitetet i Oslo 29. november 2017 Language Technology Group (LTG) 2 Språkteknologigruppa, Institutt

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 11. gang, 27.3.2014 Jan Tore Lønning I dag Repetere en del begreper: Trekkstrukturer Unifikasjon og subsumpsjon Trekkbaserte grammatikker Form: to alternative format Tolkning

Detaljer

IN1000 Obligatorisk innlevering 7

IN1000 Obligatorisk innlevering 7 IN1000 Obligatorisk innlevering 7 Frist for innlevering: 23.10. kl 12:00 Introduksjon I denne innleveringen skal du lage et program som simulerer cellers liv og død. Dette skal du gjøre ved hjelp av en

Detaljer

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning INF5820 Natural Language Processing - NLP H2009 jtl@ifi.uio.no HMM Tagging INF5830 Lecture 3 Sep. 7 2009 Today More simple statistics, J&M sec 4.2: Product rule, Chain rule Notation, Stochastic variable

Detaljer

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver INF2820 V2017 Oppgavesett 5 arbeidsoppgaver Dette er oppgaver du kan arbeide med på egen hånd. Du kan også arbeide med dem i gruppa 28.2 (hvis du har innleveringsoppgave 2 under kontroll) og spørre gruppelæreren

Detaljer

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

INF2820 V2017 Oppgavesett 5 Gruppe 21.2 INF2820 V2017 Oppgavesett 5 Gruppe 21.2 Denne uka er det først noen teoretiske oppgaver. Deretter er det en del praktiske arbeidsoppgaver som vil forberede deg til arbeidet med innleveringsoppgavesett

Detaljer

INF Notater. Veronika Heimsbakk 10. juni 2012

INF Notater. Veronika Heimsbakk 10. juni 2012 INF1010 - Notater Veronika Heimsbakk veronahe@student.matnat.uio.no 10. juni 2012 1 Tilgangsnivåer 2 CompareTo Modifier Class Package Subclass World public Y Y Y Y protected Y Y Y N no modifier Y Y N N

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 13. gang, 10.4.2014 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

TDT4110 Informasjonsteknologi grunnkurs: Tema: Mer om strenger. - 3rd edition: Kapittel 8. Professor Alf Inge Wang

TDT4110 Informasjonsteknologi grunnkurs: Tema: Mer om strenger. - 3rd edition: Kapittel 8. Professor Alf Inge Wang 1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Mer om strenger - 3rd edition: Kapittel 8 Professor Alf Inge Wang 2 Læringsmål og pensum Mål Lære om Pensum Grunnleggende operasjoner på strenger Å skive/slice

Detaljer

INF 2820 V2018: Innleveringsoppgave 1

INF 2820 V2018: Innleveringsoppgave 1 INF 2820 V2018: Innleveringsoppgave 1 Besvarelsene skal leveres i devilry innen fredag 9.2 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil

Detaljer

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 23.3 Jan Tore Lønning INF2820 Datalingvistikk V2015 10. Gang 23.3 Jan Tore Lønning I dag Trekkbaserte grammatikker, delvis repetisjon Formelle egenskaper: Alternative format for slike grammatikker Tolkning av grammatikkreglene

Detaljer

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning INF2820 Datalingvistikk V2017 9. Gang 13.3 Jan Tore Lønning I dag chart-parsing Fortsatt fra sist: Chart-parsing: hovedideer BU chart-parsing: algoritmen NLTKs ChartParser Enkel Python-implementasjon av

Detaljer

INF1010, 21. februar Om å gå gjennom egne beholdere (iteratorer) Stein Gjessing Inst. for Informatikk Universitetet i Oslo

INF1010, 21. februar Om å gå gjennom egne beholdere (iteratorer) Stein Gjessing Inst. for Informatikk Universitetet i Oslo INF1010, 21. februar 2013 Om å gå gjennom egne beholdere (iteratorer) Stein Gjessing Inst. for Informatikk Universitetet i Oslo Ikke noe nytt her From the Java language specification (version 6): 14.14.2

Detaljer

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo

HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell

Detaljer

Med løkke: Læringsmål og pensum. TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker/Sløyfer Utgave 3: Kap. 4 Utgave 2: Kap. 5. Mål.

Med løkke: Læringsmål og pensum. TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker/Sløyfer Utgave 3: Kap. 4 Utgave 2: Kap. 5. Mål. 1 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker/Sløyfer Utgave 3: Kap. 4 Utgave 2: Kap. 5 Terje Rydland - IDI/NTNU 2 Læringsmål og pensum Mål Lære om begrepet løkker

Detaljer

Eksamensoppgave i TDT4117 Informasjonsgjenfinning. LØSNINGFORSLAG/Sensurveiledning

Eksamensoppgave i TDT4117 Informasjonsgjenfinning. LØSNINGFORSLAG/Sensurveiledning Institutt for datateknikk og informasjonsvitenskap Side 1 av 5 Eksamensoppgave i TDT4117 Informasjonsgjenfinning LØSNINGFORSLAG/Sensurveiledning Faglig kontakt under eksamen: Heri Ramampiaro Tlf.: 73591459

Detaljer

Oppsummering fra sist

Oppsummering fra sist 1 av 34 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker/Sløyfer Utgave 3: Kap. 4 Terje Rydland - IDI/NTNU 2 av 34 Oppsummering fra sist Betingelser i Python: ,

Detaljer

Oppgave 1 (samlet 15%)

Oppgave 1 (samlet 15%) 2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne

Detaljer

Vi skal se på lambda-uttrykk. Følgende er definerte og vil bli brukt gjennom oppgaven

Vi skal se på lambda-uttrykk. Følgende er definerte og vil bli brukt gjennom oppgaven SLI 230 - side 2 av 8 EKSAMENSOPPGAVE - SLI 230 - VÅR 2000 Nedenfor følger eksamensoppgaver i SLI 230. Først om oppgavene Bakerst følger to sider med hjelp slik det er avtalt - liste over primitiver fra

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2014 8. gang, 6.3.2014 Jan Tore Lønning I dag Chart parsing Implementasjon CKY og Chart: Parsing vs anerkjenning 2 Chart alternativ datastruktur (S, [0, 1]) (VP, [0,1]) (Det, [1,2])

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen i: ECON20/420 Matematikk 2: Matematisk analyse og lineær algebra Exam: ECON20/420 Mathematics 2: Calculus and Linear Algebra Eksamensdag: Fredag 2. mai

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen

Detaljer

Læringsmål og pensum. if (be): else (not_to_be):

Læringsmål og pensum. if (be): else (not_to_be): 1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk - 3rd edition: Kapittel 3 Professor Alf Inge Wang 2 if (be): else (not_to_be): 3 Læringsmål og pensum Mål Lære å bruke og

Detaljer

INF Logikk og analysemetoder Forslag til løsning på oppgave fra læreboken

INF Logikk og analysemetoder Forslag til løsning på oppgave fra læreboken INF4170 - Logikk og analysemetoder Forslag til løsning på oppgave 3.2.1 fra læreboken Joakim Hjertås, joakimh@ifi.uio.no 7. mars 2004 Sammendrag Disse sidene kommer med forslag til løsning på oppgave 3.2.1

Detaljer

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning INF2820 Datalingvistikk V2015 6. Gang - 23.2 Jan Tore Lønning PARSING DEL 1 2 I dag Høyre- og venstreavledninger Recursive-descent parser (top-down) Begynne Shift-reduce parser (bottom-up) 25. februar

Detaljer

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning INF2820 Datalingvistikk V2015 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 26. januar 2015 2 ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 26. januar 2015

Detaljer

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning INF2820 Datalingvistikk V2015 14. Gang 4.5 Jan Tore Lønning CHART PARSING 2 I dag Svakheter ved tidligere parsere RD og SR: ineffektivitet CKY: CNF Chart parsing,,dotted items og fundamentalregelen Algoritmer:

Detaljer

EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (BOKMÅL) SENSURVEILEDNING

EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (BOKMÅL) SENSURVEILEDNING Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (BOKMÅL) SENSURVEILEDNING Faglig kontakt under eksamen:

Detaljer

Python: Løkker. TDT4110 IT Grunnkurs Professor Guttorm Sindre

Python: Løkker. TDT4110 IT Grunnkurs Professor Guttorm Sindre Python: Løkker TDT4110 IT Grunnkurs Professor Guttorm Sindre Læringsmål og pensum Mål Forstå hvorfor vi trenger løkker i programmering Ha kjennskap to ulike typer løkker (while-løkke, for-løkke) Og vite

Detaljer

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning INF2820 Datalingvistikk V2016 Jan Tore Lønning I dag Automater og regulære uttrykk Litt Python Implementasjon av DFA i Python Naiv NFA-algoritme Smart NFA-algoritme Pythonimplementasjon av smart NFA 1.

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning LITT PYTHON 2 Hvorfor Pyhton NLTK Natural Language Tool Kit: Omgivelser for å eksperimentere med datalingvistikk Diverse datalingvistiske algoritmer Inkluderte

Detaljer

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj

Detaljer

Object interaction. Innhold. Abstraksjon 03.09.2007. Grunnleggende programmering i Java Monica Strand 3. september 2007.

Object interaction. Innhold. Abstraksjon 03.09.2007. Grunnleggende programmering i Java Monica Strand 3. september 2007. Object interaction Grunnleggende programmering i Java Monica Strand 3. september 2007 1 Innhold Til nå: Hva objekter er og hvordan de implementeres I klassedefinisjonene: klassevariable (fields), konstruktører

Detaljer

AlgDat - Øvingsforelesning 1 Introduksjon til Python, lenkede lister og øving 1

AlgDat - Øvingsforelesning 1 Introduksjon til Python, lenkede lister og øving 1 AlgDat - Øvingsforelesning 1 Introduksjon til Python, lenkede lister og øving 1 Ole Kristian Pedersen, Høst 2016 Agenda Introduksjon til Python for begynnere Intro til øving 1 Litt om lenkede lister Øvingssystemet

Detaljer

IN1140, H2018 gruppetime oppgaver Introduksjon til Tekst i Python

IN1140, H2018 gruppetime oppgaver Introduksjon til Tekst i Python IN1140, H2018 gruppetime oppgaver Introduksjon til Tekst i Python I disse oppgavene skal vi introdusere Python, og vise hvordan vi kan jobbe med tekst i Python. Vi skal se på hva et programmeringsspråk

Detaljer

TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk. - 3rd edition: Kapittel 3. Professor Alf Inge Wang

TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk. - 3rd edition: Kapittel 3. Professor Alf Inge Wang 1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Betingelser og logiske uttrykk - 3rd edition: Kapittel 3 Professor Alf Inge Wang 2 if (be): else (not_to_be): 3 Læringsmål og pensum Mål Lære å bruke og

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2012 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 17. januar 2012 2 Naturlige språk En mann kjøpte en bil av en mann som hadde

Detaljer

1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2

1/31/2011 SAMMENHENGER FSA OG REGULÆRE UTTRYKK. Regulære språk. Fra FSA til RE. Fra regulært uttrykk til NFA REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 Regulære språk Følgende er ekvivalente: a) L kan

Detaljer

pnvdb Documentation Release Jan Tore Kyrdalen

pnvdb Documentation Release Jan Tore Kyrdalen pnvdb Documentation Release 0.1.0 Jan Tore Kyrdalen Oct 31, 2017 Contents 1 Installation 3 2 Getting started 5 3 Methods 7 3.1 status................................................... 7 3.2 objekt...................................................

Detaljer

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 31. januar 2011 2 SAMMENHENGER FSA OG REGULÆRE UTTRYKK 31. januar

Detaljer

3/5/2012. Chart alternativ datastruktur. Fundamentalregelen. Chart-parsing. Bottom-up FORMELL SPRÅKTEORI. Jan Tore Lønning

3/5/2012. Chart alternativ datastruktur. Fundamentalregelen. Chart-parsing. Bottom-up FORMELL SPRÅKTEORI. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning CHART-PARSING FORMELL SPRÅKTEORI 5. mars 2012 2 Chart alternativ datastruktur NP Det Nom Fundamentalregelen NP Det Nom Nom Nom PP Nom Nom PP NP PP P NP Det

Detaljer

Eksamen - INF 283 Maskinlæring

Eksamen - INF 283 Maskinlæring Eksamen - INF 283 Maskinlæring 23 feb. 2016 Tid: 3 timer Eksamen inneholder 15 oppgaver, som vil bli vektet likt ved evaluering. 1 Table 1 attributt antall personer forsørget av låntaker månedlig inntekt

Detaljer

a) Ved numerisk metode er det løst en differensiallikning av et objekt som faller mot jorden. Da, kan vi vi finne en tilnærming av akselerasjonen.

a) Ved numerisk metode er det løst en differensiallikning av et objekt som faller mot jorden. Da, kan vi vi finne en tilnærming av akselerasjonen. Oppgave 1 a) Ved numerisk metode er det løst en differensiallikning av et objekt som faller mot jorden. Da verdier av er kjent gjennom resultater i form av,, kan vi vi finne en tilnærming av akselerasjonen.

Detaljer

EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING

EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING Faglig kontakt under eksamen: Heri Ramampiaro Tlf.:

Detaljer

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning INF2820 Datalingvistikk V2016 Jan Tore Lønning ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 3. februar 2016 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En innretning som

Detaljer

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning INF2820 Datalingvistikk V2016 Jan Tore Lønning ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 25. januar 2016 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En innretning som

Detaljer

Quantitative methods in CompSci. Some observations from being a reviewer and an author

Quantitative methods in CompSci. Some observations from being a reviewer and an author + Quantitative methods in CompSci Some observations from being a reviewer and an author + You and your reader(s?) n Why do you want to write something? n You ve been told to n Show you are clever n etc

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning CHART-PARSING FORMELL SPRÅKTEORI 5. mars 2012 2 Chart alternativ datastruktur NP Det Nom Nom Nom PP NP PP P NP Det Nom, N P NP, PN 0 book 1 the 2 flight 3

Detaljer

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen The Process Goal Definition Data Collection Data Preprocessing EDA Choice of Variables Choice of Method(s) Performance Evaluation

Detaljer

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning INF2820 Datalingvistikk V2016 13. gang, 20.4.2016 Jan Tore Lønning I dag Introduksjon til semantikk Formell semantikk grunnideene Logikk i NLTK 2 Semantikk Semantikk= studiet av mening Lingvistisk semantikk

Detaljer

TDT4110 Informasjonsteknologi grunnkurs: Tema: Mer om strenger Utgave 3: Kap. 8

TDT4110 Informasjonsteknologi grunnkurs: Tema: Mer om strenger Utgave 3: Kap. 8 1 Kunnskap for en bedre verden TDT4110 Informasjonsteknologi grunnkurs: Tema: Mer om strenger Utgave 3: Kap. 8 Terje Rydland - IDI/NTNU 2 Læringsmål og pensum Mål Lære om Slicing av lister 2-dimensjonale

Detaljer

INF2820 Datalingvistikk V2012

INF2820 Datalingvistikk V2012 INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 24. februar 2012 2 1 I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Parsing: ovenifra og ned

Detaljer

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 23. februar 2012 2 I dag Kontekstfrie grammatikker, avledninger og trær (delvis repetisjon) Parsing: ovenifra og ned

Detaljer

Ma Linær Algebra og Geometri Øving 1

Ma Linær Algebra og Geometri Øving 1 Ma0 - Linær Algebra og Geometri Øving Øistein Søvik 0. september 0 Excercise Set. = 4 x6 x x = x 6 4 x x = x 4 4 4 x x. In each part, determine whether the equation is linear in x, x and x Før vi begynner

Detaljer

American Week/Day trinn. Tid: 5 10 timer

American Week/Day trinn. Tid: 5 10 timer American Week/Day 5. 7. trinn Tid: 5 10 timer Antrekk For å markere at det er American Week kan elevene og lærerne kle seg i klær som viser tydelig at noe amerikansk foregår. Et forslag er at alle kler

Detaljer

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper. INF2820 Datalingvistikk V2012 Jan Tore Lønning LITT PYTHON 2 Hvorfor Pyhton Python syntaks NLTK Natural Language Tool Kit: Omgivelser for å eksperimentere med datalingvistikk Diverse datalingvistiske algoritmer

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen i: ECON3120/4120 Mathematics 2: Calculus an linear algebra Exam: ECON3120/4120 Mathematics 2: Calculus an linear algebra Eksamensag: Tirsag 3. juni 2008

Detaljer

Fakultet for informasjonsteknologi,

Fakultet for informasjonsteknologi, NTNU Norges teknisk-naturvitenskapelige universitet Fakultet for informasjonsteknologi, matematikk og elektroteknikk Institutt for datateknikk og informasjonsvitenskap Faglig kontakt under eksamen: Institutt

Detaljer

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning INF2820 Datalingvistikk V2012 Jan Tore Lønning KONTEKSTFRIE GRAMMATIKKER OG PARSING 24. februar 2012 2 Context-Free Grammars Det mest sentrale verktøyet i datalingvistikk 24. februar 2012 3 2/24/2012 Speech

Detaljer

Ta kontakt i pausen. Viktig at vi kommer i gang med dette arbeidet!

Ta kontakt i pausen. Viktig at vi kommer i gang med dette arbeidet! 1 Kunnskap for en bedre verden TDT4105 Informasjonsteknologi, grunnkurs Mer om funksjoner. Logiske betingelser og betinget programutførelse (valg). Amanuensis Terje Rydland Kontor: ITV-021 i IT-bygget

Detaljer

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning INF2820 Datalingvistikk V2016 11. Gang 6.4 Jan Tore Lønning Sist Med anbefalt lesing og rekkefølge Grammatiske trekk («features») NLTK boka, seksj 9.1 Trekkstrukturer («feature structures») J&M, seksj

Detaljer

IN2010: Algoritmer og Datastrukturer Series 2

IN2010: Algoritmer og Datastrukturer Series 2 Universitetet i Oslo Institutt for Informatikk S.M. Storleer, S. Kittilsen IN2010: Algoritmer og Datastrukturer Series 2 Tema: Grafteori 1 Publisert: 02. 09. 2019 Utvalgte løsningsforslag Oppgave 1 (Fra

Detaljer

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning INF2820 Datalingvistikk V2015 11. Gang 13.4 Jan Tore Lønning I dag Unifikasjonsgrammatikker Repetisjon og overblikk: Formalisme Lingvistisk anvendelse Utvidelse av lingvistisk anvendelse NLTKs implementering

Detaljer

INF5820 H gang, 19.9 Ordmeningsentydiggjøring Word Sense Disambiguation (WSD)

INF5820 H gang, 19.9 Ordmeningsentydiggjøring Word Sense Disambiguation (WSD) INF5820 H2010 4.gang, 19.9 Ordmeningsentydiggjøring Word Sense Disambiguation (WSD) Word Net: Noun S: (n) bass (the lowest part of the musical range) S: (n) bass, bass part (the lowest part in polyphonic

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Lilja Øvrelid 27 februar, 2017 1 Sannsynlighet Sannsynlighet spiller en svært viktig rolle i språkteknologi... og også i dette

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i Eksamensdag: 12. desember 2008 Tid for eksamen: 9.00 12.00 Oppgavesettet er på 7 sider. Vedlegg: Tillatte hjelpemidler: INF2220

Detaljer

INF1800 Forelesning 4

INF1800 Forelesning 4 INF1800 Forelesning 4 Utsagnslogikk Roger Antonsen - 27. august 2008 (Sist oppdatert: 2008-09-03 12:39) Før vi begynner Praktiske opplysninger Kursets hjemmeside blir stadig oppdatert: http://www.uio.no/studier/emner/matnat/ifi/inf1800/

Detaljer

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Lilja Øvrelid 27 februar, 2017 1 Sannsynlighet Sannsynlighet spiller en svært viktig rolle i språkteknologi... og også i dette

Detaljer

EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (SENSURVEILEDNING)

EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (SENSURVEILEDNING) Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (SENSURVEILEDNING) Faglig kontakt under eksamen:

Detaljer

Kenneth Torstveit, løsningsarkitekt EVRY 01.04.2014. P7 - Browser for HR

Kenneth Torstveit, løsningsarkitekt EVRY 01.04.2014. P7 - Browser for HR Kenneth Torstveit, løsningsarkitekt EVRY 01.04.2014 P7 - Browser for HR Agenda Lær mer om ny funksjonalitet Browser-maler Avansert oppsett Gode tips og kjøreregler for å hente ut styringsinformasjon Browser

Detaljer

INF2810: Funksjonell Programmering. Dataabstraksjon og Trerekursjon

INF2810: Funksjonell Programmering. Dataabstraksjon og Trerekursjon INF2810: Funksjonell Programmering Dataabstraksjon og Trerekursjon Stephan Oepen & Erik Velldal Universitetet i Oslo 15. februar, 2013 Tema 2 Forrige uke Høyere-ordens prosedyrer: Prosedyrer som argumenter

Detaljer

Læringsmål og pensum. Intro løkker. Mål Lære om begrepet løkker Lære om bruk av while-løkke Lære om bruk av for-løkke Pensum. Kapittel 4.

Læringsmål og pensum. Intro løkker. Mål Lære om begrepet løkker Lære om bruk av while-løkke Lære om bruk av for-løkke Pensum. Kapittel 4. 1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker - 3rd edition: Kapittel 4 Professor Alf Inge Wang 2 Læringsmål og pensum Mål Lære om begrepet løkker Lære om bruk av while-løkke Lære om bruk av

Detaljer

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen

3/8/2011. I dag. Dynamic Programming. Example. Example FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) Jan Tore Lønning & Stephan Oepen INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen

Detaljer

INF1800 LOGIKK OG BEREGNBARHET

INF1800 LOGIKK OG BEREGNBARHET INF1800 LOGIKK OG BEREGNBARHET FORELESNING 4: UTSAGNSLOGIKK Roger Antonsen Institutt for informatikk Universitetet i Oslo 27. august 2008 (Sist oppdatert: 2008-09-03 12:39) Før vi begynner Praktiske opplysninger

Detaljer

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning INF2820 Datalingvistikk V2015 Jan Tore Lønning Idag Automater og regulære uttrykk Litt Python Implementasjon av DFA i Python Naiv NFA-algoritme Smart NFA-algoritme Pythonimplementasjon 30. januar 2015

Detaljer

TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker. - 3rd edition: Kapittel 4. Professor Alf Inge Wang

TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker. - 3rd edition: Kapittel 4. Professor Alf Inge Wang 1 TDT4110 Informasjonsteknologi grunnkurs: Tema: Løkker - 3rd edition: Kapittel 4 Professor Alf Inge Wang 2 Læringsmål og pensum Mål Lære om begrepet løkker Lære om bruk av while-løkke Lære om bruk av

Detaljer

INF2820 Datalingvistikk V Gang 26.2 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 26.2 Jan Tore Lønning INF2820 Datalingvistikk V2018 7. Gang 26.2 Jan Tore Lønning I dag Fra sist: Høyre- og venstreavledninger Recursive-descent parser (top-down) Shift-reduce parser (bottom-up) Pythonimplementasjon: Shift-Reduce

Detaljer

Python: Strenger 3. utgave: Kapittel 8

Python: Strenger 3. utgave: Kapittel 8 Python: Strenger 3. utgave: Kapittel 8 TDT4110 IT Grunnkurs Professor Guttorm Sindre Læringsmål og pensum Mål Forstå Hva strenger er Grunnleggende operasjoner på strenger Indeksering av tegn i strenger,

Detaljer

Øvingsforelesning 1 Python (TDT4110)

Øvingsforelesning 1 Python (TDT4110) Øvingsforelesning 1 Python (TDT4110) Introduksjon, Kalkulasjoner Ole-Magnus Pedersen Oversikt Praktisk Info Repetisjon fra sist Oppgaver for øving 2 2 Praktisk Info Last opp øvinger på Blackboard før godkjenning

Detaljer

TDT4105 Informasjonsteknologi, grunnkurs. Matlab 5: Løkker (FOR og WHILE) Matlab 6: Problemløsning / Algoritmer

TDT4105 Informasjonsteknologi, grunnkurs. Matlab 5: Løkker (FOR og WHILE) Matlab 6: Problemløsning / Algoritmer 1 TDT4105 Informasjonsteknologi, grunnkurs Matlab 5: Løkker (FOR og WHILE) Matlab 6: Problemløsning / Algoritmer Rune Sætre (satre@idi.ntnu.no) Anders Christensen (anders@idi.ntnu.no) TDT4105 IT Grunnkurs

Detaljer

Python: Valg og betingelser. TDT4110 IT Grunnkurs Professor Guttorm Sindre

Python: Valg og betingelser. TDT4110 IT Grunnkurs Professor Guttorm Sindre Python: Valg og betingelser TDT4110 IT Grunnkurs Professor Guttorm Sindre Læringsmål og pensum Mål Kunne forstå og bruke if-setninger sammenlikning av strenger nøstede beslutningsstrukturer betingelser

Detaljer

INF2820 Datalingvistikk V forelesning, 30.1 Jan Tore Lønning

INF2820 Datalingvistikk V forelesning, 30.1 Jan Tore Lønning INF2820 Datalingvistikk V2014 3. forelesning, 30.1 Jan Tore Lønning Idag Noen ord om Python Implementasjon av DFA J&Ms algoritme Oversatt til Python Rekursiv vs. Iterativ implementasjon Naiv NFA-algoritme

Detaljer

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsing algoritmen Algoritmen uttrykt

Detaljer

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

INF 2820 V2015: Obligatorisk innleveringsoppgave 3 INF 2820 V2015: Obligatorisk innleveringsoppgave 3 Besvarelsene skal leveres i devilry innen fredag 17.4 kl 18.00 Filene det vises til finner du i o /projects/nlp/inf2820/cfg Del 1 RD Parsing Oppgave 1:

Detaljer

Summer Cup. 27-29 June 2014. Uken før vi reiser, vil vi trene her hjemme. Nærmere informasjon om dette kommer senere.

Summer Cup. 27-29 June 2014. Uken før vi reiser, vil vi trene her hjemme. Nærmere informasjon om dette kommer senere. Summer Cup 27-29 June 2014 Vestkantsvømmerne inviterer alle i B- gruppen og C+ (hospitanter i B gruppen) til Stevne i Stockholm. Vi skal bo på Zinkensdamm vandrehjem, og stevne foregår i Erisdalsbadet

Detaljer

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning INF2820 Datalingvistikk V2016 8. Gang 9.3 Jan Tore Lønning CHART-PARSING 2 I dag Bakgrunn Svakheter med andre parsere CKY og Chart Chart-parsing: hovedideer BU chart-parsingalgoritmen Algoritmen uttrykt

Detaljer