INF1820 INF Arne Skjærholt INF1820. Arne Skjærholt
|
|
- Margrethe Engen
- 6 år siden
- Visninger:
Transkript
1 Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon
2 Previously... Alle rare ordene Alle rare morfene Previously...
3 Coming up... Morfologi med datamaskin (computational morphology) Hvordan analysere ord? Hvordan generere ord? Coming up...
4 Noen bruksområder Analyse: Parsing: Samsvar mellom verb og subjekt, substatntiv og adjektiv... Informasjonsgjenfinning ( Information Retrieval /IR): Hva er stammen til et ord? Maskinoversettelse: Hvilken ordform er dette? Generering: Maskinoversettelse: Generere riktig form i målspråket. Språklæringsapplikasjon: Generere former som må analyseres. Text-to-Speech Noen bruksområder
5 murer mure+verb+pres murer murer+subst+m+ent+ubest murer mur+subst+m+flt+best Det er mye informasjon i et ord. Spørsmålet er hvordan vi skal hente ut og representere informasjonen. Fra disse eksemplene kan de se ganske enkelt ut. Men når vi går i detalj blir det straks mer innviklet. murer mure+verb+pres murer murer+subst+m+ent+ubest murer mur+subst+m+flt+best
6 bever/bevrene en: stop/stopping være/er/var bever/bevrene en: stop/stopping være/er/var
7 være+verb+pret var bil+subst+m+ent+best bilen bok+subst+mf+ent+best boka boken Det er ofte også ønskelig å kunne generere en gitt form av et ord. Dette kalles som regel syntese. Spørsmålet er hvordan vi får til dette, helt konkret. For å få det til trenger vi to hoveddeler: Data og regler, som er språkspesifikke, og formalismen som er teoriavhengig, men uavhengig av språk. være+verb+pret var bil+subst+m+ent+best bilen bok+subst+mf+ent+best boka boken Formalismen er Finite State Transducere, men før vi kommer så langt, repeterer vi litt...
8 Transducere Språk L over alfabet Σ For to uker siden så vi på formell språkteori, og regulære språk. Språket er en mengde, og mengden er en delmengde av alle mulige strenger vi kan lage med bokstaver fra alfabetet. Språk L over alfabet Σ
9 Transducere A regulært Ā regulært A B regulært A B regulært A B regulært A B regulært A regulært Regulære språk har en del egenskaper som gjør at de er veldig greie å jobbe med. Ā regulært A B regulært A B regulært A B regulært A B regulært
10 Transducere Σ,S,s 0,δ,F q 2 b q a 0 q 1 c q 3 Σ,S,s 0,δ,F Dette er definisjonen av en FSA, som vi kjenner fra før. Tenkepause: Hva er Σ, S, s 0, F, og δ (transisjonstabellen). q a 0 q 1 b c q 2 q 3
11 Transducere Regulær relasjon En relasjon R sier at et element fra én mengde står i et eller annet forhold til et element fra en annen mengde. For eksempel er sammenlingningsoperatorene eksempler på relasjoner. En regulær relasjon er en relasjon mellom to regulære språk. Det vil si at vi antar at alle gyldige ordformer i et språk kan beskrives som et endelig språk, og likeledes kan de morfologiske beskrivelsene ses på som et regulært språk. Relasjonen knytter da hver ordform i språket til de riktige morfologiske analysene. Regulær relasjon
12 Transducere S,Σ,Γ,δ,s 0,F På samme måte som vi kan gjenkjenne regulære språk med FSAer kan vi bruke FSTer for å finne de relaterte ordene gitt et ord fra det ene språket. S,Σ,Γ,δ,s 0,F Definisjonen er i grunnen den samme som for en FSA, men med noen forskjeller: Σ er inputalfabetet og Γ er outputalfabetet, og δ er en funksjon som for input-tilstandparet gir en mengde output-tilstandpar.
13 Transducere S,Σ,Γ,δ,s 0,F c:k h:a a:t t q 0 q 1 q 2 q 3 q 4 På samme måte som vi kan gjenkjenne regulære språk med FSAer kan vi bruke FSTer for å finne de relaterte ordene gitt et ord fra det ene språket. Definisjonen er i grunnen den samme som for en FSA, men med noen forskjeller: Σ er inputalfabetet og Γ er outputalfabetet, og δ er en funksjon som for input-tilstandparet gir en mengde output-tilstandpar. S,Σ,Γ,δ,s 0,F q c:k 0 q h:a 1 q a:t 2 q t 3 q 4
14 Transducere A regulær relasjon A 1 regulær relasjon A B regulær relasjon A B regulær relasjon A B regulær relasjon A 1 er inversrelasjonen, det vil si at hvis vi har en FST som analyserer norske ord kan vi automatisk lage en automat som tar analyser og spytter ut gyldige ord. Det er veldig praktisk. A B er relasjonen fra input av A til output av B; det vil si, ta output fra A og mat den inn i B. Dette er nyttig siden vi kan dele opp morfologianalysen i flere mindre oppgaver. Først lager vi en maskin som tar analyser og erstatter de morfologiske trekkene med morfemer (bever+subst+m+flt+ubest bever-er) og en annen maskin som tar seg av rettskrivingsregler (bever-er bevre/bevere). A regulær relasjon A 1 regulær relasjon A B regulær relasjon A B regulær relasjon A B regulær relasjon Til gjengjeld er det noen tillukningsegenskaper som ikke holder (og som kan være slitsomt), men i praksis går det greit.
15 Transducere A regulær relasjon A 1 regulær relasjon A B regulær relasjon A B regulær relasjon A B regulær relasjon Ā ikke en regulær relasjon A B ikke en regulær relasjon A B ikke en regulær relasjon A 1 er inversrelasjonen, det vil si at hvis vi har en FST som analyserer norske ord kan vi automatisk lage en automat som tar analyser og spytter ut gyldige ord. Det er veldig praktisk. A B er relasjonen fra input av A til output av B; det vil si, ta output fra A og mat den inn i B. Dette er nyttig siden vi kan dele opp morfologianalysen i flere mindre oppgaver. Først lager vi en maskin som tar analyser og erstatter de morfologiske trekkene med morfemer (bever+subst+m+flt+ubest bever-er) og en annen maskin som tar seg av rettskrivingsregler (bever-er bevre/bevere). A regulær relasjon A 1 regulær relasjon A B regulær relasjon A B regulær relasjon A B regulær relasjon Ā ikke en regulær relasjon A B ikke en regulær relasjon A B ikke en regulær relasjon Til gjengjeld er det noen tillukningsegenskaper som ikke holder (og som kan være slitsomt), men i praksis går det greit.
16 Indirekte oversettelse All problems in computer science can be solved by another level of indirection. David Wheeler All problems in computer science can be solved by another level of indirection. David Wheeler
17 Indirekte oversettelse Morfotaks er reglene for hvordan forskjellige morfemer kan kombineres. Det er nemlig ikke slik at alle morfemene kan kombineres fritt. Morfotaks Morfotaks Stjerne foran et eksempel angir at eksempelet er ugrammatisk.
18 Indirekte oversettelse Morfotaks er reglene for hvordan forskjellige morfemer kan kombineres. Det er nemlig ikke slik at alle morfemene kan kombineres fritt. Stjerne foran et eksempel angir at eksempelet er ugrammatisk. Morfotaks *bok-ere *gul-ene *spark-t Morfotaks *bok-ere *gul-ene *spark-t
19 Indirekte oversettelse Ortografi (gresk: rett (som i rett opp og ned, egentlig, men også riktig) skriving) er rettskriving. Ortografi Ortografi I det siste tilfellet står vi foran et valg. look/look-d og save/save-d eller look/look-ed og save/save-ed?
20 Indirekte oversettelse Ortografi (gresk: rett (som i rett opp og ned, egentlig, men også riktig) skriving) er rettskriving. Ortografi city/cities, bully/bullies,... stop/stopping, run/running,... look/looked, men save/saved. I det siste tilfellet står vi foran et valg. look/look-d og save/save-d eller look/look-ed og save/save-ed? Ortografi city/cities, bully/bullies,... stop/stopping, run/running,... look/looked, men save/saved.
21 Indirekte oversettelse Hva slags rettskrivingsregler trenger vi her? amo rego amas regis amat regit amamus regimus amatis regitis amant regunt amo rego amas regis amat regit amamus regimus amatis regitis amant regunt
22 Indirekte oversettelse Hva slags rettskrivingsregler trenger vi her? amo rego ama-o reg-o amas regis ama-s reg-s amat regit ama-t reg-t amamus regimus ama-mus reg-mus amatis regitis ama-tis reg-tis amant regunt ama-nt reg-nt amo rego ama-o reg-o amas regis ama-s reg-s amat regit ama-t reg-t amamus regimus ama-mus reg-mus amatis regitis ama-tis reg-tis amant regunt ama-nt reg-nt
23 Indirekte oversettelse Hva slags rettskrivingsregler trenger vi her? amo rego ama-o reg-o amas regis ama-s reg-s amat regit ama-t reg-t amamus regimus ama-mus reg-mus amatis regitis ama-tis reg-tis amant regunt ama-nt reg-nt a:0 <=> %-: [ o e ] ; %-:i <=> Cons [ s t m ] ; %-:u <=> Cons n ; amo rego ama-o reg-o amas regis ama-s reg-s amat regit ama-t reg-t amamus regimus ama-mus reg-mus amatis regitis ama-tis reg-tis amant regunt ama-nt reg-nt a:0 <=> %-: [ o e ] ; %-:i <=> Cons [ s t m ] ; %-:u <=> Cons n ;
24 Indirekte oversettelse Leksikonet spesifiseres som en del av morfotaksen, men de ortografiske reglene er mer uavhengige. Morfotaksen bygger opp en gyldig sekvens av morfemer, mens ortografien omformer morfemsekvensene til korrekte ord. Leksikon Morfotaks Ortografi Leksikon Morfotaks Ortografi
25 Indirekte oversettelse Flertydighet bukker substantiv eller verb? En murer murer murer Segmentering: brusautomat vinduene pilspiss FSTer kan ikke hjelpe oss med tvetydighetsproblemet. En FST vil gi alle mulige analyser for et ord, uten noen antydning om hva som antageligvis er riktig. En vei ut av dette problemet er HMMer, som vi kommer til om et par uker. Flertydighet bukker substantiv eller verb? En murer murer murer Segmentering: brusautomat vinduene pilspiss
26 Indirekte oversettelse Flertydighet bukker substantiv eller verb? En murer murer murer Segmentering: bru-sau-tomat vin-duene pils-piss FSTer kan ikke hjelpe oss med tvetydighetsproblemet. En FST vil gi alle mulige analyser for et ord, uten noen antydning om hva som antageligvis er riktig. En vei ut av dette problemet er HMMer, som vi kommer til om et par uker. Flertydighet bukker substantiv eller verb? En murer murer murer Segmentering: bru-sau-tomat vin-duene pils-piss
INF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational
DetaljerINF1820: Morfologi INF1820: Morfologi. Arne Skjærholt. 20. februar. INF1820: Morfologi. Arne Skjærholt. 20. februar
NF1820: NF1820: Arne Skjærholt 20. februar NF1820: Arne Skjærholt 20. februar NF1820: µορφή - form λόγος - lære er det laveste meningsbærende nivået i språk. Fonologi og fonetikk er lavere nivåer, men
DetaljerINF INF1820. Arne Skjærholt. Terza lezione INF1820. Arne Skjærholt. Terza lezione
Arne Skjærholt Terza lezione Arne Skjærholt Terza lezione Regulære uttrykk Regex Regulære uttrykk (regular expressions) er et godt eksempel på det som kalles finite-state methods (hvorfor det heter det
DetaljerINF1820: Oppsummering
Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerFølger Sipsers bok tett både i stoff og oppgaver.
1 - hrj 1 Følger Sipsers bok tett både i stoff og oppgaver. Tirsdag forelesninger, nytt stoff Onsdag eksempler og utfyllende stoff Torsdag oppgaver fra uka før Start: kapittel 1 (2uker), 2 (2uker),3 (2uker),4
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 22. januar 2015 2 ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 23. januar 2015
DetaljerSkanning del I. Kapittel 2 INF 3110/ INF
Skanning del I Kapittel 2 18.01.2013 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 20. januar 2012 2 Non-Determinism Speech and Language Processing - Jurafsky and Martin
DetaljerLF - Eksamen i INF1820
LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar
DetaljerAvgjørbarhet / Uavgjørbarhet
Avgjørbarhet / Uavgjørbarhet For å kunne snakke om avgjørbarhet/uavgjørbarhet trenger vi Turingmaskiner og for å snakke om Turingmaskiner trenger vi formelle språk, og strenger og alfabeter. Pluss litt
DetaljerSkanning del I INF /01/15 1
Skanning del I INF 5110-2015 21/01/15 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: Programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.
DetaljerIN2080. Oppgave 1. Oppgave 2. Eksamen. Vår Den nondeterministiske endelige automaten A er gitt ved (Q, Σ, δ, q 0, F ) der
IN2080 Eksamen Vår 2019 Oppgave 1 Den nondeterministiske endelige automaten A er gitt ved (Q, Σ, δ, q 0, F ) der Q = {q 0, q 1, q 2 } er mengden av tilstander Σ = {a, b} er inputalfabetet q 0 er starttilstanden
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 22. januar 2014 2 DFA deterministisk endelig maskin Q = {q0, q1, q2,, qn-1} Strengt
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen FORMELLE OG NATURLIGE SPRÅK KONTEKSTFRIE GRAMMATIKKER 7. februar 2011 2 Naturlige språk som formelle språk Et formelt språk består av: En
DetaljerINF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK 19. januar 2017 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En
DetaljerINF2820 Datalingvistikk V2016. Jan Tore Lønning
INF2820 Datalingvistikk V2016 Jan Tore Lønning ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 25. januar 2016 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En innretning som
DetaljerINF2820 Datalingvistikk V2016. Jan Tore Lønning
INF2820 Datalingvistikk V2016 Jan Tore Lønning ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 3. februar 2016 2 Fysisk modell En tape delt opp i ruter. I hver rute står det et symbol. En innretning som
DetaljerINF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning ENDELIGE TILSTANDSMASKINER OG REGULÆRE SPRÅK, DEL 2 19. januar 2017 2 Sist uke: FSA Brukes om hverandre: Finite state automaton - FSA
DetaljerINF2080 Logikk og beregninger
INF2080 Logikk og beregninger Forelesning 4: Regulære uttrykk Sist oppdatert: 2012-01-24 12:05 4.1 Regulære uttrykk Beskrive aksepterte ord 4.1 Regulære uttrykk Beskrive aksepterte ord INF2080 Logikk og
DetaljerTypisk: Kan det være både nøkkelord og navn, så skal det ansees som nøkkelord
Scanning-I Kap. 2 Hovedmål Gå ut fra en beskrivelse av de enkelte leksemer (tokens), og hvordan de skal deles opp i klasser Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med
DetaljerTypisk: Kan det være både nøkkelord og navn, så skal det ansees som nøkkelord
Scanning - I Kap. 2 Hovedmål Gå ut fra en beskrivelse av de enkelte tokens, og hvordan de skal deles opp i klasser Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med all nødvendig
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK DEL 2 26. januar 2015 2 ENDELIGE AUTOMATER «FINITE STATE AUTOMATA» (FSA) 26. januar 2015
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 19. januar 2014 2 Naturlige språk En mann kjøpte en bil av en mann som hadde eid bilen i
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 06 februar, 2012 OVERSIKT Finite-state -teknologi er kjapp og effektiv nyttig for et antall språkteknologiske
DetaljerScanning - I Kap. 2. Hva scanneren gjør
Scanning - I Kap. 2!! Hovedmål! Gå ut fra en beskrivelse av de enkelte tokens, og hvordan de skal deles opp i klasser! Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med all
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femte forelesning Arne Skjærholt 25 januar, 2012 MORFOLOGI µορφή (morph ē) - form λόγος (lógos) - lære MORFOLOGI µορφή (morph ē) - form λόγος
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 26. januar 2011 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerINF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция
Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #4
IN1140: Introduksjon til språkteknologi Forelesning #4 Samia Touileb Universitetet i Oslo 13. september 2018 Tema for i dag 2 Regulære uttrykk Endelige tilstandsmaskiner ( Finite State Automata, FSA) Definisjon
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv
DetaljerSlides til 12.1 Formelt språk og formell grammatikk
Slides til 12.1 Formelt språk og formell grammatikk Andreas Leopold Knutsen April 6, 2010 Introduksjon Grammatikk er studiet av reglene som gjelder i et språk. Syntaks er læren om hvordan ord settes sammen
DetaljerTEMA KOMPETANSEMÅL LÆRINGSMÅL INNHOLD METODE VURDERING
ÅRSPLAN I NORSK. FOR 5. TRINN 2014/2015 Utarbeidet av: Gro Anita S Arnesen verk: Zeppelin Lesebok (gul), Zeppelin Språkbok (blå) og arbeidsbøker til begge disse. UK E TEMA KOMPETANSEMÅL LÆRINGSMÅL INNHOLD
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2017 1 FS-metoder Oversikt Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv
DetaljerINF2820 Datalingvistikk V2016. Jan Tore Lønning
INF2820 Datalingvistikk V2016 Jan Tore Lønning INF2820 Datalingvistikk 20. januar 2016 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære språk OBS: Lov å
DetaljerTMA4140 Diskret Matematikk Høst 2016
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag TMA44 Diskret Matematikk Høst 26 Seksjon 3. Husk at w = λ, den tomme strengen, for enhver streng w. 4 a) Følgende utledning/derivasjon
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2012 Jan Tore Lønning & Stephan Oepen ENDELIGE TILSTANDSTEKNIKKER OG REGULÆRE UTTRYKK I DATALINGVISTIKK 17. januar 2012 2 Naturlige språk En mann kjøpte en bil av en mann som hadde
DetaljerMA3301 Beregnbarhets- og kompleksitetsteori Høsten
MA3301 Beregnbarhets- og kompleksitetsteori Høsten 2012 1 Notat 2 Om den kanoniske automaten til et språk og minimalisering. Vi vil si at en automat M = Q, Σ, q 0, A, δ er redusert enhver tilstand q Q
DetaljerUNIVERSITETET I OSLO
UIVERSITETET I OSLO et matematisk-naturvitskapelige fakultet Eksam i: IF1820 Introduksjon til språk- og kommunikasjonsteknologi Eksamsdag: 17. juni 2016 Tid for eksam: 14.30 18.30 Oppgavesettet er på 6
DetaljerINF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning
INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning INF2820 Datalingvistikk 16. januar 2017 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære
DetaljerINF2820 Datalingvistikk V2014. Jan Tore Lønning
INF2820 Datalingvistikk V2014 Jan Tore Lønning INF2820 Datalingvistikk 19. januar 2014 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker
DetaljerINF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning
INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning INF2820 Datalingvistikk 14. januar 2018 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time:
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning INF2820 Datalingvistikk 21. januar 2015 2 I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker
DetaljerOppgaver til INF 5110, kapittel 5
Oppgaver til INF 5110, kapittel 5 Fra boka: 5.3 Vi har sett litt på denne på en forelesning 5.11 Vi har tidligere sett på: -> ) a 5.18 Forsøk også sette alternativet -> til slutt Utvid grammatikken på
DetaljerINF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar
Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags
DetaljerUKE TEMA / EMNE LÆREMIDLER KOMPETANSEMÅL VURDERING Ansvar Samtale om. lærere måloppnåelse. Gjøre ferdig tegnsetting komma.
HALVÅRSPLAN VÅREN 2017 TRINN: 5. FAG: NORSK UKE TEMA / EMNE LÆREMIDLER KOMPETANSEMÅL VURDERING Ansvar Uke 1 Venn- diagram Kopi fra «Salto». Samtale om lærere måloppnåelse. Gjøre ferdig tegnsetting komma.
DetaljerINF1820 INF1820 2013-02-14. Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon µορφή - form λόγος - lære Morfologi er det laveste meningsbærende nivået i språk. Fonologi og fonetikk er lavere nivåer, men de er ikke meningsbærende
DetaljerINF2820 Datalingvistikk V2012. Jan Tore Lønning
INF2820 Datalingvistikk V2012 Jan Tore Lønning BEGRENSNINGER VED REGULÆRE SPRÅK OG KONTEKSTFRIE GRAMMATIKKER 2 I dag 1. Begrensninger ved regulære språk 2. Noen egenskaper ved naturlige språk 3. Kontekstfrie
DetaljerTID TEMA KOMPETANSEMÅL ARBEIDSMETODER VURDERINGSFORMER RESSURSER
RENDALEN KOMMUNE Fagertun skole Årsplan i norsk for 7. trinn 2015-16 Elevene skal gjennom hele skoleåret arbeide med skriftlige oppgaver innen sjangeren sakprosa/fagtekst og skjønnlitterære tekster. På
DetaljerINF2220: Time 8 og 9 - Kompleksitet, beregnbarhet og kombinatorisk søk
INF0: Time 8 og 9 - Kompleksitet, beregnbarhet og kombinatorisk søk Mathias Lohne mathialo Rekursjonseksempel Eksempel Finn kjøretid for følgende program: (Ex11 b) 1 float foo(a) { n = Alength; 3 4 if
DetaljerLære å skrive kort og brev å bruke e-post. Lære å bruke biblioteket forskjellen på skjønnlitteratur
34-37 1 Send en hilsen (Språkbok 5, s. 4 17) 38-39 1 På biblioteket (Lesebok 5, s. 4 17) 41-42 43-44 45-46 2 Lesekurs (Lesebok 5, s. 18 35) 3 Snakk om bøker (Lesebok 5, s. 36 47) 2 Lær å lære måte. setninger
DetaljerINF1820: Ordklassetagging
NF1820: Ordklassetagging NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Arne Skjærholt 6. mars NF1820: Ordklassetagging Ordklassetagging Never gonna give you up Never gonna let
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer
DetaljerNorsk årsplan for 6. klasse 2014/15 Kompetansemål og forventninger Hovedemner
Norsk årsplan for 6. klasse 2014/15 Mange av kompetansemålene i norsk blir også jobbet med i de andre skolefagene. Årsplanen er derfor delt i to hoveddeler: Kompetansemål og forventninger Hovedemner Mål
DetaljerRENDALEN KOMMUNE Fagertun skole. Årsplan i norsk for 7. trinn 2014-15
Obj111 RENDALEN KOMMUNE Fagertun skole Årsplan i norsk for 7. trinn 2014-15 Elevene skal gjennom hele skoleåret arbeide med en skriftlig oppgave innen sjangeren sakprosa/fagtekst eller skjønnlitterær tekst.
DetaljerEn grunnleggende innføring i bruk av ASK
En grunnleggende innføring i bruk av ASK Liten ordliste: Korrektkorpuset: Grammatisk korrekte utgaver av innlærertekstene generert på grunnlag av korreksjoner som er foreslått under feilkodingen. Kontrollkorpuset:
DetaljerViktige begrep i kapittel 1.
Viktige begrep i kapittel 1. 1. Egenskaper ved relasjoner. La R A A være en binær relasjon. (a) At R er refleksiv betyr at x (x, x) R. (b) At R er symmetrisk betyr at x y ((x, y) R (y, x) R ). (c) At R
DetaljerTuringmaskiner en kortfattet introduksjon. Christian F Heide
13. november 2014 Turingmaskiner en kortfattet introduksjon Christian F Heide En turingmaskin er ikke en fysisk datamaskin, men et konsept eller en tankekonstruksjon laget for å kunne resonnere omkring
DetaljerFagplan i norsk 7. trinn
Fagplan i norsk 7. trinn Uke Kompetansemål Emne Læringsmål Kriterier Forslag til I startgropa Underveis I mål læreverk Skriftlige tekster Bruke ulike lesestrategier tilpasset formålet med lesingen Muntlige
DetaljerKompleksitetsanalyse Helge Hafting 25.1.2005 Opphavsrett: Forfatter og Stiftelsen TISIP Lærestoffet er utviklet for faget LO117D Algoritmiske metoder
Helge Hafting 25.1.2005 Opphavsrett: Forfatter og Stiftelsen TISIP Lærestoffet er utviklet for faget LO117D Algoritmiske metoder Innhold 1 1 1.1 Hva er en algoritme?............................... 1 1.2
DetaljerHovedtema Kompetansemål Delmål Arbeidsmetode Vurdering Lær å lære. Lesekurs. (Zeppelin språkbok) Bison- overblikk. Nøkkelord. VØL- skjema.
Kyrkjekrinsen skole Årsplan for perioden: 2012-2013 Fag: Norsk År: 2012-2013 Trinn og gruppe: 5A/B Lærer: Mona Brurås og Dårdi Flåm Uke Årshjul 34 37 Nasjonal prøve lesing uke 37 Hovedtema Kompetansemål
DetaljerEn repetisjon hrj høst 2009
En repetisjon hrj høst 2009 Data Maskin Data Syntaktiske objekter - endelige Mengde { } Multimengde [ ] Liste < > Symbol String = Liste av symboler Vi kan alltid finne ut om to syntaktiske objekter er
DetaljerVårplan i norsk for 7.klasse Kaldfjord skole. Vi tar forbehold om endringer!
Vårplan i norsk for 7.klasse Kaldfjord skole. Vi tar forbehold om endringer! Lærebøker i lesing/leseforståelse, Hydén, Schubert m.fl. Lesing i fagene, Mer lesing i fagene, tekster fra nasjonale prøver
DetaljerINF 2820 V2018: Innleveringsoppgave 1
INF 2820 V2018: Innleveringsoppgave 1 Besvarelsene skal leveres i devilry innen fredag 9.2 kl 18.00 Det blir 5 sett med innleveringsoppgaver. Hvert sett gir inntil 100 poeng. Til sammen kan en få inntil
Detaljer1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon OBS: Lov å stille spørsmål underveis Forelesninger
DetaljerMAT1030 Forelesning 13
MAT1030 Forelesning 13 Funksjoner Dag Normann - 2. mars 2010 (Sist oppdatert: 2010-03-02 14:15) Kapittel 6: Funksjoner Forrige uke Forrige forelesning snakket vi om relasjoner. Vi snakket om ekvivalensrelasjoner
DetaljerINF2820 Datalingvistikk V Gang Jan Tore Lønning
INF2820 Datalingvistikk V2016 5. Gang - 17.2 Jan Tore Lønning I dag Kontekstfrie grammatikker, avledninger og trær Kontekstfrie grammatikker og regulære språk Kontekstfrie grammatikker for naturlige språk
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 1
INF 2820 V2016: Obligatorisk innleverinsoppgave 1 OBS Korrigert eksemplene oppgave 2, 8.2 Besvarelsene skal leveres i devilry innen torsdag 18.2 kl 18.00 Filene det vises til finner du på /projects/nlp/inf2820/fsa
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen CHARTPARSING (SEKSJ 13.4) FORMELLE EGENSKAPER VED SPRÅK (KAP. 16) 8. mars 2011 2 I dag Oppsummering fra sist: Dynamisk programmering CKY-algoritmen
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i INF Logiske metoder for informatikk Eksamensdag:. desember Tid for eksamen:.. Oppgavesettet er på sider. Vedlegg: Ingen Tillatte
DetaljerINF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen
INF2820 Datalingvistikk V2011 Jan Tore Lønning & Stephan Oepen til INF2820 Datalingvistikk Ole Johan Dahls hus 18. januar 2011 2 I dag: 0 Praktisk informasjon 1. Hvorfor datalingvistikk? 2. Hva er utfordringene?
DetaljerTuringmaskiner en kortfattet introduksjon. Christian F Heide
7. november 016 Turingmaskiner en kortfattet introduksjon Christian F Heide En turingmaskin er ikke en fysisk datamaskin, men et konsept eller en tankekonstruksjon laget for å kunne resonnere omkring blant
Detaljermed sammenheng og forståelse. dagene i uka. - Samtale om sanger, regler fra fortid og nåtid. - Variere ordvalg og setningsbygning i egen skriving.
Halvårsplan i norsk våren 2017 Bogafjell skole Ukenummer: Tema: Kompetansemål fra Kunnskapsløftet. Læringsmål for perioden. Elevene skal kunne: 1 Kap 24: Ukedagene - Kunne lese tekster av ulike typer -
DetaljerLæringsstrategi Tankekart Nøkkelord Understrekning
Antall uker 2-3 Klar tale! Side 11-25 i Fabel Nynorsk grammatikk side 59-93 Tankekart Nøkkelord Understrekning Lytte til, oppsummere hovedinnhold og trekke ut relevant informasjon i muntlige tekster Presentere
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
DetaljerINF2820 Datalingvistikk V2016. Forelesning 4, 10.2 Jan Tore Lønning
INF2820 Datalingvistikk V2016 Forelesning 4, 10.2 Jan Tore Lønning I dag Ord Begrensninger med regulære språk Regulære uttrykk i praksis Utvidete regulære uttrykk Frasestruktur og kontekstfrie grammatikker
DetaljerINF2820 Datalingvistikk V2015. Jan Tore Lønning
INF2820 Datalingvistikk V2015 Jan Tore Lønning Idag Automater og regulære uttrykk Litt Python Implementasjon av DFA i Python Naiv NFA-algoritme Smart NFA-algoritme Pythonimplementasjon 30. januar 2015
DetaljerLøsningsforslag til obligatorisk oppgave 3 INF1800 Logikk og beregnbarhet, høsten 2009
Løsningsforslag til obligatorisk oppgave 3 INF1800 Logikk og beregnbarhet, høsten 2009 Torgeir Lebesbye torgeirl@ifi.uio.no Universitetet i Oslo Lars-Erik Bruce larsereb@ifi.uio.no Universitetet i Oslo
DetaljerRepetisjon og mer motivasjon. MAT1030 Diskret matematikk. Repetisjon og mer motivasjon
Repetisjon og mer motivasjon MAT030 Diskret matematikk Forelesning 22: Grafteori Roger Antonsen Matematisk Institutt, Universitetet i Oslo 4. april 2008 Først litt repetisjon En graf består av noder og
DetaljerLO118D Forelesning 4 (DM)
LO118D Forelesning 4 (DM) Mer funksjoner + følger 28.08.2007 1 Funksjoner 2 Følger og strenger Funksjoner En funksjon f fra X til Y sies å være en-til-en (injektiv) hvis det for hver y Y er maksimalt én
DetaljerINF2820 Datalingvistikk V2015. Forelesning 4, 9.2 Jan Tore Lønning
INF2820 Datalingvistikk V2015 Forelesning 4, 9.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Begrensninger ved regulære språk Regulære uttrykk: teoretiske og praktiske Noen egenskaper
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerDagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2)
Dagens tema Syntaks (kapittel 2.1 + Komp. 47, kap. 1 og 2) 1/19 Forelesning 6 1.10.2003 Litt om kompilering og interpretering En kompilator oversetter et program til et annet språk, for eksempel maskinspråk.
DetaljerLokal læreplan i engelsk 8
Lokal læreplan i engelsk 8 Tema: The British Isles Kompetansemål Elevene skal kunne gjøre rede for trekk ved historie og geografi i Storbritannia. Elevene skal kunne drøfte levesett og omgangsformer i
DetaljerLitt om kompilering og interpretering. Dagens tema Syntaks (kapittel Komp. 47, kap. 1 og 2) Syntaks og semantikk
Litt om kompilering og interpretering Dagens tema Syntaks (kapittel 2. + Komp. 47, kap. og 2) En kompilator oversetter et program til et annet språk, for eksempel maskinspråk. Et program interpreteres
DetaljerFagplan i norsk 5. trinn
Fagplan i norsk 5. trinn Uke Kompetansemål Tema Læringsmål Du kan litt Du kan noe Du kan mye Forslag til 34- Læringsstrategier nøkkelord og Bruke læringsstrategiene nøkkelord, Lage et Lage tankekart Nasjonale
DetaljerINF2820 Datalingvistikk V2014. Forelesning 4, 6.2 Jan Tore Lønning
INF2820 Datalingvistikk V2014 Forelesning 4, 6.2 Jan Tore Lønning I dag Oppsummering av endelige tilstandsteknikker Regulære uttrykk: teoretiske og praktiske Begrensninger ved regulære språk Noen egenskaper
DetaljerOppgaver til INF 5110, kapittel 5, med svarforslag Gjennomgått torsdag 26. febr Dette er versjon fra 28/7
Oppgaver til INF 5110, kapittel 5, med svarforslag Gjennomgått torsdag 26. febr. 2008. Dette er versjon fra 28/7 OPPGAVER: Fra boka: 5.3, 5.4, 5.11, 5.12, 5.13. Oppgave 2 fra Eksamen 2006. Utvid grammatikken
DetaljerKom godt i gang med. Ordboksverktøyet. mikrov.no. Kom godt i gang med Ordboksverktøyet 1 1
Kom godt i gang med Ordboksverktøyet mikrov.no Kom godt i gang med Ordboksverktøyet 1 1 Forord - et lese- og skrivestøttende språkverktøy Ordboksverktøyet kan brukes som forklarings- og rettskrivningsordbok
DetaljerINF1400. Tilstandsmaskin
INF4 Tilstandsmaskin Hovedpunkter Tilstandsmaskin Tilstandstabell Tilstandsdiagram Analyse av D-flip-flop tilstandsmaskin Reduksjon av antall tilstander Tilordning av tilstandskoder Designprosedyre for
DetaljerÅrsplan i norsk for 6. klasse
Uke Tema/fagemne Kompetansemål (eleven skal kunne) Hele året Lesing av ulike tekster med samtaler (begreper) Håndskrift Skrive på tastatur Rettskriving Ordklasser Årsplan i norsk for 6. klasse 2018-2019.
Detaljer2/6/2012. Begrensninger ved regulære språk. INF2820 Datalingvistikk V2012. Formelle språk som ikke er regulære KONTEKSTFRIE GRAMMATIKKER.
INF2820 Datalingvistikk V2012 Jan Tore Lønning Begrensninger ved regulære Regulære er ikke ideelle modeller for naturlige, dvs Verken regulære uttrykk eller NFA er ideelle for å beskrive naturlige fordi:
DetaljerINF5830, H2009, Obigatorisk innlevering 2. 1 Oppgave: Unære produksjoner i CKY
INF5830, H2009, Obigatorisk innlevering 2 Innleveringsfrist 4.11 1 Oppgave: Unære produksjoner i CKY For bottom-up parsere, som CKY, har vi forutsatt at grammatikken er på CNF. For de ikke-leksikalske
DetaljerFAGPLAN I NORSK FOR 7. TRINN HØSTEN 2016
FAGPLAN I NORSK FOR 7. TRINN HØSTEN 06 a Kap Side a 5 6 Vite hvordan språket ble til 8 9 Rettskriving Og/å Lydlike ord 0 5 Rettskriving og 8 9 0 46 59 5 4 + 6 60 7 4 Vite hva språk er og hvordan det har
DetaljerPC-bok 1. Svein-Ivar Fors. Lær deg. og mye mer! Windows Tekstbehandling Regneark Mange nyttige PC-tips!
Svein-Ivar Fors s PC-bok 1 Lær deg Windows Tekstbehandling Regneark Mange nyttige PC-tips! Bruk PC en din til å skrive brev, gjøre forandringer i tekster, skrive feilfritt nesten bestandig, kopiere datafiler
DetaljerAnatomien til en kompilator - I
Anatomien til en kompilator - I program Symboltabell tekst tokens syntaks-tre beriket syntaks-tre Finne struktur i programmet OK i henhold til grammatikk? Preprocessor Makroer Betinget kompilering Filer
DetaljerAnatomien til en kompilator - I
Anatomien til en kompilator - I 5/22/2006 1 Framgangsmåte for automatisk å lage en scanner Beskriv de forskjellige token-klassene som regulære uttrykk Eller litt mer fleksibelt, som regulære definisjoner
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Syvende forelesning Lilja Øvrelid 6 mars, 2017 1 Ordklassetagging Ordklasser? Bindeledd mellom ordet og setningen (syntaks): Sier noe om hva slags
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
Detaljer