INF2820 Datalingvistikk V2014. Jan Tore Lønning

Like dokumenter
INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF2820 Datalingvistikk V forelesning, 30.1 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Institutt for Informatikk ønsker alle nye studenter velkommen! Bachelorprogrammet Informatikk: språkteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning

INF Introduksjon til design, bruk, interaksjon Introduksjon

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF1800 LOGIKK OG BEREGNBARHET

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

LF - Eksamen i INF1820

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V2012

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF2820 Datalingvistikk V Gang 13.4 Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 3, 30.1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

Velkommen til. IN1010 Objektorientert programmering Våren 2018

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

INF2820 Datalingvistikk V Gang 6.3 Jan Tore Lønning

INF2820 Datalingvistikk V gang, 27.2 Jan Tore Lønning

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

Velkommen til INF5110 Kompilatorteknikk

INF2820 Datalingvistikk V Gang 26.2 Jan Tore Lønning

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF5820. Language technological applications. H2010 Jan Tore Lønning

Kort om kursene INF1100 og MAT-INF1100L

Oversikt. Informatikk. INF1000: Grunnkurs i objektorientert programmering. Utenom INF1000 Informasjon & hjelp

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Velkommen til INF Kompilatorteknikk

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF109 (kun et utvalg av kommentarene er med i denne rapporten)

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

Ifis forslag til reviderte studieprogrammer

UNIVERSITETET I OSLO

Ifis bachelorundervisning fra 2017

MAT1030 Diskret Matematikk

Velkommen til MAT1030!

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1010 Objektorientert programmering Våren 2019

Velkommen! I dag. Viktige beskjeder. Studieadministrasjonen. IN Høst Siri Moe Jensen Geir Kjetil Sandve Henrik Hillestad

INF2820 Datalingvistikk V Gang Jan Tore Lønning

Er kunstig intelligens vår venn?

Ifis forslag til reviderte studieprogrammer

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

INF2820 Datalingvistikk V gang, Jan Tore Lønning

VELKOMMEN TIL MAT-INF1100

Hvordan blir jeg en ordentlig informatikkstudent? Kurs i studiestrategier med fokus på INF1000

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF1070. Velkommen til. Datamaskinarkitektur. Motto: Hvordan bygger man en datamaskin? INF1070

Introduksjon til programmering og programmeringsspråk

INF2820 Datalingvistikk V Gang 6.4 Jan Tore Lønning

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Koding noe vi alle må kunne? Simen Sommerfeldt til Arbeidslivet 2022

VELKOMMEN TIL MAT-INF1100

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Lese- og skriveressurser for økt selvstendighet og mestringsfølelse

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning

Ifis masterprogrammer fra 2018

2/22/2011. Høyre- og venstreavledninger. I dag. Chomsky-normalform (CNF) Chomsky-normalform (CNF) PARSING. Jan Tore Lønning & Stephan Oepen

Transkript:

INF2820 Datalingvistikk V2014 Jan Tore Lønning

INF2820 Datalingvistikk 19. januar 2014 2

I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Endelige tilstandsteknikker OBS: Lov å stille spørsmål underveis

The game of the name 1. Datalingvistikk 1. Computational linguistics 3. Språkteknologi 3. (Human) Language Technology 2. Natural language processing 2.Språkprosessering / prosessering av naturlige språk Computer science Artificial intelligence (AI) NLP Navnene har litt forskjellig opphav og tradisjon, eks. I dag brukes navnene til dels om hverandre 19. januar 2014 4

The name of the game Datalingvistikk Prosessering av naturlige språk Språkteknologi Språk: Norsk, arabisk, japansk, Naturlige: Oppstått Ikke oppfunnet Data Prosessering Teknologi 19. januar 2014 5

Hvorfor datalingvistikk? Visjonen om kunstig intelligens Modeller av mennesker Forstå Erstatte Nyttig, anvendelser: Supplere mennesker

Skjønner datamaskinen hva jeg sier? Visjon: Intelligente maskiner Maskiner som forstår Roboter En slik maskin må: Kunne snakke og lytte Ingen intelligens uten språk

2011-sensasjon: Watson på Jeopardy

Nytte, eks.: oversettelse Drømmen fra 16 år siden Ikke i 2003, men hvor er vi i dag? Taleoversettelse Weboversettelse

Menneske-maskininteraksjon Visjon: Kommunisere med datamaskinen som til et menneske: Eks.: 2001 en romodyssé 2011: Siri Basert på langsiktig grunnforskning: SRI

Språkteknologi 2014 Fra visjon til virkelighet Integrert i en rekke applikasjoner Drevet av: Internett Mobilteknologi Anvendelser: Stave- og grammatikkontroll Talegjenkjenning, diktering Syntetisk tale, eks. GPS Maskinoversettelse Dialogsystemer Søk i tekst (innholdsrelaterte) Web analytics Overvåkning

Modell Talegjenkjenning Syntaktisk og semantisk analyse Talesyntese Generering Typisk tre trinn Analyse (syntaktisk, semantisk, ) Utføring av oppgave (finn svar, transfer, ) Generer svar Rundt dette et større system: dialoghåndtering mm.

Fra NLTK

19. januar 2014 flertydighet 14

Hva skal vi gjøre i INF2820? Fokusere på grunnleggende teknikker: Språk: naturlige og formelle språk Endelige tilstandsteknikker for nat.spr. Kontekstfrie grammatikker Parsing av kontekstfrie grammatikker for naturlige språk Unifikasjonsgrammatikker Semantikk

Verktøy Endelige tilstandsteknikker De første ukene NLTK: The Natural Language Toolkit Programmer for ulike typer NLPoppgaver Kan kombinere med egen kode Vekt på opplæring: Men også brukt for større oppgaver Bok, dokumentasjon 19. januar 2014 16

Python Gode strukturer for tekst: Strenger Lister Read-eval-print-loop Lesbar, strukturert kode: Kompakt, nesten pseudokode Gir gode programmeringsvaner Lett å lære Objektorientert Mye brukt: tilgjengelig, bibliotek, grensesnitt Nyttig senere i livet: scripting 19. januar 2014 17

Læremidler Presentasjoner som blir lagt ut på nett Deler av Bøker: Jurafsky og Martin, Speech and Language Processing S. Bird, E. Klein and E. Loper: Natural Language Processing with Python (Finnes på nett) Kode Noen artikler/web-sider/utdelt materiale OBS: Samme bok! 19. januar 2014 18

Forelesninger Jan Tore Lønning, jtl@ifi.uio.no, Forelesninger: Torsdag10.15-12 Sted: Pascal, 2452 16 uker 19. januar 2014 19

Gruppeundervisning Bo Bjerke-Lindstrøm Tirsdag12.15-14 Sted varierer følg med: Teori: Logo 2438 Terminal: Fortress 3468 Første gang 21. jan, Fortress The place to be: Rom 3467 Fortran Programstue: - Informatikk: språk og kommunikasjon - (IT: språk, logikk, psykologi) 19. januar 2014 20

Arbeidsformer og arbeidsmengde Forelesninger 2 t/uke Gruppe 2 t/uke Teorioppgaver I Pensumlesning I Terminalarbeid 13 +9 t/u samlet i gj.snitt Obligatoriske oppgaver: 4 sett, alle må bestås Men: også ikkeobligatoriske oppgaver er eksamensstoff Undervisningen er eksamensrelevant selv om den ikke er obligatorisk 19. januar 2014 21