INF2820 Datalingvistikk V2016. Jan Tore Lønning

Like dokumenter
INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V forelesning, 30.1 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Institutt for Informatikk ønsker alle nye studenter velkommen! Bachelorprogrammet Informatikk: språkteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.

INF1800 LOGIKK OG BEREGNBARHET

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

VELKOMMEN TIL MAT-INF1100(L) Knut Mørken Rom 1033, Niels Henrik Abels hus

INF2820 Datalingvistikk V2015. Jan Tore Lønning

LF - Eksamen i INF1820

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

Velkommen! I dag. Viktige beskjeder. Studieadministrasjonen. IN Høst Siri Moe Jensen Geir Kjetil Sandve Henrik Hillestad

INF2820 Datalingvistikk V Gang Jan Tore Lønning

MAT1030 Diskret Matematikk

Velkommen til MAT1030!

VELKOMMEN TIL MAT-INF1100 og MAT-INF1105. Knut Mørken Rom Ø368, Fysikkbygget

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

VELKOMMEN TIL MAT-INF1100

INF112(kun et utvalg av kommentarene er med i denne rapporten)

VELKOMMEN TIL MAT-INF1100(L) Knut Mørken Rom 1033, Niels Henrik Abels hus

VELKOMMEN TIL MAT-INF1100

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF109 (kun et utvalg av kommentarene er med i denne rapporten)

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

Velkommen til. IN1010 Objektorientert programmering Våren 2018

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF101 (kun et utvalg av kommentarene er med i denne rapporten)

Kort om kursene INF1100 og MAT-INF1100L

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2017 Forelesning 3, 30.1 Jan Tore Lønning

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

IN1010 Objektorientert programmering Våren 2019

Oversikt. Informatikk. INF1000: Grunnkurs i objektorientert programmering. Utenom INF1000 Informasjon & hjelp

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF Introduksjon til design, bruk, interaksjon Introduksjon

Ifis forslag til reviderte studieprogrammer

Hvordan blir jeg en ordentlig informatikkstudent? Kurs i studiestrategier med fokus på INF1000

Velkommen til INF5110 Kompilatorteknikk

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

VELKOMMEN TIL MAT-INF1100 og MAT-IN1105

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning

INF1070. Velkommen til. Datamaskinarkitektur. Motto: Hvordan bygger man en datamaskin? INF1070

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V2012

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF2820 Datalingvistikk V2012. Jan Tore Lønning

VELKOMMEN TIL MAT-INF 1100

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

VELKOMMEN TIL MAT-INF 1100

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

1 av 5 01/04/ :12 PM

Orienteringsmøte bachelor Orienteringsmøte bachelor Utdanningsleder Ragnhild Kobro Runde

Ifis forslag til reviderte studieprogrammer

Velkommen til. INF våren 2017

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

1 av 5 12/26/ :48 AM

INF2820 Datalingvistikk V Gang 26.2 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

UiO - Universitetet i Oslo

Velkommen. Velkommen til INF2270. Datamaskinarkitektur. Motto: Datamaskinen på tvers

Etter uke 9 skal du. Introduksjon til objektorientert programmering. Innhold. Klasser som abstraksjoner

INF2270 Datamaskinarkitektur

INF2820 Datalingvistikk V gang, Jan Tore Lønning

INF2820 Datalingvistikk V Gang 6.3 Jan Tore Lønning

Introduksjon til programmering og programmeringsspråk

Velkommen til INF Kompilatorteknikk

Transkript:

INF2820 Datalingvistikk V2016 Jan Tore Lønning

INF2820 Datalingvistikk 20. januar 2016 2

I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære språk OBS: Lov å stille spørsmål underveis

The game of the name 1. Datalingvistikk 1. Computational linguistics 3. Språkteknologi 3. (Human) Language Technology 2. Natural language processing 2.Språkprosessering / prosessering av naturlige språk Computer science Artificial intelligence (AI) NLP Data Science NLP Navnene har litt forskjellig opphav og tradisjon, eks. I dag brukes navnene til dels om hverandre 20. januar 2016 4

The name of the game Datalingvistikk Prosessering av naturlige språk Språkteknologi Språk: Norsk, arabisk, japansk, Naturlige: Oppstått Ikke oppfunnet Data Prosessering Teknologi 20. januar 2016 5

Hvorfor datalingvistikk? 1. Visjonen om kunstig intelligens (Artificial intelligence/ai) Modeller av mennesker Forstå Erstatte 2. Nyttig, anvendelser: Supplere mennesker Redskap

Skjønner datamaskinen hva jeg sier? Visjon: Intelligente maskiner Maskiner som forstår Roboter En slik maskin må: Kunne snakke og lytte Ingen intelligens uten språk

Turingtesten Kommunikasjon i naturlig språk

2011-sensasjon: Watson på Jeopardy

Nytte, eks.: oversettelse Drømmen fra 18 år siden Ikke i 2003, men hvor er vi i dag? Tekstoversettelse Oversettelse av tale

Menneske-maskininteraksjon Visjon: Kommunisere med datamaskinen som til et menneske: Eks.: 2001 en romodyssé 2011: Siri Basert på langsiktig grunnforskning: SRI

Språkteknologi 2016 Fra visjon til virkelighet Integrert i en rekke applikasjoner Drevet av: Internett/Store datamengder Mobilteknologi Anvendelser: Stave- og grammatikkontroll Talegjenkjenning, diktering Syntetisk tale, eks. GPS Maskinoversettelse Dialogsystemer Søk i tekst (innholdsrelaterte) Analyse av store tekstmengder Analyse av internett Overvåkning

Hva skal vi gjøre i INF2820? Fokusere på grunnleggende teknikker: Språk: naturlige og formelle språk Endelige tilstandsteknikker for nat.spr. Kontekstfrie grammatikker Parsing av kontekstfrie grammatikker for naturlige språk Unifikasjonsgrammatikker Semantikk (Regelbaserte metoder)

Modell Talegjenkjenning Syntaktisk og semantisk analyse Talesyntese Generering Typisk tre trinn Analyse (syntaktisk, semantisk, ) Utføring av oppgave (finn svar, transfer, ) Generer svar Rundt dette et større system: dialoghåndtering mm.

Fra NLTK

Flertydighet Den største utfordringen i språkteknologi Eksempel fra Youtube-video om Watson: 20. januar 2016 16

Verktøy Endelige tilstandsteknikker De første ukene NLTK: The Natural Language Toolkit Programmer for ulike typer NLPoppgaver Kan kombinere med egen kode Vekt på opplæring: Men også brukt for større oppgaver Bok, dokumentasjon 20. januar 2016 17

Python Gode strukturer for tekst: Strenger Lister Read-eval-print-loop Lesbar, strukturert kode: Kompakt, nesten pseudokode Gir gode programmeringsvaner Lett å lære Objektorientert Mye brukt: tilgjengelig, bibliotek, grensesnitt Nyttig senere i livet: scripting 20. januar 2016 18

Læremidler Deler av Bøker: Jurafsky og Martin, Speech and Language Processing S. Bird, E. Klein and E. Loper: Natural Language Processing with Python (Finnes på nett) Kode Presentasjoner som blir lagt ut på nett Supplerende Erstatter ikke bøker Noen artikler/web-sider/utdelt materiale OBS: Samme bok! 20. januar 2016 19

Forelesninger Jan Tore Lønning, jtl@ifi.uio.no, Forelesninger: Onsdag 14.15-16 Sted: Caml 15-16 uker 20. januar 2016 20

Gruppeundervisning Bo Bjerke-Lindstrøm Tirsdag 8.15-10 Sted alternerer mellom Datastue Chill Seminarrom Perl Første gang 26. jan. The place to be: Rom 3467 Fortran Programstue: - Informatikk: språk og kommunikasjon 20. januar 2016 21

Arbeidsformer og arbeidsmengde Forelesninger 2 t/uke Gruppe 2 t/uke Teorioppgaver I Pensumlesning I I Obligs Terminalarbeid 13 +9 t/u samlet i gj.snitt Obligatoriske oppgaver: 4 sett, alle må bestås Men: også ikkeobligatoriske oppgaver er eksamensstoff Undervisningen er eksamensrelevant selv om den ikke er obligatorisk 20. januar 2016 22

Forkunnskaper INF1000 - Grunnkurs i objektorientert programmering, INF1080 - Logiske metoder for informatikk INF1820 - Introduksjon til språk- og kommunikasjonsteknologi Disse er ikke obligatoriske, men i undervisningen regner med at du har disse kunnskapene Hvis du mangler ett av emnene vil du kunne ta INF2820, hvis Du har gode kunnskaper på de andre områdene Er villig til å legge inn en ekstra innsats 20. januar 2016 23