INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

Like dokumenter
INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Institutt for Informatikk ønsker alle nye studenter velkommen! Bachelorprogrammet Informatikk: språkteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V forelesning, 30.1 Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang, del Jan Tore Lønning

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

1/26/2012 LITT PYTHON. INF2820 Datalingvistikk V2012. Hvorfor Pyhton. Python syntaks. Python er objektorientert. Python datatyper.

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF112(kun et utvalg av kommentarene er med i denne rapporten)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2012. Jan Tore Lønning

INF109 (kun et utvalg av kommentarene er med i denne rapporten)

VELKOMMEN TIL MAT-INF1100(L) Knut Mørken Rom 1033, Niels Henrik Abels hus

INF1800 LOGIKK OG BEREGNBARHET

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

VELKOMMEN TIL MAT-INF1100 og MAT-INF1105. Knut Mørken Rom Ø368, Fysikkbygget

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

INF101 (kun et utvalg av kommentarene er med i denne rapporten)

VELKOMMEN TIL MAT-INF1100(L) Knut Mørken Rom 1033, Niels Henrik Abels hus

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 13.3 Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 2.3 Jan Tore Lønning

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

Kort om kursene INF1100 og MAT-INF1100L

INF2820 Datalingvistikk V Gang Jan Tore Lønning

VELKOMMEN TIL MAT-INF1100

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Ifis forslag til reviderte studieprogrammer

LF - Eksamen i INF1820

Velkommen! I dag. Viktige beskjeder. Studieadministrasjonen. IN Høst Siri Moe Jensen Geir Kjetil Sandve Henrik Hillestad

Ifis forslag til reviderte studieprogrammer

VELKOMMEN TIL MAT-INF1100

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

2/24/2012. Context-Free Grammars. I dag. Avledning. Eksempel: grammar1 PARSING. Jan Tore Lønning

INF2820 V2017 Oppgavesett 5 Gruppe 21.2

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

INF2820 Datalingvistikk V2017 Forelesning 3, 30.1 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 30.3 Jan Tore Lønning

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF2820 Datalingvistikk V2017 Forelesning 1.2 Jan Tore Lønning

INF2820 Datalingvistikk V2012

INF2820 Datalingvistikk V Gang 9.3 Jan Tore Lønning

INF2820 Datalingvistikk V2012. Jan Tore Lønning

Velkommen til. IN1010 Objektorientert programmering Våren 2018

INF2820 V2017 Oppgavesett 5 arbeidsoppgaver

Hvordan blir jeg en ordentlig informatikkstudent? Kurs i studiestrategier med fokus på INF1000

Oversikt. Informatikk. INF1000: Grunnkurs i objektorientert programmering. Utenom INF1000 Informasjon & hjelp

Velkommen til INF Kompilatorteknikk

INF2820 Datalingvistikk V gang, Jan Tore Lønning

UiO - Universitetet i Oslo

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2017 Forelesning 2, 23.1 Jan Tore Lønning

VELKOMMEN TIL MAT-INF1100 og MAT-IN1105

MAT1030 Diskret Matematikk

Velkommen til MAT1030!

INF2820 Datalingvistikk V Gang 26.2 Jan Tore Lønning

INF2820 Datalingvistikk V Gang 4.5 Jan Tore Lønning

IN1010 Objektorientert programmering Våren 2019

Velkommen til INF5110 Kompilatorteknikk

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

Velkommen til. INF våren 2017

1 av 5 01/04/ :12 PM

Orienteringsmøte bachelor Orienteringsmøte bachelor Utdanningsleder Ragnhild Kobro Runde

VELKOMMEN TIL MAT-INF 1100

VELKOMMEN TIL MAT-INF 1100

TDT4127 Programmering og Numerikk

Ifis masterprogrammer fra 2018

INF2820 Datalingvistikk V gang, Jan Tore Lønning

Ny 0 0,0% Distribuert 64 66,7% Noen svar 1 1,0% Gjennomført 31 32,3% Frafalt 0 0,0% I alt ,0%

Transkript:

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk 16. januar 2017 2

I dag: 1. Time: Datalingvistikk: motivasjon og eksempler Praktisk informasjon 2. Time: Regulære språk OBS: Lov å stille spørsmål underveis

The game of the name 1. Datalingvistikk 1. Computational linguistics 3. Språkteknologi 3. (Human) Language Technology 2. Natural language processing 2.Språkprosessering / prosessering av naturlige språk Computer science Artificial intelligence (AI) NLP Data Science NLP Navnene har litt forskjellig opphav og tradisjon, eks. I dag brukes navnene til dels om hverandre 16. januar 2017 4

The name of the game Datalingvistikk Prosessering av naturlige språk Språkteknologi Språk: Norsk, arabisk, japansk, Naturlige: Oppstått Ikke oppfunnet Data Prosessering Teknologi 16. januar 2017 5

Hvorfor datalingvistikk? 1. Visjonen om kunstig intelligens (Artificial intelligence/ai) Modeller av mennesker Forstå Erstatte 2. Nyttig, anvendelser: Supplere mennesker Redskap

Skjønner datamaskinen hva jeg sier? Visjon: Intelligente maskiner Maskiner som forstår Roboter En slik maskin må: Kunne snakke og lytte Ingen intelligens uten språk

Språkteknologi 2016 nytteaspektet Fra visjon til virkelighet Integrert i en rekke applikasjoner Drevet av: Internett/Store datamengder Mobilteknologi Anvendelser: Stave og grammatikkontroll Talegjenkjenning, diktering Syntetisk tale, eks. GPS Maskinoversettelse Dialogsystemer Søk i tekst (innholdsrelaterte) Analyse av store tekstmengder Analyse av internett Overvåkning

2017: Kunstig intelligens overalt 16. januar 2017 9

Maskinoversettelse 16. januar 2017 10

Stemmestyrte assistenter 16. januar 2017 11

Språkteknologi - tekstanalyse Twitter, Social media Do customers like the < >? Which model do people prefer? Did the electors like my last speech? Future stock prices? Danger of violent revolt? Produktanbefalinger Reklame, individualisering Overvåkning 12

Tekstanalyse, eksempler + Diagnosis? Recommended treatment? Mining the archives of the oil company Can we find more oil? 13

Modell Syntaktisk og semantisk analyse Talegjenkjenning Talesyntese Generering Typisk tre trinn Analyse (syntaktisk, semantisk, ) Utføring av oppgave (finn svar, transfer, ) Generer svar Rundt dette et større system: dialoghåndtering mm.

Fra NLTK

Flertydighet Den største utfordringen i språkteknologi Eksempel fra Youtube-video om Watson: 16. januar 2017 16

Hva skal vi gjøre i INF2820? Fokusere på grunnleggende teknikker: Språk: naturlige og formelle språk Endelige tilstandsteknikker for nat.spr. Leksiokon og morfologi Kontekstfrie grammatikker Parsing av kontekstfrie grammatikker for naturlige språk Enkel maskinlæring: sannsynlighetsbaserte metoder

Verktøy Endelige tilstandsteknikker De første ukene NLTK: The Natural Language Toolkit Programmer for ulike typer NLPoppgaver Kan kombinere med egen kode Vekt på opplæring: Men også brukt for større oppgaver Bok, dokumentasjon 16. januar 2017 18

Python Gode strukturer for tekst: Strenger Lister Read-eval-print-loop Lesbar, strukturert kode: Kompakt, nesten pseudokode Gir gode programmeringsvaner Lett å lære Objektorientert Mye brukt: tilgjengelig, bibliotek, grensesnitt Nyttig senere i livet: scripting 16. januar 2017 19

Læremidler Deler av Bøker: Jurafsky og Martin, Speech and Language Processing S. Bird, E. Klein and E. Loper: Natural Language Processing with Python (Finnes på nett) Kode Presentasjoner som blir lagt ut på nett Supplerende Erstatter ikke bøker Noen artikler/web-sider/utdelt materiale OBS: Samme bok! 16. januar 2017 20

Forelesninger Jan Tore Lønning, jtl@ifi.uio.no, Forelesninger: Mandag 10.15 12 Sted: Prolog 15 16 uker (litt mange mandager går bort til påske og 1.mai) 16. januar 2017 21

Gruppeundervisning Eivind Alexander Bergem Tirsdag 10.15 12 Fortress Første gang 24. jan. The place to be: Rom 3467 Fortran Programstue: Informatikk: språk og kommunikasjon 16. januar 2017 22

Arbeidsformer og arbeidsmengde Forelesninger 2 t/uke Gruppe 2 t/uke Teorioppgaver I Pensumlesning I I Obligs Terminalarbeid 13 +9 t/u samlet i gj.snitt Obligatoriske oppgaver: 5 sett poengsystem Men: også ikkeobligatoriske oppgaver er eksamensstoff Undervisningen er eksamensrelevant selv om den ikke er obligatorisk 16. januar 2017 23

Forkunnskaper INF1000 Grunnkurs i objektorientert programmering, INF1080 Logiske metoder for informatikk INF1820 Introduksjon til språk og kommunikasjonsteknologi Disse er ikke obligatoriske, men i undervisningen regner med at du har disse kunnskapene Hvis du mangler ett av emnene vil du kunne ta INF2820, hvis Du har gode kunnskaper på de andre områdene Er villig til å legge inn en ekstra innsats 16. januar 2017 24