IN1140: Introduksjon til språkteknologi. Forelesning #1

Like dokumenter
IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Velkommen til. IN1010 Objektorientert programmering Våren 2018

Velkommen til. INF våren 2017

IN1010 Objektorientert programmering Våren 2019

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF Introduksjon til design, bruk, interaksjon Introduksjon

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Velkommen! I dag. Viktige beskjeder. Studieadministrasjonen. IN Høst Siri Moe Jensen Geir Kjetil Sandve Henrik Hillestad

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Institutt for Informatikk ønsker alle nye studenter velkommen! Bachelorprogrammet Informatikk: språkteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Dagens plan. INF3170 Logikk

Kort om kursene INF1100 og MAT-INF1100L

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2810: Funksjonell Programmering. Introduksjon

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

INF1800 LOGIKK OG BEREGNBARHET

VELKOMMEN TIL MAT-INF1100(L) Knut Mørken Rom 1033, Niels Henrik Abels hus

Ny 0 0,0% Distribuert 64 66,7% Noen svar 1 1,0% Gjennomført 31 32,3% Frafalt 0 0,0% I alt ,0%

Dagens plan INF3170 Logikk. Obliger og eksamen. Forelesning 1: Introduksjon, mengdelære og utsagnslogikk. Christian Mahesh Hansen og Roger Antonsen

INF112(kun et utvalg av kommentarene er med i denne rapporten)

Systemutvikling. Universitetet i Oslo, Institutt for informatikk Vår 2017

INF3170 Forelesning 1

VELKOMMEN TIL MAT-INF1100 og MAT-IN1105

Forelesning 1: Introduksjon og mengdelære Christian Mahesh Hansen januar Praktisk informasjon. 1.1 Forelesere og tid/sted

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

INF2810: Funksjonell Programmering. Introduksjon

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Velkommen til MAT1030!

MAT1030 Diskret Matematikk

INF2810: Funksjonell Programmering. Introduksjon

Velkommen til BIOS1100

Velkommen. Torsdag 24 januar 2019 time 1. Yngve og Jo. IN 1030 Systemer, krav og konsekvenser

INF109 (kun et utvalg av kommentarene er med i denne rapporten)

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF101 (kun et utvalg av kommentarene er med i denne rapporten)

TDT4110 Informasjonsteknologi, grunnkurs

VELKOMMEN TIL MAT-INF1100 og MAT-INF1105. Knut Mørken Rom Ø368, Fysikkbygget

INF1070. Velkommen til. Datamaskinarkitektur. Motto: Hvordan bygger man en datamaskin? INF1070

INF2270 Datamaskinarkitektur

TDT4127 Programmering og Numerikk

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF2810: Funksjonell Programmering. Introduksjon

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

1 av juli :07

1 of 5 01/07/ :13 AM

Thursday, August 19, Web-prosjekt

VELKOMMEN TIL MAT-INF1100(L) Knut Mørken Rom 1033, Niels Henrik Abels hus

1 of 5 07/08/ :29 PM

VELKOMMEN TIL MAT-INF1100

MAT-INF 1100: Obligatorisk oppgave 1

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Anbefalt litteratur: Pensum-bøker: Forelesere: Velkommen til INF Introduksjon til operativsystemer og datakommunikasjon

Velkommen til INF Introduksjon til operativsystemer og datakommunikasjon

1 av 5 01/04/ :12 PM

Velkommen. Velkommen til INF2270. Datamaskinarkitektur. Motto: Datamaskinen på tvers

Uke 8 Eksamenseksempler + Ilan Villanger om studiestrategier. 11. okt Siri Moe Jensen Inst. for informatikk, UiO

VELKOMMEN TIL MAT-INF1100

1 av 5 12/26/ :48 AM

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Rapport IN-KJM H Audun Skau Hansen, Januar 2019

INF2270 Datamaskinarkitektur

VELKOMMEN TIL MAT-INF 1100

VELKOMMEN. UKE 1: Introduksjon Plenum IN1050. Julie og Maria

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

Rapport fra «Evaluering av MEK1100 våren 2013» Generelle opplysninger Du er. Hvor mange ganger har du tatt eksamen i MEK1100 tidligere?

INF2270 Datamaskinarkitektur

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

VELKOMMEN. Til plenumstime i IN1050. Med Maria og Helle

Mekanikk FYS MEK 1110

Her finner du bl.a. oppskrifter på: - Plenumssamlingene (s3) - Skriveseminaret (s4) - Arbeidet i grupper og krav til innleveringer (s5-6)

Sentimentanalyse for norsk tekst NRK

Vi som skal undervise. MAT1030 Diskret matematikk. Hva er diskret matematikk? Hva er innholdet i MAT1030?

INF Algoritmer og datastrukturer. Hva er INF2220? Algoritmer og datastrukturer

Universitet i Oslo INF1510 Bruksorientert design Obligatorisk oppgave 2 Vår 2012 PROSJEKT GREENFORMATICS

Velkommen til INF Introduksjon til operativsystemer og datakommunikasjon

FYS Kvantefysikk. Are Raklev Teoretisk fysikk, rom FØ456, ahye@fys.uio.no

Ifis forslag til reviderte studieprogrammer

Transkript:

IN1140: Introduksjon til språkteknologi Forelesning #1 Erik Velldal Universitetet i Oslo 22. august 2017

Tema for i dag 2 Introduksjon Hva er språkteknologi? Hva er IN1140? Praktiske detaljer Grupper Obliger Lærebøker Kontakt m.m.

Screencasting 3 Tar opp screencast for hver forelesning (lyd + foiler). Egen YouTube-kanal: https://www.youtube.com/channel/ucelihv-q-puakg2fb35omiq Ment som et supplement, for repetisjon.

Hei Forelesere Samia Touileb (samiat@ifi.uio.no) Erik Velldal (erikve) Fra språkteknologigruppa (LTG) Gruppelærere Andre Kåsen (andrekaa) Tobias Aasmoe (tobiaaa) Tid & sted Gruppe 1: ons. 14:15 16:00, Datastue Limbo. Gruppe 2: tor. 10:15 12:00, Datastue Chill. Obligatorisk oppmøte første 4 gruppetimer. Forelesninger: tir. 14:15 16:00 i Smalltalk (Ole-Johan Dahls hus / IFI). NB: et par ganger må vi være i Lille Auditorium i Kristen Nygaards hus ( gamle IFI, nabohuset), se timeplanen. 4

Spørsmål og hjelp 5 Gruppetimene: Gruppelærerene er der for å hjelpe og veilede. Piazza (diskusjonsforum): https://piazza.com/uio.no/fall2017/in1140/ in1140-hjelp [at] ifi.uio.no: Felles adresse til fag-/gruppelærere.

Beskjeder 6 Husk å sjekke UiO-eposten din eller beskjedlisten på semestersiden. http://www.uio.no/studier/emner/matnat/ifi/in1140/h17/

Hva er språkteknologi? 7 Mål: å få datamaskiner til å forstå naturlige språk. Aka: computational linguistics (datalingvistikk) language technology language engineering natural language processing (NLP)

Eksempler på språkteknologi? 8

Språkteknologi og tverrfaglighet 9 NLP er et tverrfaglig felt Lingvistikk Informatikk Statistikk Maskinlæring Logikk, Filosofi, Psykologi,... Del av det bredere feltet kunstig intelligens (AI).

Turingtesten 10 Alan Turing i 1950: I propose to consider the question, Can machines think? Definisjonsspørsmål. Skulle avgjøres ved Turingtesten.

IN1140 og tverrfaglighet 11 Stoffet vi dekker i IN1140 tar også for seg stoff fra flere ulike felt. Innføring i lingvistikk, grunnleggende sannsynlighetsregning, programmering, og språkteknologiske anvendelser. Gjør deg godt rustet for flere viderekommende emner, f.eks IN3060 Språkteknologiske metoder IN3050 Kunstig intelligens og maskinlæring INF3800 Søketeknologi INF4820 Algoritmer for kunstig intelligens og naturlige språk og mange flere!

Pensumlitteratur 12 An Introduction to Language av Fromkin, Rodman & Hyams Utvalgte deler (ca 5 kapitler)

Pensumlitteratur 13 Speech and Language Processing av Jurafsky & Martin Utvalgte deler

Pensumlitteratur 14 Natural Language Processing with Python, av Bird, Klein & Loper Oppdatert for Python 3 og NLTK 3 (Natural Language Toolkit) Utvalgte deler Gratis nettbok: http://www.nltk.org/book/

Python 15 Progammering lærer dere først og fremst i IN1000, ikke IN1140. Forelesningene i IN1140 kommer til fokusere på teori. Samtidig ønsker vi å implementere stoffet i praksis, i Python. Implementasjon blir fokus på gruppene og innleveringene. Kræsjkurs i Python-programmering på de første gruppetimene. Viktig med en del egeninnsats i starten for å henge med.

Hvorfor er språkforståelse utfordrende? 16 Språk er vagt, ulike tolkninger mulig. Flertydighet overalt. Gir kompakt kommunikasjon: Samme uttrykk kan brukes i ulike kontekster. Flertydighetene er stort sett usynlige for oss, vi finner den intenderte tolkningen nærmest ubevisst. For maskiner er det motsatt: lett å finne alle mulige tolkninger, men vanskelig å se hvilken som er riktig.

Eksempel: Flertydighet på ordnivå 17 Norsk: rett. Engelsk:? Flertydig ift betydning + syntaktisk ordklasse (verb, subst., adj., adv.). Vi trenger kontekst for å avgjøre. avgrenset av en rett linje tvers over kanalen Hva er rett svar? lovbestemt rett til innsyn Denne rett avsa enstemmig dom i saken 4. juli 1980 Norsk rett tilpasses EUs regelverk Vennligst rett disse prøvene! Det bar rett i fengsel De spiste en deilig rett av grønnsaker. han var rett utenfor, rett nå Slikt skjer rett som det er. straight correct, right right court law grade, correct directly, straight meal, dish just må omskrives

Flertydighet på setningsnivå 18 Jeg spiser sushi med pinner. Jeg spiser sushi med laks.

Entydiggjøring 19 Vi mennesker tolker språklige uttrykk basert på delt bakgrunnskunnskap og gjensidige forventninger i en gitt kontekst. Språkforståelse handler mye om entydigjøring. Språkteknologi, og IN1140, handler i stor grad om strategier for hvordan maskiner kan takle dette. Men først må vi lære mer om det lingvistiske, for å forstå problemene og dataene bedre!

Obligatoriske innleveringer 20 3 obliger. Oblig 2 og 3 har to deler hver (a + b). Dvs. 5 innleveringer tilsammen: 1, 2a + 2b, 3a + 3b. Alle obligene må bestås for å kunne ta eksamen. Ingen omlevering. Poengsystemet Man kan oppnå opptil 100 poeng per innlevering For å bestå kreves minst 100 poeng (av 200 mulige) for hver av oblig 2(a+b) og 3(a+b), og 50 poeng for oblig 1. Eksempel: 37 poeng på 2a 68 poeng på 2b = 105 poeng på oblig 2 (= bestått).

Mer om obligene 21 Absolutte frister: Utsettes kun ved egenmelding (opptil 3 dager) eller legeerklæring. Kopiering/plagiat godtas ikke. Sett deg inn i reglene. Husk at hvis du distribuerer løsningsforslaget ditt på nett (f.eks via Github), kan du bidra til juks. Styr unna. Benytt deg av gruppeundervisningen, og planlegg tiden din. Tidsregnskap: Arbeidsinnsats (minimum): 37,5 / 3 = 12,5 timer Etter forelesning+gruppe: 9,5 timer Konkurranse: den/de som får flest poeng tilsammen på obligene gjennom semesteret får en premie (overraskelse)!

Eksamen 22 Skriftlig (digital) eksamen på fire timer 15. desember kl. 14:30 Pensumlitteratur + forelesningsnotater NB! Ikke en programmeringseksamen. Fokus på teoretiske konsepter.