INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Like dokumenter
INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #2

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1

IN1140: Introduksjon til språkteknologi. Forelesning #1

INF2820 Datalingvistikk V2016. Jan Tore Lønning

INF2820 Datalingvistikk V2017 Forelesning 1.1, 16.1 Jan Tore Lønning

INF2820 Datalingvistikk V2015. Jan Tore Lønning

INF2820 Datalingvistikk V2018 Forelesning 1 del 1, 15. jan. Jan Tore Lønning

INF2820 Datalingvistikk V2014. Jan Tore Lønning

INF1820: Oppsummering

INF1820 INF Arne Skjærholt INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF INF1820 INF1820. Her kan jeg godt si litt om meg selv. Arne Skjærholt

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

IN1140: Introduksjon til språkteknologi. Forelesning #10

IN1140: Introduksjon til språkteknologi. Forelesning #10

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

1/18/2011. Forelesninger. I dag: Obligatoriske oppgaver. Gruppeundervisning. Jan Tore Lønning & Stephan Oepen

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les

LF - Eksamen i INF1820

INF109 (kun et utvalg av kommentarene er med i denne rapporten)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Årlig programevaluering Informatikk: Språkteknologi, torsdag 7. februar 2019

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Ny 0 0,0% Distribuert 64 66,7% Noen svar 1 1,0% Gjennomført 31 32,3% Frafalt 0 0,0% I alt ,0%

Velkommen til. INF våren 2017

INF1800 LOGIKK OG BEREGNBARHET

Velkommen til. IN1010 Objektorientert programmering Våren 2018

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

En snarvei til INF2100

INF101 (kun et utvalg av kommentarene er med i denne rapporten)

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF1800 Forelesning 4

INF2820 Datalingvistikk V Gang Jan Tore Lønning

INF2820 Datalingvistikk V2011. Jan Tore Lønning & Stephan Oepen

INF1800 LOGIKK OG BEREGNBARHET

INF 2820 V2015: Obligatorisk innleveringsoppgave 3

Velkommen til MAT1030!

MAT1030 Diskret Matematikk

Studieplan 2016/2017

INF112(kun et utvalg av kommentarene er med i denne rapporten)

IN1140: Introduksjon til språkteknologi. Forelesning #3

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF 2820 V2016: Innleveringsoppgave 3 del 1

Introduksjon til 3290

INF2820 Datalingvistikk V Gang 19.3 del 1 Jan Tore Lønning

INF Introduksjon til design, bruk, interaksjon Introduksjon

Programmering (DAPE/ITPE 1400) Høgskolen i Oslo og Akershus Høst 2017 Henrik Lieng

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

IN1010 Objektorientert programmering Våren 2019

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

INF2820 Datalingvistikk V Gang Jan Tore Lønning

IN1140: Introduksjon til språkteknologi. Forelesning #7

Kort om kursene INF1100 og MAT-INF1100L

Dagens plan INF3170 Logikk. Obliger og eksamen. Forelesning 1: Introduksjon, mengdelære og utsagnslogikk. Christian Mahesh Hansen og Roger Antonsen

INF1820: Introduksjon til språk-og kommunikasjonsteknologi

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Innhold uke 8. Objekter: Bruk og intern organisering. Beskjeder: Oblig 1 6. Beskjeder: Oblig 7 (og 8)

TMA4100 Matematikk 1, høst 2013

Velkommen til INF115

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

IN1140: Introduksjon til språkteknologi. Forelesning #13

INF2810: Funksjonell Programmering. Oppsummering og eksamensforberedelser

TDT4110 Informasjonsteknologi grunnkurs: Uke 48 Oppsummering/Spørretime. Professor Alf Inge Wang

Hvordan er arbeidsmengden i forhold til omfanget i studiepoeng?

TDT4127 Programmering og Numerikk

INF2820 Datalingvistikk V2012. Jan Tore Lønning & Stephan Oepen

TDT4105 Informasjonsteknologi, grunnkurs

TDT4110 Informasjonsteknologi, grunnkurs

Vedtatt av Styret ved NTNU , med endringer vedtatt av Fakultet for samfunnsvitenskap og teknologiledelse senest

INF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme, del 2

Nye spanskemner ved NTNU studieåret 2016/2017

INF2810: Funksjonell Programmering. En Scheme-evaluator i Scheme, del 2

INF1820 V2014 Oppgave 3b CFGer og semantikk

Hjemmeeksamen 1 i INF3110/4110

UNIVERSITETET I OSLO

INF3170 Forelesning 1

MAT1030 Diskret Matematikk

FRANSK. Pensumhefte vår Årsstudium Bachelorgrad Mastergrad Andre emner/perspektivemner

Kort om kursene IN1900, MAT-IN1105, IN-KJM1900

Ifis forslag til reviderte studieprogrammer

Fagevaluering FYS Kvantemekanikk

Transkript:

INF1820: Introduksjon til språk-og kommunikasjonsteknologi Første forelesning Lilja Øvrelid 16 januar, 2017 1

Praktisk

Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager 10:15-12 Datastue Fortress 12:15-14 Datastue Fortress Obligdeadline: fredag kl 23:57 2

Hvor og når Tidspunkt Forelesning: Mandag 12:15-14, Seminarrom Caml Grupper: Onsdager 10:15-12 Datastue Fortress 12:15-14 Datastue Fortress Obligdeadline: fredag kl 23:57 Tidsregnskap: Arbeidsmengde: 37,5 / 3 = 12,5 timer Etter forelesning+gruppe: 9,5 timer 2

Obliger 3 obligatoriske oppgaver, hver delt i to deloppgaver (1a + 1b, 2a + 2b, 3a + 3b) Poengsystem: 100 mulige poeng per deloppgave For å gå opp til eksamen: bestå alle tre obligatoriske oppgaver akkumulere min 100 poeng for hver obligatoriske oppgave 3

Obliger 3 obligatoriske oppgaver, hver delt i to deloppgaver (1a + 1b, 2a + 2b, 3a + 3b) Poengsystem: Eksempel 100 mulige poeng per deloppgave For å gå opp til eksamen: bestå alle tre obligatoriske oppgaver akkumulere min 100 poeng for hver obligatoriske oppgave Oblig 1a: 40 poeng (av 100 mulige) Oblig 1b: minimum 60 poeng 3

Obliger Absolutte frister Kopiering/plagiat Tidsrammer og planlegging Viktighet av gruppeundervisningen 4

Pensumlitteratur An Introduction to Language (8th Edition) by Victoria A. Fromkin, Robert Rodman, and Nina Hyams Utvalgte deler (ca 5 kapitler) 5

Pensumlitteratur Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (2nd edition) by Daniel Jurafsky and James H. Martin Utvalgte deler 6

Pensumlitteratur Natural Language Processing with Python by Steven Bird, Ewan Klein and Edward Loper (URL) Utvalgte deler Online versjon 7

Eksamen Skriftlig (digital) eksamen på fire timer 8 juni kl 14:30 Pensumlitteratur + forelesningsnotater NB! Ikke en programmeringseksamen 8

Suksessoppskrift Emnesiden: timeplan, pensum, lesehenvisninger, beskjeder etc. Lesehenvisninger: forbered deg til forelesning Still spørsmål Gruppetimer: forbered deg delta aktivt gjør oppgaver (også de ikke-obligatoriske) Benytt deg av medstudentene dine 9

Suksessoppskrift Emnesiden: timeplan, pensum, lesehenvisninger, beskjeder etc. Lesehenvisninger: forbered deg til forelesning Still spørsmål Gruppetimer: forbered deg delta aktivt gjør oppgaver (også de ikke-obligatoriske) Benytt deg av medstudentene dine lese forstå gråte 9

Kursoversikt

10

Emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til praksis. Vi vil ta for oss morfologisk, syntaktisk, samt noe semantisk analyse av naturlige språk, formell språkteori og korpusbaserte metoder. Studentene vil få et første møte med noen datalingvistiske applikasjonsområder. 11

Tverrfaglighet Kunnskap om språk oppbygning av menneskers språk analysere språklig materiale mulighetene for få datamaskiner til å forstå språk flertydighet 12

Tverrfaglighet Kunnskap om teknologi kunne programmere algoritmer for språkteknologiske oppgaver lage små og mellomstore systemer for å løse språkteknologiske oppgaver 13

Introduksjon til lingvistikk Hva vil det si å beherske et språk? Hva vet vi om menneskelig språkprosessering? Hva mener vi med at språket er uendelig? Hva utgjør språkets byggeklosser? Hvordan settes disse sammen til meningsbærende enheter? 14

Introduksjon til språkteknologi Hvordan kan vi formalisere vår kunnskap om språk slik at den kan benyttes i automatiske systemer? Hvordan kan regulære uttrykk brukes til å beskrive språklige fenomener? Hvordan kan vi tildele ordklasser automatisk og hvordan evaluerer vi systemene våre? Hvordan kan vi automatisk gruppere ord til fraser? Hvordan kan vi automatisk skille mellom ulike betydninger av et ord? 15

Etter å ha tatt INF1820, kan du...... skrive enkle programmer for å manipulere store tekstmengder i Python 16

Etter å ha tatt INF1820, kan du...... skrive enkle programmer for å manipulere store tekstmengder i Python... trekke ut alle ord i en tekst (oblig1), dvs. utføre såkalt tokenisering 16

Etter å ha tatt INF1820, kan du...... skrive enkle programmer for å manipulere store tekstmengder i Python... trekke ut alle ord i en tekst (oblig1), dvs. utføre såkalt tokenisering... lage frekvenslister (oblig2) Hva er årets ord? 16

Etter å ha tatt INF1820, kan du...... beregne sannsynligheten for ord i en viss kontekst (Oblig 2) Eksempel ja takk, det vil jeg... gjerne? hjerne? 17

Etter å ha tatt INF1820, kan du...... automatisk merke opp ( tagge ) en tekst med ordklasser (Oblig2/Oblig3): Eksempel After the social browser launched two weeks earlier, talk about it exploded. 18

Etter å ha tatt INF1820, kan du...... automatisk merke opp ( tagge ) en tekst med ordklasser (Oblig2/Oblig3): Eksempel After the social browser launched two weeks earlier, talk about it exploded. 18

Etter å ha tatt INF1820, kan du...... automatisk merke opp ( tagge ) en tekst med ordklasser (Oblig2/Oblig3): Eksempel After the social browser launched two weeks earlier, talk about it exploded. 1 After 2 the 3 social 4 browser 5 launched 6 two 7 weeks 8 earlier 9, 10 talk 11 about 12 it 13 exploded 18

Etter å ha tatt INF1820, kan du...... automatisk merke opp ( tagge ) en tekst med ordklasser (Oblig2/Oblig3): Eksempel After the social browser launched two weeks earlier, talk about it exploded. 1 After after 2 the the 3 social social 4 browser browser 5 launched launch 6 two two 7 weeks week 8 earlier earlier 9,, 10 talk talk 11 about about 12 it it 13 exploded explode 18

Etter å ha tatt INF1820, kan du...... automatisk merke opp ( tagge ) en tekst med ordklasser (Oblig2/Oblig3): Eksempel After the social browser launched two weeks earlier, talk about it exploded. 1 After after IN 2 the the DT 3 social social JJ 4 browser browser NN 5 launched launch VVD 6 two two JJ 7 weeks week NN 8 earlier earlier RBR 9,,, 10 talk talk NN 11 about about IN 12 it it PP 13 exploded explode VVD 18

Etter å ha tatt INF1820, kan du...... forklare hva som gir opphav til flertydighet i språk og illustrere forskjeller, feks ved hjelp av syntaktiske trær (oblig3): The girls saw Bill on the beach with a telescope 19

Etter å ha tatt INF1820, kan du...... implementere (deler av) en enkel maskinlæringsalgoritme (Naive Bayes)... og bruke den til automatisk betydningsklassifisering SKIM the pages for a clearer insight: Reading She SKIMS through the novel which seems to fascinate them: Reading Remove the vanilla pod, SKIM the jam, and let it cool: Removing We SKIMMED across the surface of that sodding lake whilst all around us gathered the dark hosts of hell: Self Motion 20

Hva er lingvistikk?

Det vitenskapelige studiet av menneskelige språk Regler, systemer og prinsipper i språk hva har ulike språk til felles? og hvordan varierer de? hvordan fungerer språk? hvordan forandrer språk seg over tid? hvordan tilegner barn seg språk? hvordan er språk representert i hjernen? 21

Lingvistikk Vitenskapelig studie av språk Menneskelig språk 22

Lingvistikk Vitenskapelig studie av språk Menneskelig språk Hva kjennetegner lingvistisk kunnskap? Ubevisst (tacit knowledge) Men det er mye kunnskap (know-how vs know-that) 22

Lingvistisk kunnskap Kunnskap om lyd: lydsystemet for et språk rekkefølgen på lyder 23

Lingvistisk kunnskap Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning odun asa wartawan ciel 24

Lingvistisk kunnskap Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning odun : tre tyrkisk asa wartawan ciel 24

Lingvistisk kunnskap Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning odun : tre tyrkisk asa : morgen japansk wartawan ciel 24

Lingvistisk kunnskap Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning odun : tre tyrkisk asa : morgen japansk wartawan : reporter indonesisk ciel 24

Lingvistisk kunnskap Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning odun : tre tyrkisk asa : morgen japansk wartawan : reporter indonesisk ciel : himmel fransk 24

Lingvistisk kunnskap Kunnskap om ord: Viss lydsekvens korresponderer til et visst konsept, eller betydning Vilkårlig (arbitrær) kobling mellom form og betydning odun : tre tyrkisk asa : morgen japansk wartawan : reporter indonesisk ciel : himmel fransk Konvensjonell sammenheng: må læres 24

Lingvistisk kunnskap 25

Lingvistisk kunnskap Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig 26

Lingvistisk kunnskap Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning 26

Lingvistisk kunnskap Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå 26

Lingvistisk kunnskap Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. 26

Lingvistisk kunnskap Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv. 26

Lingvistisk kunnskap Kunnskap om hvordan ord settes sammen til setninger Mengden av mulige setninger er uendelig Dette er en setning Dette er en setning som jeg skriver akkurat nå Dette er en setning som jeg tror at jeg skriver akkurat nå Dette er en setning som Fredrik mener at jeg tror at jeg skriver akkurat nå osv. Dette er en kjedelig setning Dette er en kjedelig kjedelig setning Dette er en kjedelig kjedelig kjedelig setning osv. Evne til å forstå og skape nye setninger, språkbruk er kreativ 26

Lingvistisk kunnskap Grammatikalitet Norske sykehus bruker for mye antibiotika *Sykehus norske bruker for mye antibiotika *Norske sykehus for mye antibiotika bruker *Norsk sykehus bruker for mye antibiotika 27

Lingvistisk kunnskap Grammatikalitet Norske sykehus bruker for mye antibiotika *Sykehus norske bruker for mye antibiotika *Norske sykehus for mye antibiotika bruker *Norsk sykehus bruker for mye antibiotika Kunnskap om regler for hvordan man danner setninger i et språk en endelig mengde regler, med et endelig vokabular en uendelig mengde setninger Grammatikalitetsbedømninger 27

Lingvistiske nivåer Fonetikk/fonologi: lyder ord Morfologi: morfemer ord Syntaks: ord fraser, fraser setninger Semantikk: ord betydning, setninger betydning 28

Hva vi vet om språk Der vi finner mennesker, finner vi språk 29

Hva vi vet om språk Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk 29

Hva vi vet om språk Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid 29

Hva vi vet om språk Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig 29

Hva vi vet om språk Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig Alle menneskelige språk bruker endelig (finitt) mengde lyder og ord til å danne uendelig mengde mulige setninger 29

Hva vi vet om språk Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig Alle menneskelige språk bruker endelig (finitt) mengde lyder og ord til å danne uendelig mengde mulige setninger Alle språk kan uttrykke negasjon, spørsmål, gi kommandoer, snakke om fortid/framtid, hypotetiske situasjoner 29

Hva vi vet om språk Der vi finner mennesker, finner vi språk Det finnes ingen primitive språk Alle språk forandrer seg over tid Forholdet mellom lyd og betydning er (stort sett) vilkårlig Alle menneskelige språk bruker endelig (finitt) mengde lyder og ord til å danne uendelig mengde mulige setninger Alle språk kan uttrykke negasjon, spørsmål, gi kommandoer, snakke om fortid/framtid, hypotetiske situasjoner Ethvert normalt barn er i stand til å lære morsmålet sitt 29

Lingvistiske disipliner 30