INF1820: Applikasjoner
|
|
- Marta Brekke
- 8 år siden
- Visninger:
Transkript
1 Arne Skjærholt 24. april Arne Skjærholt 24. april
2 Information extraction Information extraction Grovt sett: Hente ut en eller annen type informasjon fra en tekst. Chunking er et eksempel på dette, men det er andre typer IE også. Information extraction
3 Information extraction Named Entity Recognition [ facility The Washington Monument] is the most prominent structure in [ gpe Washington, D.C.] and one of the city s early attractions. It was built in honor of [ person George Washington], who led the country to independence and then became its first President. Finne og markere opp alle referanser til alle egennavn i teksten, som regel også med typen entitet. Vanlige typer er: organisation, person, location, date, time, money, facility, GPE (geo-political entity). Named Entity Recognition [ facility The Washington Monument] is the most prominent structure in [ gpe Washington, D.C.] and one of the city s early attractions. It was built in honor of [ person George Washington], who led the country to independence and then became its first President.
4 Information extraction En åpenbar måte å løse dette på er å ha en stor liste med alle stedsnavn i (gazetteer på engelsk). Problemet er at hvis man skal ha en skikkelig dekningsgrad vil man fort få problemer med å luke ut falske positiver: mange stedsnavn er også vanlige ord. Et annet problem er at de må oppdateres eksplisitt for å håndtere nye navn, og navn kan inneholde andre navn når ting er oppkalt etter personer.
5 Information extraction JFK Hva slags named entity refererer dette til? John F. Kennedy, sønnen hans John F. Kennedy Jr, flyplassen i New York, en film av Oliver Stone. Et annet problem er metonymi. I stedet for å bruke navnet på noe snakker vi om noe som er nært tilknyttet det. Washington for det amerikanske statsapparatet, Westminister for det britiske, Det hvite hus for den amerikanske presidenten, Hollywood for den amerikanske filmindustrien. JFK
6 Information extraction built O in O the O honor O of O George B_pers Washington I_pers, O who O led O Den vanligste måten å løse dette på er en avart av ordklassetagging. Hvert ord får en tagg B, I eller O (Begin, Inside, Outside), som angir hvor chunkene starter og hvor lange de er, pluss kategorien. I tillegg til ordformen på ordet vi ser på dekoreres hvert ord men en mengde andre trekk: lemma, ordklasse, chunk-kategori, finnes det i en navneliste, omriss (små bokstaver, store bokstaver, starter med stor bokstav). De beste NER-systemene er en kombinasjon av lister, regler og statistiske metoder. De oppnår 92% treffsikkerhet for person og location, og 84% for organisation. built O in O the O honor O of O George B_pers Washington I_pers, O who O led O......
7 IR: Automatisk finne de dokumentene som er mest relevante for en gitt søkestreng. Et stort fagfelt, det er et eget kurs (INF3800) som handler om dette. Grunnsteinen i alle moderne søkesystemer er vektorrommodellen.
8 Dokument Det vi leter etter. Som regel et tekstdokument (webside, Word-fil, PDF,... ), men kan også være multimediainnhold. Vi begrenser oss til tekst her. Dokument
9 Samling Collection på engelsk. Mengden dokumenter vi leter etter ting i. Hele internett (nesten) for Google, eller alle dokumentene internt i en bedrift. Samling
10 Term Elementer som forekommer i dokumentsamlingen. Som regel ord, men kan også være større enheter som NEer. Term
11 Søkestreng Query på engelsk. Inndataene fra brukeren som leter etter noe. Representerer brukerens informasjonsbehov med en mengde termer. Søkestreng
12 Doc1: Osama bin Laden, mastermind, attack, American soil, hunted, world, killed, firefight, United States, forces, Pakistan, President Obama, announced, Sunday Doc2: story, love, blood, samurai, movie, 13 assassins, man, courtyard, mask, shirt, blade, hand, director, Takasji Miike, showing, tale, revenge, liberation, stakes Doc3: University, Delaware, year, demoting, men s, track, cross-country, teams, college, sports Vi representerer dokumentene som en uordnet liste av ord. Dette begrenser naturlig nok hvilke nyanser vi er i stand til å fange opp en del, men det er ganske mye som fungerer like vel. Doc1: Osama bin Laden, mastermind, attack, American soil, hunted, world, killed, firefight, United States, forces, Pakistan, President Obama, announced, Sunday Doc2: story, love, blood, samurai, movie, 13 assassins, man, courtyard, mask, shirt, blade, hand, director, Takasji Miike, showing, tale, revenge, liberation, stakes Doc3: University, Delaware, year, demoting, men s, track, cross-country, teams, college, sports
13 Doc2: story, love, blood, samurai, movie, 13 assassins, man, courtyard, mask, shirt, blade, hand, director, Takasji Miike, showing, tale, revenge, liberation, stakes story love blood samurai movie 13 assassins man Hvert dokument er så en vektor av frekvenser, der hvert element i vektoren representerer et spesifikt ord. Doc2: story, love, blood, samurai, movie, 13 assassins, man, courtyard, mask, shirt, blade, hand, director, Takasji Miike, showing, tale, revenge, liberation, stakes story love blood samurai movie 13 assassins man
14 På denne måten representerer vi hvert dokument som et punkt i rommet (et høyere ordens rom R n der n er antall ord i samlingen, hvis vi skal være flotte med terminologien), og vi kan se på likhet mellom dokumenter som avstand i rommet.
15 sim( p, q) = i p i q i i p2 i i q2 i Det vanligste målet på likhet er cosine similarity: cosinus av vinkelen mellom vektorene. Cos går fra 1 for to vektorer som ligger inntil hverandre (kolineære) til 0 når vinklene står vinkelrett på hverandre. Dermed vil to dokumenter som har vektorer tett ved hverandre ha høyere likhet enn dokumenter lenger fra hverandre. Søket gjør vi så ved å representere søkestrengen som en vektor i samme rom som dokumentsamlinga, og dokumentene kan vi dermed rangere etter hvor like de er søkevektoren. sim( p, q) = i p i q i i p2 i i q2 i
16 idf t = log N n t Men ikke alle termer er like relevante. Stort sett alle engelske dokumenter med mer enn 10 ord vil inneholde the, og andre funksjonsord vil dukke opp relativt ofte, uten at det har noe videre å si for innholdet i dokumentet. Vi vil derfor at relevante ord skal vektes mer enn irrelevante ord. En vanlig måte å gjøre dette på er å bruke vekten idf: inverse document frequency. Document frequency (df) er antall dokumenter som inneholder en gitt term t. Vi tar så antall dokumenter N og deler på antallet dokumenter som inneholder t, n t. Til slutt tar vi logaritmen av det hele, slik at det skal skalere bra til store antall dokumenter. idf t = log N n t
17 term df t idf t car auto insurance best Dette er tall fra Reuters collection, en samling av over 800 tusen dokumenter, alle fra Reuters newswire. Her ser vi at sjeldne ord blir vektet mere, men samtidig tar ikke et veldig sjeldent ord som auto fullstendig overhånd, siden vi tar logaritmen. term df t idf t car auto insurance best
18 v t = tf t idf t Verdien for en term t i vektoren blir nå antall ganger termen forekommer i dokumentet, tf t, ganget med idf. Da vil termer som er vanlige uavhengig av dokument få lavere verdi og dermed gi lavere utslag enn sjeldne termer med høye verdier. Dette kaller vi tf-idf. v t = tf t idf t
19 Stemming Det er ofte lurt å slå sammen forskjellige bøyde former av ett ord til en enkelt form i vektorrommodellen. Dette er en avart av lemmatisering, oppgaven å finne lemmaet (oppslagsformen til et ord), men siden det ikke er så stort fokus på å finne lemmaet, men heller en felles rot for bøyde former av samme ord og avledninger kaller vi det stemming. Dette gjør at vi samler like ting i en samlet kategori som får litt større vekt enn med mange små kategorier med en eller to i hver. Stemming
20 Stopp-ord Noen ord, typisk ord som artikler og preposisjoner, er så vanlige at vi bare fjerner dem helt fra modellen. De er mer til skade enn til hjelp. Men husk at ikke alle oppgaver har godt av stoppordfjerning. I enkelte tilfeller er de faktisk nyttige. Stopp-ord
21 Maskinoversettelse Maskinoversettelse er stort sett det navnet tilsier: Hvordan kan vi, automatisk, oversette en tekst fra ett språk til et annet? Det er mange systematiske forskjeller mellom språk, som kan håndteres. Men det er også veldig mange ting som gjør det veldig vanskelig. Alle språk har homonymi og polysemi, men de har det sjelden på de samme stedene. Og det er også sånn at språk deler opp verden i ord på forskjellige måter. Engelsk wall kan tilsvare både vegg og mur på norsk, og norsk stol kan tilsvare begge av fransk chaise og fauteuil. Av og til er det sånn at kulturelle forskjeller gjør det vanskelig å oversette. Japansk har ikke noen enkel oversettelse av engelsk privacy, ganske enkelt fordi begrepet om det private ikke fungerer på samme måte i Japan (lexical gaps). Og til slutt kan vi nevne faste ord og uttrykk: gå bort er ikke nødvendigvis best oversatt med go away på engelsk.
22 Maskinoversettelse Vi har tre hovedmetoder for maskinoversettelse: direkte (ord-for-ord), transfer, og interlingua.
23 Maskinoversettelse Direkte Vi går gjennom teksten ord for ord og oversetter underveis, og gjør relativt lite prosessering som morfologisk analyse. Hovedsaklig baserer vi oss på et stort tospråklig leksikon og enkle transformasjonsregler. Denne metoden har store problemer med å håndtere ulik leddstilling i forskjellige språk. The green witch is at home this week Denne uka er den grønne heksa hjemme, eller systematiske forskjeller, som at japansk har grunnleggende ordstilling SOV i stedet for SVO. Direkte
24 Maskinoversettelse Transfer Vi baserer oss på at forskjellene er systematiske. Vi analyserer teksten syntaktisk og har en oversikt over hvordan de forskjellige syntaktiske reglene skal oversettes fra kildespråket til målspråket, og et annet sett med regler som oversetter ord og faste uttrykk. En del systemer bruker også WSD. Dette vil også kunne håndtere preposisjons-seleksjon for verb. Transfer
25 Maskinoversettelse Interlingua Vi analyserer input til en språkuavhengig form (basert på logikk eller semantiske roller, for eksempel), og genererer en setning i målspråket fra den språkuavhengige representasjonen. Interlingua
26 Maskinoversettelse Tidlige systemer var regelbaserte, og med mye fokus på selve oversettelsesprosessen. Men de siste årene er det blitt mer fokus på resultatet, gjennom statistiske metoder for oversettelse. Statistisk maskinoversettelse er basert på følgende formel: ê = argmax e E P (f e)p (f ). Den siste biten finner vi med en språkmodell.
27 Maskinoversettelse Ut i fra et stort parallelt korpus lærer vi hvor ofte hvert engelsk ord tilsvarer forskjellige franske ord: P (f e). Sannsynlighetene får vi gjennom ordlenkinger (alignments).
INF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjortende forelesning Lilja Øvrelid 7 mai, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 27 april, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker vi har sett på
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 8 mai, 2017 1 Språkteknologiske applikasjoner Mange språkteknologiske applikasjoner kombinerer teknikker vi har
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Tolvte forelesning Lilja Øvrelid 8 mai, 2017 1 Språkteknologiske applikasjoner Mange språkteknologiske applikasjoner kombinerer teknikker vi har
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Lilja Øvrelid 27 april, 2012 1 / 48 SPRÅKTEKNOLOGISKE APPLIKASJONER Mange språkteknologiske applikasjoner kombinerer teknikker vi har sett på
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #11
IN1140: Introduksjon til språkteknologi Forelesning #11 Samia Touileb Universitetet i Oslo 08. november 2018 Beregning av poeng og bestått/ikke-bestått for oblig er 2 Vi kommer til å operere med en viss
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #11
IN1140: Introduksjon til språkteknologi Forelesning #11 Samia Touileb Universitetet i Oslo 08. november 2018 Beregning av poeng og bestått/ikke-bestått for oblig er 2 Vi kommer til å operere med en viss
DetaljerINF1820: Oppsummering
Arne Skjærholt 8. mai Arne Skjærholt 8. mai Kurset gir en innføring i lingvistisk teori og relaterer denne til språkteknologiske problemområder, metoder og applikasjoner. Fokus er på å koble teori til
DetaljerLF - Eksamen i INF1820
LF - Eksamen i INF820 INF820 Eksamen vår 207 Hjelpemidler Ingen. Flervalgsoppgaver I oppgave og 6 får man 5 poeng for riktig svar og 0 poeng for galt svar. I oppgave 0 får du 2 poeng for hvert riktig svar
DetaljerINF1820: Ordklasser 2014-02-13. INF1820: Ordklasser. Arne Skjærholt. 13. februar. INF1820: Ordklasser. Arne Skjærholt. 13. februar
Arne Skjærholt 13. februar Arne Skjærholt 13. februar Ordklasser Ordklasser Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva slags
DetaljerINF1820 2013-04-12 INF1820. Arne Skjærholt INF1820. Dagens språk: Russisk. dyes yataya l yektsiya. Arne Skjærholt. десятая лекция
Arne Skjærholt десятая лекция Dagens språk: Russisk. dyes yataya l yektsiya Arne Skjærholt десятая лекция N,Σ,R,S Nå er vi tilbake i de formelle, regelbaserte modellene igjen, og en kontekstfri grammatikk
DetaljerInformasjonsgjenfinning
INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 18. september Outline 1 Hva er IR? Tradisjonell evaluering Invertert indeks 2 Rangering Evaluering av rangering 3 Grunnleggende egenskaper Vektorer
DetaljerOrdklasser Inndelingen ORDKLASSEINNDELINGEN
Ordklasser Inndelingen ORDKLASSEINNDELINGEN Hvorfor lære om ordklasser? Viktig del av den grammatiske språkbeskrivelsen Forstå bøyningsmåter skrive korrekt Innsikt i hvordan norsk skiller seg fra andre
DetaljerSammendrag INF5820 H2008. Jan Tore Lønning. 1. oktober. Institutt for Informatikk Universitetet i Oslo
INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 1. oktober Outline 1 2 3 4 5 Outline 1 2 3 4 5 Hva? En forkortet versjon Få med det viktigste Tilpasset: Brukere Formål Varianter Ulike formål
DetaljerTDT4117 Information Retrieval - Autumn 2014
TDT4117 Information Retrieval - Autumn 2014 Assignment 1 Task 1 : Basic Definitions Explain the main differences between: Information Retrieval vs Data Retrieval En samling av data er en godt strukturert
DetaljerUNIVERSITETET I OSLO
UIVERSITETET I OSLO et matematisk-naturvitskapelige fakultet Eksam i: IF1820 Introduksjon til språk- og kommunikasjonsteknologi Eksamsdag: 17. juni 2016 Tid for eksam: 14.30 18.30 Oppgavesettet er på 6
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #13
IN1140: Introduksjon til språkteknologi Forelesning #13 Samia Touileb Universitetet i Oslo 22. november 2018 Vinnerne av obligkonkurransen 2 De har scoret flest oblig-poeng igjennom semesteret (av maksimalt
DetaljerDefinisjonene og forklaringene i denne presentasjonen er hentet fra eller basert på kap. 1 (Kristoffersen: «Hva er språk?
Definisjonene og forklaringene i denne presentasjonen er hentet fra eller basert på kap. 1 (Kristoffersen: «Hva er språk?») og 13 (Ryen: «Fremmedspråksinnlæring») i pensumboka SPRÅK. EN GRUNNBOK, Universitetsforlaget
DetaljerVurdering FOR læring - tilbakemeldinger og bevis på læring
Vurdering FOR læring - tilbakemeldinger og bevis på læring Hamar 04.02.13 v/ Line Tyrdal Feedback is one of the most powerful influences on learning and achievement, but this impact can be either positive
DetaljerHMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo
INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Sjette forelesning Arne Skjærholt 25 januar, 2012 SIST GANG Forrige gang: Alle rare ordene Alle rare morfene Nå: Morfologi med datamaskin (computational
DetaljerMer om WSD Ordlikhet. Ordlikhet INF5820 H2008. Jan Tore Lønning. Institutt for Informatikk Universitetet i Oslo. 17. september
INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 17. september Outline 1 Utfyllende om glatting Andre WSD-metoder Bootstrapping 2 Samforekomstvektor Kontekstassosiasjon Vektorlikhet Glatting
DetaljerFå maksimalt utbytte av WordFinder! Oppstartsguide med nyttige råd og tips.
Få maksimalt utbytte av WordFinder! Oppstartsguide med nyttige råd og tips. Logg inn på WordFinder Brukere med WordFinder-konto: Logg inn på den personlige WordFinder-kontoen din Hvis du allerede ha en
DetaljerOver oppslagsord Over uttrykk på alfabetisk plass Britisk og amerikansk engelsk Dekker hverdagsspråk, slang og formelt språk Fagord
Generert 19.05.2017 Over 100 000 oppslagsord Over 70 000 uttrykk på alfabetisk plass Britisk og amerikansk engelsk Dekker hverdagsspråk, slang og formelt språk Fagord fra yrkesfaglige utdanningsprogrammer
DetaljerGrammatikk Adverb. Forteller oss noe nytt om ord eller setninger
Side 1 av 10 Tekst og filosofiske spørsmål: Øyvind Olsholt Sist oppdatert: 20. november 2003 Forteller oss noe nytt om ord eller setninger er navnet på en rekke småord i språket som forteller oss noe om
Detaljer3. Generell presentasjon av MT-programmet
3. Generell presentasjon av MT-programmet Innhold: 3.1. Innledning 3.2. Grensesnitt 3.3. Oversettelsesmodell og paradigmetype 3.3.1. Oversettelsesmodell 3.3.2. Paradigmetype 3.4. Målgruppe/ anvendelsesområder
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
Detaljer3rd Nordic Conference of Computational Linguistics NODALIDA 1981 175
175 T o v e F j e l d v i g I n s t i t u t t for p r i v a t r e t t s a v d e l i n g f o r E D B - s p 0 r s m A l N i e l s d u e l s g a t e 16 - O s l o 2 U T V I K L I N G A V E N K L E M E T O
DetaljerFagerjord sier følgende:
Arbeidskrav 2A I denne oppgaven skal jeg utføre en analyse av hjemmesiden til Tattoo Temple (http://www.tattootemple.hk) basert på lenker. Analysen er noe basert på et tidligere gruppearbeid. Hjemmesiden
DetaljerFactoid Spørsmål Svar
Grunnleggende INF5820 H2008 Institutt for Informatikk Universitetet i Oslo 25. september Outline Grunnleggende 1 Grunnleggende 2 3 4 5 Outline Grunnleggende 1 Grunnleggende 2 3 4 5 Factoide Grunnleggende
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Trettende forelesning REPETISJON Lilja Øvrelid 15 mai, 2017 1 Fra emnebeskrivelsen Kurset gir en innføring i lingvistisk teori og relaterer denne
DetaljerVurdering FOR læring - tilbakemeldinger og bevis på læring
Vurdering FOR læring - tilbakemeldinger og bevis på læring Akershus 20.03.14 v/ Line Tyrdal Feedback is one of the most powerful influences on learning and achievement, but this impact can be either positive
DetaljerNorsyg en syntaksbasert dyp parser for norsk
en syntaksbasert dyp parser for norsk Petter Haugereid petterha@hf.ntnu.no Institutt for språk- og kommunikasjonsstudier NTNU Språkteknologi ved NTNU, seminar VI, 30. november 2006 Oversikt 1 2 Oversikt
DetaljerIN2110 Obligatorisk innlevering 1a
IN2110 Obligatorisk innlevering 1a Oppsett Leveres innen fredag 15. februar kl. 23.59 i Devilry. For IN2110 har vi laget et utviklingsmiljø for Python som inneholder programvare og data for de obligatoriske
DetaljerGenerert 25.11.2017 80 000 oppslagsord Uttale for franske oppslagsord Rik på eksempler og uttrykk som viser hvordan ordene brukes i setninger Tipsrammer hjelper deg å unngå språklige fallgruver Illustrasjonsrammer
DetaljerINF INF1820. Arne Skjærholt. Negende les INF1820. Arne Skjærholt. Negende les
Arne Skjærholt egende les Arne Skjærholt egende les σύνταξις Syntaks, fra gresk for oppstilling, er studiet av hvordan vi bygger opp setninger fra ord. Pāṇini (ca. 400 år f.kr.) er den første som formulerer
DetaljerPå oppdagelsesreise etter den tapte informasjonen. Søk og søkemotorer Teoretisk gjennomgang
På oppdagelsesreise etter den tapte informasjonen Søk og søkemotorer Teoretisk gjennomgang Å finne informasjon Å finne relevant informasjon er ikke alltid like lett det kan være du får altfor mange treff
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Femtende forelesning REPETISJON Lilja Øvrelid 14 mai, 2011 1 / 68 FRA EMNEBESKRIVELSEN Kurset gir en innføring i lingvistisk teori og relaterer
DetaljerKor é termen? Presentasjon av EØS-EU-basen. Cecilie Ovrum Enhet for EØS-oversettelse, UD
Kor é termen? Presentasjon av EØS-EU-basen Cecilie Ovrum Enhet for EØS-oversettelse, UD Bakgrunn Forhandlinger i 1990 mellom EF og EFTA om et europeisk økonomisk samarbeidsområde (EØS). De deler av EF/EUs
DetaljerLast ned Å leve en drøm - Barack Obama. Last ned. Last ned e-bok ny norsk Å leve en drøm Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi
Last ned Å leve en drøm - Barack Obama Last ned Forfatter: Barack Obama ISBN: 9788202297862 Antall sider: 413 Format: PDF Filstørrelse: 22.56 Mb President Barack Obama er en av USAs mest spennende politikere.
DetaljerFlerspråklig terminologi en ressurs for digitale offentlige tjenester i EU- og EØS-området. Jon Arild Olsen
Flerspråklig terminologi en ressurs for digitale offentlige tjenester i EU- og EØS-området Jon Arild Olsen jon.olsen@nb.no Connecting Europe Facility (CEF) EUs infrastrukturprogram for transport-, energi-
DetaljerEKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (BOKMÅL) SENSURVEILEDNING
Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (BOKMÅL) SENSURVEILEDNING Faglig kontakt under eksamen:
DetaljerSnake Expert Scratch PDF
Snake Expert Scratch PDF Introduksjon En eller annen variant av Snake har eksistert på nesten alle personlige datamaskiner helt siden slutten av 1970-tallet. Ekstra populært ble spillet da det dukket opp
DetaljerINF1820 INF Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon Previously... Alle rare ordene Alle rare morfene Previously... Coming up... Morfologi med datamaskin (computational morphology) Hvordan analysere
DetaljerForsvunnet katt webside
Lesson 3 Forsvunnet katt webside All Code Clubs must be registered. Registered clubs appear on the map at codeclubworld.org - if your club is not on the map then visit jumpto.cc/18cplpy to find out what
DetaljerINF1820 INF1820 2013-02-22. Arne Skjærholt INF1820. dairoku: del 6, kougi: forelesning. Arne Skjærholt
dairoku: del 6, kougi: forelesning Arne Skjærholt 第 六 講 義 Arne Skjærholt 第 六 講 義 Ordklassene er bindeleddet mellom ordet (det morfologiske nivået) og syntaksen (setningsstrukturen). Det kan bestemme hva
DetaljerLast ned Norsk-engelsk juridisk ordbok = Norwegian- English dictionary of law - Åge Lind. Last ned
Last ned Norsk-engelsk juridisk ordbok = Norwegian- English dictionary of law - Åge Lind Last ned Forfatter: Åge Lind ISBN: 9788202281359 Antall sider: 334 Format: PDF Filstørrelse: 14.59 Mb Norsk-engelsk
DetaljerVurdering FOR læring - tilbakemeldinger og bevis på læring
Vurdering FOR læring - tilbakemeldinger og bevis på læring Akershus februar 2014 v/ Line Tyrdal Feedback is one of the most powerful influences on learning and achievement, but this impact can be either
DetaljerINF1820 INF1820 2013-02-14. Arne Skjærholt INF1820. Arne Skjærholt
Arne Skjærholt Quatrième leçon Arne Skjærholt Quatrième leçon µορφή - form λόγος - lære Morfologi er det laveste meningsbærende nivået i språk. Fonologi og fonetikk er lavere nivåer, men de er ikke meningsbærende
DetaljerEn grunnleggende innføring i bruk av ASK
En grunnleggende innføring i bruk av ASK Liten ordliste: Korrektkorpuset: Grammatisk korrekte utgaver av innlærertekstene generert på grunnlag av korreksjoner som er foreslått under feilkodingen. Kontrollkorpuset:
DetaljerFå maksimalt utbytte av WordFinder fra Mac App Store! Hurtigveiledning med nyttige råd og tips.
Få maksimalt utbytte av WordFinder fra Mac App Store! Hurtigveiledning med nyttige råd og tips. 1 Tekniske forutsetninger For WordFinder fra Mac App Store kreves følgende: Prosessor: Intel Mac OS X 10.6.6
DetaljerFagplan i engelsk 7. trinn
Fagplan i engelsk 7. trinn Uke Kompetansemål Tema Læringsmål Kriterier Forslag til I startgropa Underveis I mål Chapter 1 Stairs 7 Eleven skal kunne: beherske et ordforråd som dekker dagligdagse situasjoner
DetaljerOppgave 1. ( xφ) φ x t, hvis t er substituerbar for x i φ.
Oppgave 1 Beviskalklen i læreboka inneholder sluttningsregelen QR: {ψ φ}, ψ ( xφ). En betingelse for å anvende regelen er at det ikke finnes frie forekomste av x i ψ. Videre så inneholder beviskalklen
DetaljerHvor i All Verden? Del 2 Erfaren Scratch PDF
Hvor i All Verden? Del 2 Erfaren Scratch PDF Introduksjon Hvor i All Verden? er et reise- og geografispill hvor man raskest mulig skal fly innom reisemål spredt rundt i Europa. Dette er den andre leksjonen
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerINF1820: Introduksjon til språk-og kommunikasjonsteknologi
INF1820: Introduksjon til språk-og kommunikasjonsteknologi Fjerde forelesning Lilja Øvrelid 6 februar, 2014 OVERSIKT Såkalt endelig tilstand (finite-state) -teknologi er kjapp og effektiv nyttig for et
DetaljerLast ned Engelsk-norsk juridisk ordbok = English- Norwegian dictionary of law - Åge Lind. Last ned
Last ned Engelsk-norsk juridisk ordbok = English- Norwegian dictionary of law - Åge Lind Last ned Forfatter: Åge Lind ISBN: 9788202407087 Antall sider: 346 Format: PDF Filstørrelse:24.56 Mb Engelsk-norsk
DetaljerEKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (SENSURVEILEDNING)
Norges teknisk-naturvitenskapelige universitet Institutt for datateknikk og informasjonsvitenskap EKSAMENSOPPGAVE I FAG TDT4117 INFORMASJONSGJENFINNING (SENSURVEILEDNING) Faglig kontakt under eksamen:
DetaljerBli Kjent med Datamaskinen Introduksjon ComputerCraft PDF
Bli Kjent med Datamaskinen Introduksjon ComputerCraft PDF Introduksjon Vi begynner med å bygge en enkel datamaskin. Etter å ha brukt litt tid på å bli kjent med hvordan datamaskinen virker, bruker vi den
DetaljerSkilpadder Introduksjon Python PDF
Skilpadder Introduksjon Python PDF Introduksjon: I denne modulen skal vi lære et programmeringsspråk som heter Python. Personen som laget det kalte det opp etter sitt favorittprogrammet på TV: Monthy Pythons
DetaljerKONTROLL INSIDE MSOLUTION
KONTROLL INSIDE MSOLUTION Forandre renholdsteam eller renholdsdager på oppdrag I denne brukerveiledningen skal vi bruke bytte renholdsdager. Det skjer jo at vi bytter renholdsdager eller team på kunder.
DetaljerSyntax/semantics - I INF 3110/ /29/2005 1
Syntax/semantics - I Program program execution Compiling/interpretation Syntax Classes of langauges Regular langauges Context-free langauges Scanning/Parsing Meta models INF 3/4-25 8/29/25 Program
DetaljerFelix og Herbert Introduksjon Scratch PDF
Felix og Herbert Introduksjon Scratch PDF Introduksjon Vi skal lage et spill hvor katten Felix skal fange musa Herbert. Du styrer Herbert med musepekeren og skal prøve å unngå å bli tatt av Felix. Jo lenger
DetaljerIN1140: Introduksjon til språkteknologi. Forelesning #12
IN1140: Introduksjon til språkteknologi Forelesning #12 Lilja Øvrelid Universitetet i Oslo 15 november 2018 Tema for i dag 2 I dag Repetisjon Digital prøveeksamen Neste uke Gjennomgang av eksamensoppgave
DetaljerKrysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.
SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan
DetaljerMan samler i samme artikkel alt som gjelder samme x
Termen x I Shakespeares skriftlige produksjon forekommer rundt 30.000 ulike ord. Ordet være er et av de hyppigste i norske lovtekster. Syklus, syklusen og cyklus er egentlig samme ord. En artikkel i en
DetaljerVedlegg til veiledning til læreplan i engelsk. Se skolenettet.no/veiledninger
side 1 av 5 COPY CORRECT CHOOSE Denne aktiviteten er beskrevet med utgangspunkt i setninger. Den kan også gjennomføres med korte beskjeder. Den er en videreføring av tilsvarende aktivitet på 1. 2. trinn,
DetaljerNORSK ANDRESPRÅKSKORPUS KURSHEFTE. ASK, kurshefte Hilde Johansen (2011) 1
NORSK ANDRESPRÅKSKORPUS KURSHEFTE ASK, kurshefte Hilde Johansen (2011) 1 KURSHEFTETS INNHOLD 1. Antall ord i ulike delkorpus (testnivå og morsmål) 2. Persondata 3. Feilkoder 4. Oslo-Bergen-taggerens taggsett
DetaljerHåndbok i kjøp av oversettingstjenester
Håndbok i kjøp av oversettingstjenester Innhold Hvorfor oversette? 4 Hva er en god oversettelse? 5 Velge oversettingsbyrå 6 Tenk flerspråklig fra begynnelsen 8 Før du sender forespørselen 10 Når du kontakter
DetaljerForelesning 27. MAT1030 Diskret Matematikk. Bevistrær. Bevistrær. Forelesning 27: Trær. Roger Antonsen. 6. mai 2009 (Sist oppdatert: :28)
MAT1030 Diskret Matematikk Forelesning 27: Trær Roger Antonsen Institutt for informatikk, Universitetet i Oslo Forelesning 27 6. mai 2009 (Sist oppdatert: 2009-05-06 22:28) MAT1030 Diskret Matematikk 6.
DetaljerHåndbok. i kjøp av oversettingstjenester
Håndbok i kjøp av oversettingstjenester Innhold Hvorfor oversette? 4 Hva er en god oversettelse? 5 Hvordan velge oversetterbyrå 6 Tenk flerspråklig fra begynnelsen 8 Før du sender forespørselen 10 Når
DetaljerVurdering FOR læring - tilbakemeldinger og bevis på læring
Vurdering FOR læring - tilbakemeldinger og bevis på læring Oktober 2013 v/ Line Tyrdal Feedback is one of the most powerful influences on learning and achievement, but this impact can be either positive
DetaljerKing Kong Erfaren Scratch PDF
King Kong Erfaren Scratch PDF Introduksjon I dette spillet inspirert av historien om King Kong, skal vi se hvor lett det er å bruke grafikk som ikke allerede ligger i Scratchbiblioteket. I spillet styrer
DetaljerInnhold. Bruksanvisning for Zotero (oppdatert 11/11/2017)
Bruksanvisning for Zotero (oppdatert 11/11/2017) Zotero er et program som brukes til å samle, spare og organisere referanser bøker, bokkapittel, artikler, websider, etc. Du kan lage samlinger med referanser
DetaljerLast ned Italiensk grammatikk - Geir Lima. Last ned. Last ned e-bok ny norsk Italiensk grammatikk Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi
Last ned Italiensk grammatikk - Geir Lima Last ned Forfatter: Geir Lima ISBN: 9788245019070 Antall sider: 194 Format: PDF Filstørrelse: 21.42 Mb Dette er en enkel og oversiktlig innføring i moderne italiensk
DetaljerBygg et Hus. Steg 1: Prøv selv først. Sjekkliste. Introduksjon. Prøv selv
Bygg et Hus Introduksjon I denne leksjonen vil vi se litt på hvordan vi kan få en robot til å bygge et hus for oss. Underveis vil vi lære hvordan vi kan bruke løkker og funksjoner for å gjenta ting som
DetaljerLegg merke til at summen av sannsynlighetene for den gunstige hendelsen og sannsynligheten for en ikke gunstig hendelse, er lik 1.
Sannsynlighet Barn spiller spill, vedder og omgir seg med sannsynligheter på andre måter helt fra de er ganske små. Vi spiller Lotto og andre spill, og håper vi har flaks og vinner. Men hvor stor er sannsynligheten
DetaljerOppgave 1 (samlet 15%)
2 Du kan svare på norsk, dansk, svensk eller engelsk. Du skal svare på alle spørsmålene. Vekten på de ulike spørsmålene er oppgitt. Du bør lese gjennom hele settet slik at du kan stille spørsmål til faglærerne
DetaljerOversikt over kryptografi
Oversikt over kryptografi Richard Williamson 3. desember 2014 Oppgave 1 Person A ønsker å sende meldingen Ha det! til person B, og ønsker å benytte RSAalgoritmen for å kryptere den. Den offentlige nøkkelen
DetaljerEksamensoppgave i TDT4117 Informasjonsgjenfinning. LØSNINGFORSLAG/Sensurveiledning
Institutt for datateknikk og informasjonsvitenskap Side 1 av 5 Eksamensoppgave i TDT4117 Informasjonsgjenfinning LØSNINGFORSLAG/Sensurveiledning Faglig kontakt under eksamen: Heri Ramampiaro Tlf.: 73591459
DetaljerKRITISK BLIKK PÅ NOEN SKOLEBØKER I MATEMATIKK.
KRITISK BLIKK PÅ NOEN SKOLEBØKER I MATEMATIKK. Som foreleser/øvingslærer for diverse grunnkurs i matematikk ved realfagstudiet på NTNU har jeg prøvd å skaffe meg en viss oversikt over de nye studentenes
DetaljerSamisk disambiguering Saara Huhmarniemi Marit Julien Ilona Kivinen Pekka Sammallahti Trond Trosterud Linda Wiechetek
Samisk disambiguering 2005 Saara Huhmarniemi Marit Julien Ilona Kivinen Pekka Sammallahti Trond Trosterud Linda Wiechetek http://giellatekno.uit.no/ Tema 1.Prosjektet vårt 2.Samarbeidsprosjekt 3.Samarbeid
DetaljerArbeidsplan 5. klasse
Arbeidsplan 5. klasse Melding fra lærer UKE 1 GODT NYTTÅR! Velkommen til skolen igjen. Skolens hjemmeside: http://alesund.kommune.no/sub/ellingsoyus Ikke svømming fra nyttår. Det vil bli kroppsøving i
DetaljerInnhold. Bruksanvisning for Zotero (oppdatert 09/12/2016)
Bruksanvisning for Zotero (oppdatert 09/12/2016) Zotero er et referansehåndteringsprogram som brukes til å samle, spare og organisere referanser bøker, bokkapittel, artikler, websider, etc. Du kan lage
DetaljerINF5820 Language technological applications. H2008 Jan Tore Lønning/Stephan Oepen
INF5820 Language technological applications H2008 Jan Tore Lønning/Stephan Oepen jtl@ifi.uio.no/oe@ifi.uio.no Maskinoversettelse INF 5820 H2008 Forelesning 2 Maskinoversettelse 1. Hva er maskinoversettelse
DetaljerÅrsplan, Farnes skule
Årsplan, Farnes skule Fag: Engelsk Læreverk: Quest 6 Klasse/ trinn: 6B Skuleåret: 2018/2019 Lærar: Anette Svori Veke Kompetansemål Innhald/ Lærestoff Arbeidsmåtar Vurdering 34-40 og 43 Språklæring: identifisere
DetaljerIN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser
IN1140 H2019 gruppeoppgaver Språkmodeller og Ordklasser 1 NLTK og språkmodeller Målet med denne oppgaven er å programmere to språkmodeller (en unigrammodell og trigrammodell) ved hjelp av Python s Natural
DetaljerBursdag i Antarktis Nybegynner Scratch PDF
Bursdag i Antarktis Nybegynner Scratch PDF Introduksjon Bursdag i Antarktis er en interaktiv animasjon som forteller historien om en liten katt som har gått seg bort på bursdagen sin. Heldigvis treffer
DetaljerINF 2820 V2016: Obligatorisk innleverinsoppgave 2
INF 2820 V2016: Obligatorisk innleverinsoppgave 2 Besvarelsene skal leveres i devilry innen torsdag 17.3 kl 18.00 Filene det vises til finner du på o /projects/nlp/inf2820/scarrie o /projects/nlp/inf2820/cfg
DetaljerNy norsk dialektinnsamling gir ny forståing av grammatikken. Åshild Søfteland, Universitetet i Oslo, doktorgradsstipendiat i nordisk språkvitskap
Ny norsk dialektinnsamling gir ny forståing av grammatikken Åshild Søfteland, Universitetet i Oslo, doktorgradsstipendiat i nordisk språkvitskap Bakgrunn Doktoravhandling om språkbruken i spontan tale
Detaljernotater Gule lapper Mine Et praktisk eksempel med objekter IT2 Læreplansmål Gløer Olav Langslet Sandvika VGS
Mine notater Gløer Olav Langslet Sandvika VGS Et praktisk eksempel med objekter Vi kjenner alle til korktavlen med gule lapper. Vi henger opp en lapp for at vi selv eller andre skal huske eller bli minnet
DetaljerINF1300 Introduksjon til databaser
UNIVERSITETET I OSLO INF1300 Introduksjon til databaser Dagens tema: Grunnbegrepene i ORM Sammenheng mellom ORM og vanlig språk Elementære setninger (fakta) Faktatyper og broer Entydighetsskranker og totale
DetaljerFutureLab - Søking på nett
Oppgavehefte FutureLab - Søking på nett 3 timer kurs i søkemetodikk og -verktøy 18. oktober 2012 Kursholdere: Nora MacLaren STAR, Avdeling for IT, Universitetet i Tromsø Vibeke Bårnes KS-biblioteket, Universitetsbiblioteket,
DetaljerFå maksimalt utbytte av WordFinder! Oppstartsguide med nyttige råd og tips.
Få maksimalt utbytte av WordFinder! Oppstartsguide med nyttige råd og tips. Logg inn på WordFinder Brukere med WordFinder-konto: Logg inn på den personlige WordFinder-kontoen din Hvis du allerede ha en
DetaljerFolkets og pressens dom over regjeringen: En analyse av nettdiskusjoner og nyheter i kjølvannet av 22. juli-kommisjonens rapport
Folkets og pressens dom over regjeringen: En analyse av nettdiskusjoner og nyheter i kjølvannet av 22. juli-kommisjonens rapport Dag Petter Svendsen 02.10.2012 www.emind.no Folkets og pressens dom over
DetaljerEngelsk gruppe 2 høsten 2015
Engelsk gruppe 2 høsten 2015 I løpet av høsten har vi jobbet med disse tingene på engelsk: Tall - numbers Norsk - Norwegian Engelsk - English Mitt språk -My language 1 en one 2 to two 3 tre three 4 fire
DetaljerMAT1030 Diskret matematikk
MAT1030 Diskret matematikk Forelesning 27: Trær Dag Normann Matematisk Institutt, Universitetet i Oslo 30. april 2008 Oppsummering Mandag så vi på hvordan vi kan finne uttrykk og termer på infiks form,
DetaljerSandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I ENGELSK 8. TRINN SKOLEÅR
Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN I ENGELSK 8. TRINN SKOLEÅR 2015-2016 Periode 1: UKE 34- UKE 37; The Stage Is Yours bruke sentrale mønstre for rettskriving, ordbøying, setnings- og bygging
DetaljerOpplæring i informasjonskompetanse
Kurs 1: Å søke informasjon Ekholt 1-10-skole, ungdomstrinnet LÆRINGSMÅL Jeg kan effektivt søke etter hensiktsmessig informasjon. Jeg kan definere presise og hensiktsmessige søkeord 1 FØR DU SØKER Hva kan
Detaljer