TERMPORTALEN SOM INFRASTRUKTUR FOR TERMINOLOGI I NORGE

Størrelse: px
Begynne med side:

Download "TERMPORTALEN SOM INFRASTRUKTUR FOR TERMINOLOGI I NORGE"

Transkript

1 TERMPORTALEN SOM INFRASTRUKTUR FOR TERMINOLOGI I NORGE Termer flere steder, men likevel samlet Nordisk terminologiseminar, Oslo 17. november 2014 Gisle Andersen og Marita Kristiansen Norges Handelshøyskole

2 Presentasjonens innhold Hvorfor en nasjonal infrastruktur for terminologi? - Et utvidet perspektiv Terminologiske ressurser CLARINO, CLARA & CLARIN Termportalen Metoder for terminologihåndtering - Datamaskinell analyse, halvautomatisk termekstraksjon Igangværende initiativ - Samarbeid med «standardsettende organisasjoner» Terminologi og grenseflaten mot normering Veien videre 2

3 Hvorfor en infrastruktur for terminologi? Formål Kunnskapshåndtering - Teknologibedrifter, næringsliv, fagoversettere, forskere, off. forvaltning m.m. Undervisning - Høyere utdanning, videregående opplæring, tekniske fag Normering - Terminologiens grenseflate mot språknormering - standardisering vs. standardsettende 3

4 Om behovet for en nasjonal infrastruktur Målsetting "å utvikle nye norske termar som får brei aksept i dei respektive fagmiljøa, og å gjere eksisterande og nye termar tilgjengelige på ein slik måte at dei også blir tekne i bruk i alle aktuelle samanhengar Elektroniske termbankar er suverene som medium for å utvikla, lagra og spreia terminologi. (Mål og meining, s. 104) "Dei terminologiske metodane varierte mykje, ofte gjekk arbeidet føre seg utan dokumenterte retningslinjer, og terminologien vart ofte ikkje gjord tilgjengeleg eksternt. Dei mange ulike dataformata som var i bruk, hemma effektiv søking og nettbasert presentasjon (Mål og meining, s. 105) Et utvidet perspektiv Ikke bare terminologiske ressurser og tilgjengeliggjøring Men også kompetanse, teknologi og forskning 4

5 Terminologiske ressurser Tilgjengeliggjøring Eksisterende, ikke-tilgjengelig terminologi: termbaser og -lister Eksempler: NOT, RTT, KB-N, språkteknologisk terminologi, osv. Termportalen; merverdi knyttet til eksisterende ressurser Videreutvikling Utviding og oppdatering av eksisterende termbaser Utvikling av nytt innhold i nye og eksisterende termbaser Fagtekster Fagtekster som terminologisk grunnressurs Parallellspråklig og enspråklig Stort potensial, i liten grad utnyttet Teknologier: termekstraksjon, kollokasjonsanalyse, nyordsekstraksjon Eksempel: Sjøfartsdirektoratet, IMO-lovtekster (Skipssikkerhetsloven) 5

6 CLARINO, CLARIN og CLARA CLARINO: nasjonalt prosjekt, finansiering fra NFR - etablerer en nasjonal infrastruktur for språkressurser CLARIN: felles europeisk forskningsinfrastruktur - legger føringer for formater, arbeidsmåter, tilgangskontroll og juridiske forhold CLARA: prosjekt innen forskerutdanning, europeisk nettverk av ph.d.-kandidater og veiledere (Marie Curie Early Stage/Experience Researchers) en del av NHHs arbeidspakke i CLARINO-prosjektet - etablerer en nasjonal portal for terminologiressurser 6

7 Termportalen på terminologi.no Enhetlig tilgang til (distribuerte) ressurser 7

8 Metoder for terminologihåndtering: status Per i dag gode på tilgjengeliggjøring - termbaseteknologi - konverteringsalgoritmer - felles formater og standarder (f.eks. TBX) utvikling av nytt innhold - begrepsanalyse - definisjonsskriving Betydelig potensial for bedre å utnytte nye teknologier som - parallellspråklig og enspråklig maskinell analyse - termekstraksjon - kollokasjonsanalyse - nyordsekstraksjon 8

9 Metoder for terminologihåndtering Effektivt terminologiarbeid forutsetter en forskningsbasert infrastruktur parallellspråklige fagtekster (f.eks. engelsk/norsk) - parallellstilling vha. korpuslingvistiske dataverktøy f.eks. Translation Corpus Aligner 2 (TCA2; Hofland and Johansson, 1998) - utdata kan brukes som grunnlag for termekstraksjon f.eks. med hjelp av Termostat (Drouin 2003) - dvs. halvautomatisk ekstraksjon av termkandidater 9

10 Termekstraksjon Teknologi for maskinell termekstraksjon (ekserpering, utdragning) av termer som alternativ til rådende metode: manuell termekstraksjon Korpusbasert tilnærming - Basert på enspråklige eller flerspråklige tekstkorpus - Enspråklig metode: sammenlikning av fagspråklige tekster med allmennspråklige tekster - Flerspråklig metode: sammenlikning av termer som forekommer i parallelle fagspråklige tekstkilder - Oftest behov for betydelig manuelt arbeid - Behov for flerordsprosessering (n-gram, kollokasjoner, assosiasjonsmål) 10

11 Termekstraksjon Enspråklig termekstraksjon maskinelt finne frem til: Enkeltord og ordsekvenser Enkeltord som bare forekommer i fagspråklig tekstkorpus (FTK) men ikke i allmennspråklig tekstkorpus (ATK) Enkeltord som forekommer i hyppigere i FTK enn ATK Ordsekvenser som forekommer hyppigere i FTK og ikke i ATK Ordsekvenser som bare forekommer i FTK termkandidater 11

12 Ekstraksjon av flerordsuttrykk (Lyse & Andersen 2012) 12

13 Flerordsuttrykk og termkandidater 13

14 Anglicism MWEs POINT 14

15 Foreign MWEs POINT 15

16 Apposisjon og term POINT 16

17 Assosiasjonsmål 17

18 Forskning.no-korpuset 18

19 Korpusassistert terminologiarbeid: termkandidater Word list view 19

20 Korpusassistert terminologiarbeid: kollokasjoner Collocations view 20

21 Kollokasjoner og emne-/domeneinformasjon 21

22 Igangværende initiativ Samarbeid med «standardsettende institusjoner» a) Norges Bank b) Sjøfartsdirektoratet c) Tolketjenesten i Bergen 22

23 a) Samarbeid med Norges Bank - Vi er over det verste og opplever en viss stabilisering, men vi har knapt lagt bak oss det som skapte krisen. Hvis vi ikke endrer tenkemåte, vil vi oppleve varige kriser og stress i verdensøkonomien, sier Paul Krugman, ifølge DN. [Han] mener USA og store deler av verden er inne i en såkalt «secular stagnation», eller vedvarende stagnasjon. [ ] - Norge er et veldig annerledes land på grunn av oljen. Vi ser tegn til en vedvarende stagnasjon over store deler av verden og oljenasjonen Norge er et sjeldent unntak, sier Krugman, ifølge DN. 23

24 Samarbeid med Norges Bank nasjonal koordinering av makroøkonomisk og finansøkonomisk terminologi som kan få bred nasjonal aksept Norges Bank er premissleverandør for norsk økonomi - en naturlig normleverandør når det gjelder hvilke faguttrykk som skal brukes - Eksempel: secular stagnation vedvarende stagnasjon bankens tier 1 kapitalratio var 9,7 prosent, mens egenkapitalgraden ("leverage ratio") var 3,1 prosent per 31. desember ifjor. (DN140127) leverage ratio uvektet egenkapitalandel (Finanstilsynet, KPMG) uvektet kaptialkrav (Bankenes sikringsfond) uvektet egenkapitalandel (Direktør i avdelingen Finansiell Stabilitet Norges Bank) 24

25 Samarbeid med Norges Bank Norges Bank norske tekster Norges Bank engelske tekster Parallellkorpus Norges Bank Pengepolitisk rapport Finansiell stabilitet Norges Bank Memo 25

26 b) Samarbeid med Sjøfartsdirektoratet varierende materiale for termtilfang - fysiske termlister for bruk for fagfolk i aktiv skipsfart - begreper og definisjoner i trykt publikasjon - parallellspråklige fagtekster tilgjengelig i elektronisk form - Skipssikkerhetsloven / The Ship Safety and Security Act - protokoller/konvensjoner vedtatt av International Maritime Organization (IMO) - Sjøfartsdirektoratets forskrifter 26

27 b) Samarbeid med Sjøfartsdirektoratet Mål: å teste ut flerspråklig metode ved å ekstrahere, registrere og analysere termer på norsk og engelsk sammenlikning gjøre tilgjengelig redigeringsapplikasjonen for registrering av terminologiske data 27

28 c. Samarbeid med tolketjenester Tolketjenesten i Bergen - koordinere og samkjøre terminologiarbeidet som foregår i en rekke språkgrupper - flere ulike domener slik som «tolkejuss», «NAV», «helsestasjonen» etablere funksjonelle domener norsk som dreieskivespråk utfordringer - tegnsett + skriveretning (UTF8; Unicode-tegnsett) - begrep mangler på målspråket - domener samsvarer ikke med typisk domeneinndeling som finnes i Termportalen videreføring i nasjonalt nettverk for kommunale tolketjenester - ønsker samarbeid vha. en nasjonal infrastruktur for kunnskapsdeling, bruk av redigeringsapplikasjonen for koordinering/»normering» av terminologi 28

29 Terminologi og grenseflaten mot normering Språkrådet: Normeringsprinsipp under utarbeiding Allmennspråk vs. fagspråk/terminologi Førstnevnte normeres i form av oppføringer i ordbøker, Norsk ordbank osv. - tilordning av genus, bøyningsparadigme, skrivemåte Likevel viktig å se normering og terminologiutvikling i sammenheng Usus i fagspråksammenheng potensielt viktig datagrunnlag for normering av termer som hyppig forekommer i allmennspråket og dermed bør tas inn i ordbøker/ordbanken 29

30 Terminologi og grenseflaten mot normering Prinsipp Ved normering, undersøke forekomst i fagtekster og termbaser (Språkrådets datatermgruppe; UHRs termgruppe) Termbaser/lister med høy «allmennspråksrelevans» bør vurderes som gjenstand for normering Eksempler podcast/podkast/poddkast (m/n) postdoctor/postdoktor/postdoc./postdoktorstipendiat trader, spread, shortsalg 30

31 Veien videre Vi har argumentert for et utvidet perspektiv på terminologisk infrastruktur ikke bare termer og termbaser, men tilknyttet teknologi, forskning, kompetanse, samarbeidsformer, språknormering det må utvikles bedre rutiner for samordning av normering og terminologiarbeid terminologiarbeid, forskning og teknologiutvikling er tre sider av samme sak. 31

Den nasjonale termportalen CLARINO-prosjektet

Den nasjonale termportalen CLARINO-prosjektet Den nasjonale termportalen CLARINO-prosjektet Gisle Andersen Marita Kristiansen www.nhh.no NHHs bidrag: en nasjonal termportal With respect to terminology, there is at present no national infrastructure,

Detaljer

PLAN FOR ETABLERING AV NORSK SPRÅKBANK 15. august 2008. Utarbeidet av en arbeidsgruppe nedsatt av Språkrådet

PLAN FOR ETABLERING AV NORSK SPRÅKBANK 15. august 2008. Utarbeidet av en arbeidsgruppe nedsatt av Språkrådet PLAN FOR ETABLERING AV NORSK SPRÅKBANK 15. august 2008 Utarbeidet av en arbeidsgruppe nedsatt av Språkrådet Forord Regjeringa har i to stortingsmeldinger omtalt etablering av en norsk språkbank som det

Detaljer

Terminologiprosjektene CLARINO/Termportalen og Maritim ordbok og deres relevans for ordboksarbeid

Terminologiprosjektene CLARINO/Termportalen og Maritim ordbok og deres relevans for ordboksarbeid Terminologiprosjektene CLARINO/Termportalen og Maritim ordbok og deres relevans for ordboksarbeid Leksikografi i Norden, Oslo, 16. august 2013 Vemund Olstad, Marita Kristiansen, Gisle Andersen og Kai Innselset

Detaljer

Språkstatus 2011. Språkpolitisk tilstandsrapport fra Språkrådet

Språkstatus 2011. Språkpolitisk tilstandsrapport fra Språkrådet Språkstatus 2011 Språkpolitisk tilstandsrapport fra Språkrådet Språkstatus 2011 Språkpolitisk tilstandsrapport fra Språkrådet Juni 2011 2 Innhold Innledning... 7 Om rapporten Språkstatus 2011... 7 Utviklingstrekk...

Detaljer

Ja takk, begge deler! Best of both worlds!

Ja takk, begge deler! Best of both worlds! Ja takk, begge deler! Best of both worlds! Image: www.wordle.net Språkpolitiske retningslinjer for NHH Language guidelines for NHH 20. mars 2010 Innhold Sammendrag... 3 Summary in English... 4 1. Innledning...

Detaljer

Den totale kontakten med samfunnet omkring har aldri vært så omfattende som nå.

Den totale kontakten med samfunnet omkring har aldri vært så omfattende som nå. SPRÅKRÅDET 2007 Den totale kontakten med samfunnet omkring har aldri vært så omfattende som nå. Innhold Forord... 5 Tilbakeblikk og utsyn... 6 Språkrådets utfordringer... 8 Språkdagen 2007... 9 Språkprisen...

Detaljer

SPRÅKRÅDET. REF. VÅR REF. DATO 2006/04040 KU/KU3 IE:kdp 200600064-4 TB 28.08.2006. Svar på KKDs brev av 29. mai 2006 om en norsk språkbank

SPRÅKRÅDET. REF. VÅR REF. DATO 2006/04040 KU/KU3 IE:kdp 200600064-4 TB 28.08.2006. Svar på KKDs brev av 29. mai 2006 om en norsk språkbank SPRÅKRÅDET Kultur- og kirkedepartementet Postboks 8030 Dep 0030 Oslo REF. VÅR REF. DATO 2006/04040 KU/KU3 IE:kdp 200600064-4 TB 28.08.2006 Svar på KKDs brev av 29. mai 2006 om en norsk språkbank Brevet

Detaljer

Referat fra det 22. møtet i Standardiseringsrådet

Referat fra det 22. møtet i Standardiseringsrådet Referat fra det 22. møtet i Standardiseringsrådet Tid: 16. mars 2010, kl 10.00-15.15 Sted: Rica Oslo Hotell, Oslo Møteleder: Olaf Østensen, Statens kartverk Referent: Kristian Bergem, Difi Tilstede: Olaf

Detaljer

RAPPORT. Revisjon: Implementering av kvalitetssystemet for medisinsk og helsefaglig forskning

RAPPORT. Revisjon: Implementering av kvalitetssystemet for medisinsk og helsefaglig forskning RAPPORT Revisjon: Implementering av kvalitetssystemet for medisinsk og helsefaglig forskning Distribuert til: Forskningsdirektør Kopi: Universitetsdirektør Gjennomført av: Seniorkonsulent Hilde Tanggaard

Detaljer

Landrapport - NORGE Situasjonen ved norske universitet og høgskoler. Møte i Nordisk parallelspråksnettverk Marielyst 30.-31.

Landrapport - NORGE Situasjonen ved norske universitet og høgskoler. Møte i Nordisk parallelspråksnettverk Marielyst 30.-31. Landrapport - NORGE Situasjonen ved norske universitet og høgskoler Møte i Nordisk parallelspråksnettverk Marielyst 30.-31. mai 2011 Mål og meining Ein heilskapleg norsk språkpolitikk St. meld. nr. 35

Detaljer

FORORD. Kristiansand, 1. desember 2011. Espen Fosse Prosjektleder

FORORD. Kristiansand, 1. desember 2011. Espen Fosse Prosjektleder FORORD Universitetet i Agder (UiA) har arbeidet med temaet «Digital eksamen» i flere år. Denne prosjektrapporten skiller seg ut fra det øvrige arbeidet ved å favne bredere og mer overordnet. Målet har

Detaljer

Dokumentasjon av vitenskapelige publikasjoner

Dokumentasjon av vitenskapelige publikasjoner (UHR beklager at figurene ikke er synlige i nettversjonen, ta kontakt med Vidar Røeggen får å få tilsendt publikasjonen) Dokumentasjon av vitenskapelige publikasjoner Opprettelse av nasjonale registre

Detaljer

OPPGAVE. IT i samfunn og arbeidsliv

OPPGAVE. IT i samfunn og arbeidsliv OPPGAVE i IT i samfunn og arbeidsliv Vil kommunene, med dagens dårlige økonomi, være i stand til å ta de økonomiske løft som skal til for å gjennomføre IT- målene i de nye læreplanene for grunnskolen?

Detaljer

Utkast til nasjonal metadatastrategi

Utkast til nasjonal metadatastrategi Utkast til nasjonal metadatastrategi Oppsummering Dette notatet presenterer et utkast til en nasjonal metadatastrategi. Strategien gir en overordnet beskrivelse av dagens situasjon, hvilke samfunnsmessige

Detaljer

Kandidatundersøkelsen design, utviklingsmuligheter og internasjonale perspektiver. Jannecke Wiers-Jenssen, Clara Åse Arnesen og Liv Anne Støren

Kandidatundersøkelsen design, utviklingsmuligheter og internasjonale perspektiver. Jannecke Wiers-Jenssen, Clara Åse Arnesen og Liv Anne Støren Kandidatundersøkelsen design, utviklingsmuligheter og internasjonale perspektiver Jannecke Wiers-Jenssen, Clara Åse Arnesen og Liv Anne Støren Arbeidsnotat 7/2012 Kandidatundersøkelsen design utviklingsmuligheter

Detaljer

Engelsken og de nordiske 1 språkene på høgskoler og universitet En konferanse om parallellspråklighet Voksenåsen, 7. og 8.

Engelsken og de nordiske 1 språkene på høgskoler og universitet En konferanse om parallellspråklighet Voksenåsen, 7. og 8. REFERAT TGD/DFS 13.9.04 Engelsken og de nordiske 1 språkene på høgskoler og universitet En konferanse om parallellspråklighet Voksenåsen, 7. og 8. juni 2004 Det følgende er et konsentrert meningsreferat

Detaljer

Politikk for immaterielle rettigheter ved Høgskolen i Telemark

Politikk for immaterielle rettigheter ved Høgskolen i Telemark Politikk for immaterielle rettigheter ved Høgskolen i Telemark Vedtatt i S-sak 108/14 Forord Dette dokumentet utgjør forslag til politikk for immaterielle rettigheter ved Høgskolen i Telemark og er utarbeidet

Detaljer

STRATEGI 2013 2015. Læring for framtiden

STRATEGI 2013 2015. Læring for framtiden STRATEGI 2013 2015 Læring for framtiden Rettigheter Materialet i denne publikasjonen er omfattet av åndsverklovens bestemmelser. Materialet i denne publikasjonene er videre tilgjengelig under følgende

Detaljer

Retningslinjer OECD - 2013. OECDs retningslinjer for personvern og utveksling av personopplysninger over landegrenser

Retningslinjer OECD - 2013. OECDs retningslinjer for personvern og utveksling av personopplysninger over landegrenser Retningslinjer OECD - 2013 OECDs retningslinjer for personvern og utveksling av personopplysninger over landegrenser Retningslinjer OECD - 2013 OECDs retningslinjer for personvern og utveksling av personopplysninger

Detaljer

TILRETTELEGGING AV OFFENTLIG

TILRETTELEGGING AV OFFENTLIG TILRETTELEGGING AV OFFENTLIG INFORMASJON FOR INNVANDRERE EN STUDIE AV POLICY OG PRAKSIS I TRE SEKTORER RAPPORT 6 / 2011 IDEAS2EVIDENCE MALIN DAHLE JOSTEIN RYSSEVIK MALIN DAHLE JOSTEIN RYSSEVIK TILRETTELEGGING

Detaljer

Notater. Anita Cecilie Dal, Julie Kjelvik, Trine Westvold

Notater. Anita Cecilie Dal, Julie Kjelvik, Trine Westvold 2008/25 Notater Anita Cecilie Dal, Julie Kjelvik, Trine Westvold Notater og Arne Jensen Utredning om mulighet for ny statistikk over arbeidsulykker og yrkessykdommer basert på data fra Arbeids- og velferdsforvaltningen

Detaljer

De nasjonale språksamlingene løsningsforslag og konsekvenser

De nasjonale språksamlingene løsningsforslag og konsekvenser Kulturdepartementet Postboks 8030 Dep 0030 OSLO Deres ref.: Vår ref.: Dato: 14/375-36 / DGI 18.12.2014 De nasjonale språksamlingene løsningsforslag og konsekvenser Språkrådet legger her fram noen vurderinger

Detaljer

Det felles europeiske rammeverket for språk

Det felles europeiske rammeverket for språk Det felles europeiske rammeverket for språk Læring, undervisning, vurdering Jeg kan fylle ut tabeller og lister med detaljert informasjon. COUNCIL OF EUROPE CONSEIL DE L'EUROPE Det felles Europeiske rammeverket

Detaljer

Norskspråklige vitenskapelige tidsskrifter i humaniora og samfunnsvitenskap. Forfatterkrets, formål og mulighet for åpen tilgang

Norskspråklige vitenskapelige tidsskrifter i humaniora og samfunnsvitenskap. Forfatterkrets, formål og mulighet for åpen tilgang Norskspråklige vitenskapelige tidsskrifter i humaniora og samfunnsvitenskap Forfatterkrets, formål og mulighet for åpen tilgang Gunnar Sivertsen Arbeidsnotat 14/2013 Norskspråklige vitenskapelige tidsskrifter

Detaljer

Fra formidlingssystem til styringssystem og tilbake igjen?

Fra formidlingssystem til styringssystem og tilbake igjen? Marte Ericsson Ryste Fra formidlingssystem til styringssystem og tilbake igjen? - en analyse av de politiske målene bak etableringen av forskningsdokumentasjonssystemet Cristin Masteroppgave i Bibliotek-

Detaljer

Strategi for Språkrådet 2013 2015. Vedteken av styret i Språkrådet 21. februar 2013

Strategi for Språkrådet 2013 2015. Vedteken av styret i Språkrådet 21. februar 2013 Strategi for Språkrådet 2013 2015 Vedteken av styret i Språkrådet 21. februar 2013 Språksituasjonen og språkpolitikken Språksituasjonen i Noreg er i endring. Norsk med dei mange dialektane og dei to skriftlege

Detaljer

Følgende 10 tiltak konkretiserer hva nettverket kan initiere:

Følgende 10 tiltak konkretiserer hva nettverket kan initiere: Forslag om å starte opp et norsk nettverk for studenters suksess i høyere utdanning Av Prosjektleder Harald Åge Sæthre Det matematisk-naturvitenskapelige fakultet Universitetet i Bergen Nettverket skal

Detaljer

Uten en tråd? Bruk av ny teknologi for formidling av informasjon blant Osloregionens kulturorganisasjoner.

Uten en tråd? Bruk av ny teknologi for formidling av informasjon blant Osloregionens kulturorganisasjoner. Uten en tråd? Bruk av ny teknologi for formidling av informasjon blant Osloregionens kulturorganisasjoner. Innhold 04 05 Forord Sammendrag 09 10 Avgrensninger og definisjoner Metode 11 11 11 12 13 13 14

Detaljer

Økonomiske føringer for samhandling mellom forskningsinstitusjoner om anskaffelse, drift og tilgjengeliggjøring av forskningsinfrastruktur

Økonomiske føringer for samhandling mellom forskningsinstitusjoner om anskaffelse, drift og tilgjengeliggjøring av forskningsinfrastruktur Økonomiske føringer for samhandling mellom forskningsinstitusjoner om anskaffelse, drift og tilgjengeliggjøring av forskningsinfrastruktur Rapport fra "INFRA-samhandlingsutvalget" oppnevnt av Universitets-

Detaljer

Hvordan lykkes med utviklingen av digital kompetanse i videregående skole? Oppsummering av ITUs inspirasjonsseminar for skoleledere

Hvordan lykkes med utviklingen av digital kompetanse i videregående skole? Oppsummering av ITUs inspirasjonsseminar for skoleledere Hvordan lykkes med utviklingen av digital kompetanse i videregående skole? Oppsummering av ITUs inspirasjonsseminar for skoleledere 1 Forord ITU gjennomførte høsten 2008 en serie inspirasjonsseminarer

Detaljer