Den nasjonale termportalen CLARINO-prosjektet



Like dokumenter
WP7 Terminology integration CLARINO oppstartsmøte 4. juni 2012

Harmonisation of terminological resources future perspectives

Parallellspråkleg terminologiutvikling i høgare utdanning ei skisse til løysing

Terminologiprosjektene CLARINO/Termportalen og Maritim ordbok og deres relevans for ordboksarbeid

Hva er terminologi og fagspråk, og hva skal vi med det?

TERMPORTALEN SOM INFRASTRUKTUR FOR TERMINOLOGI I NORGE

Den europeiske byggenæringen blir digital. hva skjer i Europa? Steen Sunesen Oslo,

Kva med språket når utdanninga blir internasjonalisert?

Uke 5. Magnus Li INF /

STILLAS - STANDARD FORSLAG FRA SEF TIL NY STILLAS - STANDARD

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

Public roadmap for information management, governance and exchange SINTEF

Nytt biblioteksystem - prosjektet

Prosjektet Digital kontaktinformasjon og fullmakter for virksomheter Digital contact information and mandates for entities

SRP s 4th Nordic Awards Methodology 2018

Internasjonal standardisering. Erlend Øverby

Kurskategori 2: Læring og undervisning i et IKT-miljø. vår

buildingsmart Norge seminar Gardermoen 2. september 2010 IFD sett i sammenheng med BIM og varedata

Øystein Haugen, Professor, Computer Science MASTER THESES Professor Øystein Haugen, room D

The Future of Academic Libraries the Road Ahead. Roy Gundersen

FME-enes rolle i den norske energiforskningen. Avdelingsdirektør Rune Volla

PETROLEUMSPRISRÅDET. NORM PRICE FOR ALVHEIM AND NORNE CRUDE OIL PRODUCED ON THE NORWEGIAN CONTINENTAL SHELF 1st QUARTER 2016

The use of Norwegian in higher education as the institutions go international

CLARINO. Koenraad De Smedt. 6 juni MMXI. Universitetet i Bergen ...

Deling av norske språkdata: terminologi og flerspråklige ressurser. ELRC Workshop 8. juni Gisle Andersen, NHH

Flerspråklig terminologi en ressurs for digitale offentlige tjenester i EU- og EØS-området. Jon Arild Olsen

Innledende arbeid i en EU-søknad Seminar UV-fakultet EUs Horisont 2020: Erfaringer fra søknadsskriving

Europeiske standarder -- CIM og ENTSO-E CGMES. Svein Harald Olsen, Statnett Fornebu, 11. september 2014

Status for IMOs e-navigasjon prosess. John Erik Hagen, Regiondirektør Kystverket

CLARINO. Common Language Resources and Technology Infrastructure Norway. Koenraad De Smedt OSLO DIE XVI FEBRUARII A D MMXII. Universitas Bergensis ...

Om samarbeid mellom arbeidsliv og høyere utdanning. Finn Bergesen jr.

Emneevaluering GEOV272 V17

Standarder med relevans til skytjenester

Samarbeid, arbeidsdeling og konsentrasjon (SAK) knyttet til instituttsektoren og UoH - sektoren. Tore Nepstad og Ole Arve Misund

FASMED. Tirsdag 21.april 2015

GEOV219. Hvilket semester er du på? Hva er ditt kjønn? Er du...? Er du...? - Annet postbachelor phd

Et treårig Interreg-prosjekt som skal bidra til økt bruk av fornybare drivstoff til persontransporten. greendriveregion.com

EURES - en tjeneste i Nav. Hjelp til rekruttering av europeisk arbeidskraft

Information search for the research protocol in IIC/IID

Morten Walløe Tvedt, Senior Research Fellow, Lawyer. Seminar 6.juni 2008

Hvordan komme i gang med ArchiMate? Det første modelleringsspråket som gjør TOGAF Praktisk

Social Media Insight

Dybdelæring i læreplanfornyelsen

NORSI Norwegian Research School in Innovation, PING Program for Innovation and Growth

Geomatikkdagene 2018 Stavanger

Ph.d-utdanningen. Harmonisering av krav i Norden

INTPART. INTPART-Conference Survey 2018, Key Results. Torill Iversen Wanvik

Kartleggingsskjema / Survey

ISO 41001:2018 «Den nye læreboka for FM» Pro-FM. Norsk tittel: Fasilitetsstyring (FM) - Ledelsessystemer - Krav og brukerveiledning

Redigere elektronisk enkelttittel (portfolio)

Frå lov til språkpolitiske retningslinjer i sektoren. Kor er me og kor går me?

Hanne Solheim Hansen, Hugo Nordseth, Grete Ingemann Knudsen, Kaja Skårdal Hegstad, Jose de Pool, Just Kornfeldt,

Dean Zollman, Kansas State University Mojgan Matloob-Haghanikar, Winona State University Sytil Murphy, Shepherd University

Quality in career guidance what, why and how? Some comments on the presentation from Deidre Hughes

Monitoring water sources.

SeaWalk No 1 i Skjolden

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

GeWare: A data warehouse for gene expression analysis

Språkrådets terminologitjeneste pådriver og nav for arbeid med norsk terminologi og fagspråk

Mastergrad Læring i Komplekse Systemer

SNORRE et ektefødt samarbeidsbarn

Status og oversikt over det norske strategiarbeidet i UH-lova Johan Myking LLE/UiB

Little Mountain Housing

Industrien må ha tilgang til helsedata for å kunne levere innovative produkter for fremtidens helsetjenester Er vi klare?

EG-leder konferanse 2017

Skjema for spørsmål og svar angående: Skuddbeskyttende skjold Saksnr TED: 2014/S

Samferdselsdepartementet. Kunstig intelligens. Anders Martin Fon. April Samferdselsdepartementet

Generalization of age-structured models in theory and practice

Arbeid med universell utforming av IKT i Standard Norge Rudolph Brynn Prosjektleder Standard Norge. Universell utforming av IKT

TEKSTER PH.D.-VEILEDERE FREMDRIFTSRAPPORTERING DISTRIBUSJONS-E-POST TIL ALLE AKTUELLE VEILEDERE:

Prof. dr. juris Erling Hjelmeng 10 November Purchase agreements: theories of harm in the decisional practise

SFI-Norman presents Lean Product Development (LPD) adapted to Norwegian companies in a model consisting of six main components.

Slope-Intercept Formula

Kanskje en slide som presenterer grunderen?

Horisont 2020 EUs forsknings- og innovasjonsprogram. Brussel, 6. oktober 2014 Yngve Foss, leder, Forskningsrådets Brusselkontor

Litteraturoversikter i vitenskapelige artikler. Hege Hermansen Førsteamanuensis

NORSI Kappe workshop - introduction

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Climate change and adaptation: Linking. stakeholder engagement- a case study from

MULTIMODAL WORKSHOP C:

Erfaring fra søknadsutvikling

Samarbeid, arbeidsdeling og konsentrasjon (SAK) knyttet til instituttsektoren og UoH-sektoren. Hans Fredrik Hoen Rektor

Western Alaska CDQ Program. State of Alaska Department of Community & Economic Development

og open source spillutvikling FreeCol

TEKSTER PH.D.-KANDIDATER FREMDRIFTSRAPPORTERING

Nasjonalt kvalifikasjonsrammeverk og læringsmål i forskerutdanningen

DIGITALE MODELLER OG MENTALE MODELLER

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

og open source spillutvikling

Nasjonalt fakultetsmøte Bergen april Prosjektleder Heidi Dybesland

Microsoft Dynamics C5 Version 2008 Oversigt over Microsoft Reporting Services rapporter

DecisionMaker Frequent error codes (valid from version 7.x and up)

Er arketype-metodikken aktuell å benytte på nasjonalt plan i Norge? Jostein Ven, seniorrådgiver, Helsedirektoratet

EN Skriving for kommunikasjon og tenkning

Eksamensoppgave i SFEL Samfunnsfaglige perspektiver på naturressursforvaltning

Åpen tilgang til forskningsresultater Plan S som virkemiddel

SNORRE et ektefødt samarbeidsbarn

Tilkoblingsskinner. For kontaktorer og effektbrytere

SIU Internasjonal mobilitet blant ph.d.- kandidater Bergen, 20. mai 2011 Forskerutdann.administr-seminar Arne Haugen

Internasjonale aktiviteter innenfor funksjonskontroll med bidrag fra PFK

Transkript:

Den nasjonale termportalen CLARINO-prosjektet Gisle Andersen Marita Kristiansen www.nhh.no

NHHs bidrag: en nasjonal termportal With respect to terminology, there is at present no national infrastructure, despite the fact that an increasing number of scholarly domains face the threat of domain loss. This effort will take an important step towards overcoming the fragmentation problem in the terminology field and the need for coordination of terminological efforts at international and national levels. 13.03.2013 WP7 ClarinTerm 2

NHHs bidrag: en nasjonal termportal (2) In CLARINO, NHH wants to establish a national infrastructure to harmonize terminological language resources and technologies, in response to the national responsibility now given to higher education to develop and disseminate Norwegian terminology. This will be a natural extension of already existing resources originating from the Norwegian Term Bank which in recent years have been further developed in projects such as KB-N, Mikroøkonomen, Termportalen and CLARA. It is not the aim to develop new terminologies per se, but to provide the technical architecture needed for their integration and accessibility, and to vouch for their interoperability with the CLARIN and ISO/TBX standards. 13.03.2013 WP7 ClarinTerm 3

Terminology Services ( Termportalen ) CLARINO will include a technical architecture that integrates a variety of structured, mono- and multilingual terminology bases via a common interface. The infrastructure with provide public and controlled unified access to distributed resources in a national grid-based architecture, with links to European terminology resources via CLARIN. Both distributed and centralised solutions will be offered. 13.03.2013 WP7 ClarinTerm 4

Terminology Services ( Termportalen ) CLARINTerm will cater for autonomous bases with a common interface and search system, as well as integrate a variety of existing termbases into a central knowledge base that contains entries for concepts and conceptual descriptions such as main terms and synonyms, definitions and concept relations. It will be the decision of each data provider to either have the data fully integrated into the central knowledge base or made accessible as a distributed base. Moreover, hybrid solutions may be offered, in which an instantiation of CLARINTerm draws from both a local source and the central knowledge base, but is presented uniformly as one resource. 13.03.2013 WP7 ClarinTerm 5

Bakgrunn tidligere arbeid Utredninger Fagterminologi Norsk i hundre Mål og meining Utredningsgruppe Pilotprosjekt Termportalen Prosjektsøknad Terminor ( Termportalen.no Hovedprosjekt) Forskningsprosjekter/relaterte prosjekter KB-N CLARA MetaNord 13.03.2013 WP7 ClarinTerm 6

Utfordringer og målsettinger Utfordringer å utvikle nye norske termar som får brei aksept i dei respektive fagmiljøa, og å gjere eksisterande og nye termar tilgjengelige på ein slik måte at dei også blir tekne i bruk i alle aktuelle samanhengar Elektroniske termbankar er suverene som medium for å utvikla, lagra og spreia terminologi. (Mål og meining, s. 104) Dei terminologiske metodane varierte mykje, ofte gjekk arbeidet føre seg utan dokumenterte retningslinjer, og terminologien vart ofte ikkje gjord tilgjengeleg eksternt. Dei mange ulike dataformata som var i bruk, hemma effektiv søking og nettbasert presentasjon Mange ulike terminologiressurser, ulike løsninger og presentasjonsmåte Behov for koordinert tilgang til terminologi; det trengs en overbygning dvs. en nasjonal termportal Betrakte terminologi som en infrastruktur for forskning, utvikling og formidling 13.03.2013 WP7 ClarinTerm 7

Termportalen fakta Forarbeidet til prosjektet Termportalen startet ved Unifob AKSIS i 2007 I 2008 fikk prosjektet delfinansiering fra Språkrådet Prosjektet formelt avsluttet 22. april 2009 Termportalen er en pilotversjon av en nasjonal termportal System for søking på tvers av termbaser Oversikt over terminologiske ressurser (lenkesamling) KB-N Økonomi/administrasjon 8467 EØS-basen 70 fagområder, EØS-rettsakter 36776 NOT-basen 38 fagområder, Norsk termbank 30521 RTT-materialet 48314 124078 13.03.2013 WP7 ClarinTerm 8

Termportalen 13.03.2013 WP7 ClarinTerm 9

13.03.2013 WP7 ClarinTerm 10

Språkressurser (1/3) 13.03.2013 WP7 ClarinTerm 11

Språkressurser (2) 13.03.2013 WP7 ClarinTerm 12

Språkressurser Termportalen (forts.) 13.03.2013 WP7 ClarinTerm 13

Termportalens funksjonalitet, tjenester og innhold (1/2) Én felles søkerute mange lokale termbaser/-ressurser Søk i alle ressursene som er koblet sammen i portalen eller i utvalgte ressurser Søk i alle eller enkelte felt term/uttrykk domene (f.eks. IKT, biologi eller økonomi- og administrasjon) subdomene (underinndeling innen økonomi og administrasjon: bedriftsøkonomi vs. samfunnsøkonomi) språk (f.eks. norsk vs. engelsk) kilde Kobling til begrepssystemer, tekstkorpus, nettsider, multimedieinnh. «En nasjonal termportal må ha et system for å integrere semantisk strukturert informasjon i basene, for å navigere langs begrepsrelasjoner og for å visualisere generiske og partitive begrepssystem, helst i form av dynamiske begrepskart og ikke statiske bilder.» (Utredning 13. mars 2012: 9) 13.03.2013 WP7 ClarinTerm 14

Termportalens funksjonalitet, tjenester og innhold - mulig på ulike nivå (2/2) CLARINO TERMINOR UHRs termliste NHH Termbase EU/EØS Tilrettelagt termbaseløsning (NHH Termbase) 13.03.2013 WP7 ClarinTerm 15

Nordiske initiativer Sverige 13.03.2013 WP7 ClarinTerm 16

Nordiske initiativer Finland 13.03.2013 WP7 ClarinTerm 17

Nordiske initiativer Danmark 13.03.2013 WP7 ClarinTerm 18

Samkjøring og kvalitetssikring av terminologiske data For å kunne etablere en termportal med et tilstrekkelig omfang og med ressurser av en tilstrekkelig høy kvalitet må det utvikles metoder for automatisk ekstraksjon av kunnskapselementer utfordringer ved samkjøring av eksisterende terminologiske data a) data vil ha ulik struktur, ulike lagringsformater og være av ulik kvalitet UHRs termliste vs. NHHs begrepsbaserte termbase b) data basert på ulike kilder kan føre til falske dubletter og falske ekvivalenter (Lassen, T., B. Nistrup Madsen & H. Erdman Thomsen 2011. Automatisk samkøring og kvalitetssikring af data i en term- og vidensbank) 13.03.2013 WP7 ClarinTerm 19

Begreps- og termendringer STORE NORSKE LEKSIKON (snl.no) samfunnsøkonomi vitenskapen om den økonomiske virksomhet i samfunnet. Samfunnsøkonomi kaltes i Norge tidligere sosialøkonomi og før det statsøkonomi. I andre skandinaviske land brukes betegnelsen nasjonaløkonomi. Det engelske navn på faget er economics «Sosialøkonomi er blitt samfunnsøkonomi Navnet skjemmer ingen, sier gammel visdom. Men akkurat det er åpenbart ikke universitetets sosialøkonomer enige i. De har nemlig gått hen og døpt faget sitt samfunnsøkonomi. Og det tradisjonsrike Sosialøkonomisk institutt, som har fostret to nobelprisvinnere, skal nå kort og godt hete Økonomisk institutt.» (Uniform nr. 7/2000, http://www.uniforum.uio.nol) 13.03.2013 WP7 ClarinTerm 20

ISO-standarder Standarder for terminologiens metode og grunnleggende begreper ISO 704 Terminology work Principles and methods ISO 1087 Terminology work Vocabulary Standarder for utveksling av terminologi ISO 12620 datakategorier for lagring av terminologiske data ISO 12200 definerer MARTIF; SGML-basert standard for utveksling av terminologiske data ISO 16642 retningslinjer for tekstmerking av terminologi utvekslingsformatet TBX (TermBase exchange), som også er kompatibelt med rammeverket TMF (Terminological Markup Framework) (Madsen & Thomsen 2009. «Terminological Concept Modelling and UML Diarams.» I International Journal of Metadata, Semantics and Ontologies (IJMSO), Vol. 4, No. 4, 2009.) 13.03.2013 WP7 ClarinTerm 21

TBX TBX = TermBase exchange Åpen, XML-basert standard Utviklet av LISA (Localization Industry Standards Organization) Vedtatt som internasjonal standard (ISO 30042) for merking og utveksling av terminologiressurser Kompatibelt med rammeverket TMF (Terminological Markup Framework; ISO/TC37: ISO 12620/12200/16642) Relevante ressurser som RNG-skjema, DTD og XCS-filer, samt valideringsprogram (TBX-sjekker) er tilgjengelig fra ressurssiden http://www.ttt.org/tbx/ 13.03.2013 WP7 ClarinTerm 22

Aktuelle teknologileverandører for termportal EuroTermBank (http://www.eurotermbank.com/) IATE InterActive Terminology for Europe (http://iate.europa.eu/) i-term system for terminologihåndtering og begrepsmodellering utviklet ved DANTERMcentret ved CBS Norsk termbank (NOT) / KB-N / NHHs termbase Rikstermbanken (http://www.rikstermbanken.se/) TEPA finske terminologisentralen / Helsinki universitet TERMIUM Canadas nasjonale termbank 13.03.2013 WP7 ClarinTerm 23

Kommersielle teknologileverandører across (Ahead Software AG, Tyskland) CATS Computer-Aided Terminology System (CATS, Tyskland) GFT DataTerm (GFT GmbH, Tyskland) TermExt (termekstraksjonsteknologi, IBM, USA) Lingo (Julia Emily Software, Frankrike) LingTools (Sietec Systemtechnik, Tyskland) LogiTerm (Terminotix Inc., Canada) MoBiDic (MorphoLogic, Ungarn) MTX (LinguaTech, USA) MultiTerm (TRADOS GmbH, Tyskland) SDL TermBase (SDL, Storbritannia) TEMIS (termekstraksjon, kunnskapsorganisering, TEMIS, Tyskland) TermStar (STAR AG, Sveits) Termwatch (ATRIL Software SL, Spania) UniTerm (Acolada GmbH, Tyskland) Xerox Terminology Suite (XTS) 13.03.2013 (Xerox WP7 Multilingual ClarinTerm Knowledge Mgmt, FR) 24