Prosjekt Tale gjenkjenning på Nor sk. Et Inkluderende arbeidsliv med talegjenkjenning

Like dokumenter
Talegjenkjenning på norsk

Høringsuttalelse: Forskrift om universell utforming av IKT-løsninger fra

Talegjenkjenning på norsk

Høringsuttalelse: Forskrift om universell utforming av IKT-løsninger fra

Standardisering og språk: Språkteknologi, talegjenkjenning og database som redskap for universell utforming

Standardisering og språk: Språkteknologi, talegjenkjenning og database som redskap for universell utforming

IKT for brukere med nedsatt funksjonsevne

Hva er det med tale? Forskningsutfordringer og aktiviteter innen taleteknolog. Torbjørn Svendsen NTNU

Norges første kunstige barnestemme. Torbjørn Nordgård Lingit AS Universitetet i Nordland

EIDD 22. Nov 2006 Manneråk +5 IKT Kristin S. Fuglerud telefon: e-post:

AppWriter. i gang. alle plattformer. Les og skriv bedre med. Kom raskt. Kompatibel på

Forprosjektrapport. Hovedprosjekt Gruppe 15

Talegjenkjenning for funksjonshemmede. Innledede test av talegjenkjenning for funksjonshemmede. Prosjekt: Antall sider:

Ha det gøy og få gjort mer på PCen

Mestring gjennom «grønne arbeidstilbud»

ifinger med tegnspråk Sluttrapport

Kom godt i gang med CD-ORD 8. mikrov.no

Resultater fra den første runden med referansemåling (benchmarking) i IMPI-prosjektet (mars 2011)

Office Synchronizer. Versjonsinformasjon. Versjon 1.66

Dette får vi til sammen!

Rolltalk Designer. Trondheim 15.oktober Mari Aakvik

Arbeid og helse. BHT-konferansen Overlege Agneta Emma Iversen // Arbeids- og velferdsdirektoratet

For noen er alt brukervemmelig

Innsamling av språkdata i Norge for ELRC utfordringer og muligheter

Last ned Bergen - Egil Ertresvaag. Last ned. Last ned e-bok ny norsk Bergen Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

Våre tanker ang det å være en dysleksivennlig voksenopplæring ved Kvalifiseringstjenesten i Grimstad

SAFERS: Speech Analytics For Emergency Response Services. Pierre Lison, Norsk Regnesentral

Stemmen er en viktig del av personligheten. En del vi gjerne ønsker å beholde ved en diagnose som indikerer tap av taleevnen.

Hurtigstartveiledning. ActivEngage. Hurtigstartveiledning

Bruker og pasient - samhandlingsutfordringer på tvers etater og hjelpeapparat

Ny IA-avtale

Referatsak. Styrkingstiltak språkfag

ARBEIDS- OG VELFERDSDIREKTORATET/ STATISTIKKSEKSJONEN

RESULTATRAPPORT: Lydstyring-prosjektet

Avdekke lese, skrive og matematikkvansker Strakstiltak Systemrettet tiltak. Prosjektleder: Greta Olgadatter Randli,

Helserådgiver NAV - UTDANNELSE OG TILBAKE I ARBEID

I hvor stor grad fanger arbeidskontorene opp funksjonshemmede som ønsker arbeid?

Office Synchronizer Versjonsinformasjon. Versjon 1.61

Datamaskin som hjelpemiddel for barn med Williams syndrom på førskole- og småskolenivå

Ofte stilte spørsmål INNHOLD

Bjarte Furnes Førsteamanuensis, Institutt for pedagogikk, Universitetet i Bergen

Kom i gang med. Kreativitet Programmering Gøy

TELEform datafangst Er du lei av manuell og tidkrevende inntasting? Tid og penger spart Enkel å håndtere Tolker alt

NORSK SPRÅKRÅD. REF. VÅR REF. DATO 2003/1372 ME/MEI CBU:elt OH HØRING VEDRØRENDE ENDRINGER I ÅNDSVERKLOVEN

Last ned Nabospråk og nabospråkundervisning - Stian Hårstad. Last ned

Last ned Nabospråk og nabospråkundervisning - Stian Hårstad. Last ned

Tidlig innsats i skriving

Legemeldt sykefravær etter diagnose og bosted. Kvartal

Legemeldt sykefravær etter diagnose og bosted. Kvartal

Norsk taleteknologi status hausten Knut Kvale

Referat fra Brukerutvalg ved NAV Oslo // REFERAT

Dette lurer jeg på. Forslag nr 2 fikk flest stemmer: 1. Hvorfor ser folk opp når de tenker? Hvorfor liker vi forskjellige middager?

Sykefraværet kan vi gjøre noe med det? Jan Erik Askildsen Forskningsdirektør Uni Rokkansenteret Professor Institutt for økonomi, UiB

Ny intensjonsavtale om et mer inkluderende arbeidsliv

Tekstmining: En kort innføring

Geografisk forstand (neighbours) Politisk (samme land, situasjoner av språkdominans) Lingvistisk (av samme diakronisk opphav, hører til samme tett

SVs nettkampanje ved valget 2011 var ikke universelt utformet

Gjenoppdag musikksamlingen din med Bang og Olufsen

NRFs Rehabiliteringsprosjekt. Norsk Revmatikerforbund Tone Granaas Generalsekretær

Om desse databasane. Nasjonalbiblioteket, juni Akustiske databaser for dansk 1

automatisk informasjonssjekk av jobbsøkere på internett

Testing av øreproppens passform har aldri vært enklere

Informasjon om legemidler til barn Forslag til langsiktig løsning

Last ned. Beskrivelse mangler. Se gjerne forlagets (Createspace Independent Publishing Platform) hjemmeside, der det kan finnes mer informasjon.

Sammenligning mellom Handi5 og HandiKalender

Norsk Tyrkisk Oversettelse

Nyhet! uunnværlig på jobb.

Dysleksiplan. Skolene i Oppegård kommune

Halve sjukefraværet har sosiale årsaker. Vi vet det men liker det ikke. Bodø Rolf Rønning

PROSJEKT Velferdsteknologisk labratorium

Undersøkelsen foregikk via internett, og følgende input-data ble logget i følgende 9 step:

Unge funksjonshemmedes tips til arbeidsgivere for vellykket inkludering på arbeidsplassen

Unge funksjonshemmedes tips til arbeidsgivere for vellykket inkludering på arbeidsplassen

- Vi utvikler mennesker - Eierdokument. Vedtatt: Vikna kommunestyre

Laget med Widgit symboler

Samhandlingsreformen med eller uten NAV?

Til elever og foresatte i de nye 8. klassene ved Gimle skole høsten 2013.

Hva koster et ikke-optimalt arbeidsmiljø?

IKT-plan for Nesoddtangen skole

Et kommunikasjonsmiddel er en gjenstand som inneholder et ordforråd og som kan brukes av ASK-brukere for å uttrykke seg, eller for å støtte tale.

Familier med funksjonshemmede barn. Oppvekst og familie. Lese og skrivevansker / Dysleksi.

Om desse databasane. Nasjonalbiblioteket, juni Akustiske databaser for norsk 1

YTRE NAMDAL VEKST AS

Ved Nina Thunold Reime, koordinerende rådgivende overlege NAV i Telemark. Oppfølging og forebygging av sykefravær økt fokus på aktivitetskravet

MULTICOM 112. Muntlig innvirkning A1: Ingen krav

Tilbake i arbeid - 4 ukers kurs

Måling av universell utforming på kommunale nettsider Resultater fra EIII. Daniel Scheidegger NAV Tilde

Salg av Fjord Pass kortet har hatt en uvanlig høy vekst i 2013 med en salgsøkning på 17,42 %.

IBM3 Hva annet kan Watson?

PC-bok 1. Svein-Ivar Fors. Lær deg. og mye mer! Windows Tekstbehandling Regneark Mange nyttige PC-tips!

Unge voksne utenfor arbeidslivet i Telemark. Vrådal Avdelingsdirektør Tone Størseth

Medisinsk Ordbok Engelsk Norsk

Hjertestartere både her og der, hvor er bevisene for at dette er nyttig?

Din bruksanvisning CREATIVE DESKTOP WIRELESS

Våre tanker ang det å være en dysleksivennlig voksenopplæring ved Kvalifiseringstjenesten i Grimstad.

Brukerveiledning til Oribi Speak for Chrome

Telefunken trener manual

Vår Kurstilbud fra Utadrettet tjeneste ved Haukåsen skole. Adresse: Dr. Dedichensvei 20, 0675 Oslo Tlf: Faks:

IKT for alle hvordan er situasjonen i dag?

Overgang fra videregående skole til høyere utdanning. For studenter med nedsatt funksjonsevne

Transkript:

Prosjekt Tale gjenkjenning på Nor sk Et Inkluderende arbeidsliv med talegjenkjenning

Prosjekt i regi av NAV Deltakere : Bengt Kjellså, InfoShare Solutions AS Daniel Scheidegger, NAV Kompetansesenter for tilrettelegging og deltakelse (NAV Tilde) Britt Ormaasen, Brukerrepresentant

Formål : Kartlegge behov Samfunnsmessig Samfunnsøkonomisk Hva skal til for å få talegjenkjenning på Norsk

Målgruppen 78 000 funksjonshemmede står uten arbeid på tross av at de er arbeidssøkere NAV mål: flere med funksjonsnedsettelser i arbeid Personer med omfattende bevegelses- og synsvansker som ikke kan betjene PC med tastatur og mus I 2009 finner vi 46 550 personer med uføretrygd innen aktuelle diagnosegruppene. (se vår rapport) Muskel og skjelettlidelser er den hyppigste årsaken til en rekke trygdeytelser. De utgjorde 36 % av sykefraværstilfellene. Disse utgjorde til sammen 13 927 tapte årsverk i 2010.

Målgruppen fortsettelse Personer som ikke kan bruke tastatur og/eller mus Dysleksi Synshemninger Personer for eksempel fremmedspråklige med manglende skriveferdigheter Personer som trenger å skrive raskere enn de kan på tastaturet Forebygging mot belastningsskader Bruken av datamaskin i bil og andre steder hvor et tastatur er uhensiktsmessig mm.

Målgruppen fortsettelse Ut fra dette beregningsgrunnlaget vil 13 927 tapte årsverk utgjøre 9,4 milliarder kroner. Om talegjenkjenning på norsk kunne ha hindret bare 10 % av disse årsverkene, ville besparelsen på ett år utgjøre 941 millioner NOK. Lese- og skrivevansker Forum for lese og skrivevansker: Vi vet ikke hvor mange, men dersom en av fire som leser dårlig har nytte av talestøtte, utgjør det ca. 220 000 personer. Selv om bare en av 10 har nytte av talestøtte, utgjør det likevel om lag 90 000 personer i Norge. Kildene til ovennevnte tall finnes i rapporten til forprosjektet Norsk talegjenkjenning. http://sikte.no/tg

Nuance Teknologifirma, programvare Mer enn 8.000 ansatte på verdensbasis Produkter Innovativ Kjøper opp mange selskaper

Nuance Stor satsning på taleteknologi Standard programvare Automatisk telefontjeneste TV teksting Interaktiv tale

Nuance viser at de kan Dragon Naturally Speaking (På mange språk) Dragon Dictate Dragon Search

Språkbanken Frigivelse av materiale fra NST (konkurs i 2003) : Datafiler Dokumentasjon

Vi ville Ikke finne opp hjulet på nytt Prøve å nyttiggjøre materialet fra NST

Språkmaterialet fra NST Pakket ut og systematisert Dokumentasjon oversatt til Engelsk Harddisk med data sendt til Nuance i USA

Tilgjengelig materiale for talegjenkjenning fra NST Norsk/Svensk/Dansk Leksikalske databaser Akustiske databaser

Materialet fra NST Opptak ligger som én lydfil pr. manuskriptlinje Forskjellige formater Mange forskjellige personer ble benyttet (18-70 år) Opptak for : Talegjenkjenning (ASR/diktering) Diktering Telefoni Med «nølelyder»

Materialet fra NST Dokumentasjonen viser at en stor del av innsamlingen av data er basert på direksjon fra L&H, som senere ble kjøpt opp av Nuance HVA BETYR DETTE?

Nuance konklusjon Nuance i USA har undersøkt talekorpuser for de 3 skandinaviske språkene (norsk, svensk, dansk). Deres funn og anbefalinger er : Treningsdata : Audio data er av høy kvalitet, den oppleste talen kan brukes til å trene akustiske modeller for talegjenkjenning. Mengden av data er lik den datamangden som ble brukt for bygging av Dragon Naturally Speaking v10 for spansk, italiensk og nederlandsk. Testdata : Nuance har ikke de nødvendige data for å teste sine akustiske/språkmodeller. Det må innhentes ekstra korpuser som er aktuelle.

Kriterium Lydkvaliteten : Nuance undersøkte signal-til-støy forhold og fant at talekvaliteten var ganske god og egnet til våre formål. Fonetisk variasjon : Vårt mål er å bygge akustiske modeller for dikterings oppgaver. Det er viktig at den akustiske variasjonen i dataene er realistisk for dikterings bruk og ikke domineres av ord/uttrykk som er mindre vanlig i diktering. Eksempler på sistnevnte inneholder bokstaver, tall eller gjentakelser av samme ord/setning av flere personer. Basert på tidligere erfaring har vi lært at man trenger å luke ut slike ytringer for å kunne bygge opp realistiske trenings korpuser. Test utvalg : Et vanlig tema i den medfølgende korpus er bruken av «fonetisk balanserte setninger». Dette er et kunstig krav i bygging av dikterings systemer. Selv om vi kan filtrere vår trenings korpus til å bygge et sett med akustiske modeller, er det mye vanskeligere å bygge et test sett fra et slikt korpus. Derfor konkluderer vi med at det foreliggende materialet ikke er egnet for dette formålet.

Veien videre Skaffe penger

Samfunnsnytten Kostnaden for å videreutvikle dagens ledende programvare på markedet, er estimert til ca 13 millioner NOK. Dette utgjør omtrent det samme som uføretrygdkostnadene til 50 personer i ett år.

Rapport www.infoshare.no (under nyhets seksjonen).