voor doven en slechthorenden,
besloten dat de publieke en commerciële omroepen meer programma’s
moeten ondertitelen. In het verleden werd van de programma’s op de
publieke zenders zo’n 60% ondertiteld, bij de commerciële en
regionale omroepen bijna niets. Vanaf 1 januari 2008 moet dit echter
zijn opgeschroefd tot 80% bij de publieke omroepen en 15% bij de
commerciële, en in 2011 moeten deze percentages zelfs liggen op 95% en
50%. Het ondertitelen van programma’s is
momenteel een arbeidsintensieve taak. Met een programma van een half
uur is een titelredacteur bijna een hele dag bezig. Bij
live-programma’s werken 2 titelredacteuren samen: de één luistert en
vat snel samen wat er gezegd wordt en de ander typt dat razendsnel in
op een speciaal toetsenbord. Wanneer bijna alle programma’s op deze
manier ondertiteld zouden worden, wordt dat voor de publieke omroepen
een onbetaalbare klus. Daarom wordt er nu onderzoek gedaan naar
mogelijkheden om met behulp van spraak- en taaltechnologie Nederlands
gesproken programma’s sneller, beter en goedkoper van ondertiteling te
voorzien.
NEON
Tijdens
de Week van de Ondertiteling (7 t/m 13 april) is het NEON-project
(NEderlandse ONdertiteling) gepresenteerd, waarin verschillende
mogelijkheden om automatische ondertiteling te verzorgen onderzocht
gaan worden. Het Enschedese bedrijf Telecats gaat hiervoor samenwerken
met de Nederlandse Taalunie, drie Vlaamse universiteiten en de
Nederlandse en Vlaamse publieke omroepen.
De publieke omroepen maken
al een paar jaar gebruik van speciale dicteersoftware: deze
sprekerafhankelijke software is speciaal getraind op de spreekstijl van
de titelredacteur zodat wanneer deze nazegt wat er in het programma
gezegd wordt, er vanzelf een vrij goede ondertiteling gegenereerd
wordt. De spraaktechnologie is helaas nog niet zo ver ontwikkeld dat de
transcriptie (de uitgeschreven spraak) direct kan worden gemaakt vanaf
de opname (sprekeronafhankelijk). Wel kan de spraakherkenner ingezet
gaan worden bij programma’s waar al teksten voor op papier staan
(bijvoorbeeld scripts of autocues). Deze teksten kunnen automatisch
gesynchroniseerd worden met de spraak op de opname, zodat een vorm van
ondertiteling ontstaat. Zelfs als sprekers afwijken van het script kan
deze oplijning erg snel en nauwkeurig gebeuren.
Volledig automatische ondertiteling
NEON
zal de mogelijkheden onderzoeken om met behulp van spraak- en
taaltechnologie ondertiteling zo snel, goed en goedkoop mogelijk te
genereren. Bij automatische spraakherkenning van de originele opname
moet worden berekend welke woorden gesproken worden. Dit gaat het beste
als de spraakherkenner een goed taalmodel heeft: een groot aantal
relevante documenten, zodat geschat kan worden welke woorden
waarschijnlijk wel gezegd worden en welke juist niet.
De
spraakherkenner werkt het beste als hij alleen spraak hoeft te
analyseren; dit vraagt dus om een pre-processor die de spraak kan
scheiden van de niet-spraak in een opname. Naast de spraakherkenner zal
ook een systeem nodig zijn dat de verschillende sprekers van elkaar
onderscheidt en aparte kleuren toekent aan de verschillende sprekers,
zodat doven en slechthorenden precies weten wie welke zin heeft gezegd.
Tenslotte zal NEON ook een tool ontwikkelen om de ondertiteling
samen te vatten. Vaak wordt er tijdens een programma veel meer gezegd
dan past in de twee regels onder in het scherm. Momenteel wordt dit nog
door de titelredacteur samengevat, maar het zal ook mogelijk worden
deze condensering automatisch te laten plaatsvinden. Uit onderzoek van
de Universiteit van Antwerpen voor het Engels blijkt dat dit mogelijk
is.
Bron: Kennislink.nl (auteur: Erica Renckens) / DovenNieuws.eu