overig

Beeld en Geluid neemt ondertiteling van TT888 op in archief

De (vertaal-)ondertiteling van Technicolor was al onderdeel van de archieven van het Nederlands Instituut voor Beeld en Geluid. Komende zomer komt daar de ondertiteling van TT888 voor doven en slechthorenden bij.

 

De digitalisering van het televisieproductie- en uitzendproces en de daaraan gerelateerde archiveringsprocessen (DDV) is sinds eind 2006 operationeel. ‘Het was technisch eerder niet mogelijk om de bestanden van TT888 te koppelen aan de programma's', legt Anne Werst uit. Zij is manager Programma's van de sector MediaDocumentatie van Beeld en Geluid. ‘Het was een grote wens van Jurgen Lentz, de manager van TT888, om ‘zijn' titels toe te voegen aan ‘onze' bestanden. En wij willen graag een compleet pakket aan kunnen bieden. Met de volgende versie van iMMix (de catalogus en zoekinterface voor radio- en televisiemateriaal - red.) gaat dat gerealiseerd worden.'

Alleen ondertitels van TT888 die vanaf komende zomer gemaakt worden zullen worden toegevoegd. Werst: ‘Oude titels zijn niet geschikt omdat die vaak teveel geredigeerd zijn. Pas sinds enkele jaren ondertitelt de afdeling veel meer letterlijk. Om voor continuïteit te zorgen, is er daarom voor gekozen alleen nieuw materiaal te gebruiken.' Als programma's van een flink aantal jaren terug herhaald worden, maakt TT888 daar overigens altijd opnieuw titels bij.
In de toekomst is het de bedoeling dat de ondertitels van TT888 ook gebruikt gaan worden om te zoeken in het archief van Beeld en Geluid. Roeland Ordelman van de afdeling Research & Development werkt daaraan in iMMix-W, de wetenschapsomgeving van de organisatie: ‘Van elke ondertitel is bekend op welk tijdstip die in beeld verschijnt. Daarom kunnen ze een nuttige bron voor het zoeken opleveren.'

 

Spraakherkenning

Beeld en Geluid werkt samen met kennisinstellingen voor het testen en integreren van nieuwe technologie. Een voorbeeld daarvan is te zien in een demonstratie die is ontwikkeld door de Universiteit Twente, waar Ordelman ook aan verbonden is. Op http://hmi.ewi.utwente.nl/showcases/broadcast-news-demo kun je een zoekterm invullen. Als dat woord in een ondertitel van TT888 is voorgekomen, kun je langs die weg een bijbehorend NOS Acht uur Journaal vinden.
Op diezelfde demo-site wordt nog een techniek om audiovisueel materiaal  te ontsluiten gedemonstreerd: spraakherkenning. Wanneer ondertiteling niet voor handen is, kan naar tekst omgezette spraak ook een heel bruikbare beeld geven van de inhoud van audiovisueel materiaal. Ondanks dat de spraakherkenner fouten maakt. Ordelman: 'Het lastige met het spraaksignaal is dat het aan nogal wat variatie onderhevig is. Sprekers onderling verschillen al enorm in hoe ze spreken maar ook de omstandigheden waarin mensen spreken heeft veel invloed op hoe spraak er voor een computer ‘uit ziet'. Denk bijvoorbeeld aan het verschil tussen de voorgelezen, duidelijk gearticuleerde spraak van een nieuwslezer en de spontane, vrije spraak van mensen die een hooglopende discussie voeren in een praatprogramma.

Ook de invloed van de omgeving het spraaksignaal -vergelijk bijvoorbeeld een studio-opname met een opname 'live' op locatie met achtergrondlawaai- draagt bij aan de variatie.' Voor het zoeken is het echter niet zo erg als onbelangrijke woorden, zoals lidwoorden, niet goed worden herkend. Uit internationaal onderzoek is gebleken dat wanneer een spraakherkenner slechts de helft van de woorden goed herkent, de resultaten prima bruikbaar kunnen zijn als bron om in te zoeken. Als de computer de belangrijke woorden (inhoudswoorden) maar goed 'verstaat'.

  

Testen
Gesproken teksten kunnen dus met behulp van spraakherkenning omgezet worden in beschrijvingen met tijdslabels. Deze methode wordt nu binnen het project Beelden voor de Toekomst als eerste getest met Radio 1-materiaal. Ordelman: `Er is gekozen voor Radio-1 materiaal, enerzijds omdat bekend is dat de technologie goed werkt in het nieuwsdomein, anderzijds omdat radiomateriaal niet uitgebreid op een andere manier automatisch (bijvoorbeeld met ondertiteling) kan worden ontsloten waardoor juist hier de toegevoegde waarde van spraakherkenning goed kan worden aangetoond.'
Hoewel diverse testen in het kader van wetenschappelijk onderzoek de bruikbaarheid van de technologie voor afzonderlijke collecties al wel heeft aangetoond, valt er nog een hoop te ontwikkelen, aldus Ordelman. `Laten zien dat iets werkt in een onderzoekslaboratorium is één ding, het ook op een bruikbare manier inzetten binnen een complexe work-flow zoals bij Beeld en Geluid is iets anders. Vandaar dat nieuwe technologie zoals spraakherkenning eerst uitvoerig wordt getest.'


Luc Lansink