‘XS2RADIO gaat verder dan alleen Text-to-speech en Audio on Demand’

Sebastian Plasschaert (CTO van XS2RADIO)

Omroepen, uitgevers en andere content genererende bedrijven hebben een vaak schat aan geschreven content, zoals artikelen van websites, kranten en tijdschriften. De Hilversumse audiotech startup XS2RADIO zet die met behulp van kunstmatige spraaktechnologie (Text-to-Speech) en andere technieken om in geluid, en kan er een complete audio ervaring aan toevoegen, aangepast aan bijvoorbeeld de (audio)huisstijl van de klant. Audio nieuwsbulletins, videojournaals, podcasts en andere formats, alles kan, en het hele proces is volledig geautomatiseerd. Volgens het bedrijf gaat door de Wet van Digitale Toegankelijkheid audio en video een nog belangrijkere rol spelen voor uitgevers, overheidssites en andere content genererende organisaties.

Sebastian Plasschaert, de medeoprichter en technische man achter XS2RADIO, de tak waarmee het bedrijf begon, kan de kracht van het concept eenvoudig samenvatten: ‘Het is snel, schaalbaar en verrijkend. We kunnen tekst en databestanden zeer snel omzetten, we kunnen duizenden artikelen aan en we kunnen elke gewenste audiobeleving toevoegen.’ Het bedrijf kan overigens meer dan alleen audio produceren, vertelt Plasschaert. ‘We kunnen ook video toevoegen, of een avatar de content laten presenteren. Uitgevers van kranten bijvoorbeeld hebben vaak beeldmateriaal in hoge resolutie bij de teksten die ze publiceren, zoals foto’s en video. We kunnen dat allemaal samenbrengen, animeren, van een nieuws anchor voorzien, zodat je bijvoorbeeld een compleet journaal krijgt.’

BELEVING
Tekst is maar een voorbeeld van de content die XS2RADIO kan verwerken naar audio en video. Plasschaert: ‘We
kunnen, naast teksten, ook met andere data hele berichten in audio of video’s genereren. Samen met Flitsmeister
hebben we bijvoorbeeld een case ontwikkeld, waarbij we automatisch bijna realtime 24/7 file- en flitsinformatiebulletins in audio kunnen aanbieden. Zoiets kunnen we ook doen met bijvoorbeeld sportwedstrijden. We kunnen dan met van voetbaluitslagen hele zinnen genereren, waardoor je een echt bulletin hebt. Voor de Volkskrant
bijvoorbeeld hebben we een podcast gemaakt, met audio die past bij de stijl van de componist die hun huisstijl
heeft verzorgd.’ De Volkskrant is maar één van de mediaorganisaties en -titels waarmee XS2RADIO projecten heeft gedaan, andere zijn bijvoorbeeld DPG Media (met onder meer NU.nl, het AD, de Volkskrant, De Ondernemer), Metro (Mediahuis), Bussiness Insider en Talpa. ‘Maar ook heel veel organisaties die niet tot de wereld van omroepen, kranten of andere media behoren, maken veel content en kunnen onze dienst inzetten. Denk aan overheden, universiteiten, maar ook makelaars, autodealers en ga zo maar door. Dat levert een totaalbeleving op, helemaal in de huisstijl van de klant, aangepast aan diens look en feel, waarmee zij nieuwe gebruiksmomenten voor de doelgroep kunnen creëren’, aldus Plasschaert.

STEMMEN
De stemmen die XS2RADIO gebruikt, worden gekozen op basis van de wensen en voorkeuren van de klant. ‘We
ontwikkelen zelf geen speech engine, maar maken gebruik van bestaande spraaksystemen, zoals die van Google, Microsoft, Amazon, Readspeaker, Acapela en andere bedrijven. We kunnen dus de klanten een onafhankelijk
advies geven en een keuze bieden uit alle stemmen die worden aangeboden, maar ook custom voice ontwikkelen. Die stemmen kunnen we aanpassen door er filters overheen te leggen. Zo’n filter is gebaseerd op patronen in de taal, zodat je bepaalde woorden kunt veranderen, toevoegen of juist weglaten. Uitspraak is bijvoorbeeld heel belangrijk. Als je iets hoort dat niet lekker klinkt, of als er een buitenlandse naam in een tekst voorkomt die goed moet worden uitgesproken, dan kunnen we dat snel correct aanpassen met een automatisch filter.’ Het systeem is in beginsel te gebruiken voor elke taal, zegt Plasschaert. ‘We zijn binnenkort bijvoorbeeld met een project starten waarbij we ook how-to video’s kunnen voorzien van een voice-over in andere talen, zonder dat je daar allemaal mensen voor moet inhuren. Daarvoor moet je het systeem trainen met behulp van een taalmodel. Voor een goed taalmodel heb je veel data nodig, maar alles kan. We willen bijvoorbeeld ook dialecten gaan toevoegen, daar is in Nederland veel vraag naar.’

MAATWERK
Andere talen, dialecten, accenten en dergelijke zijn niet de enige manieren waarop XS2RADIO maatwerk kan leveren. Plasschaert: ‘We kunnen alles toesnijden op profielen. Een lezer zal niet alle artikelen in een krant lezen, maar alleen wat hij of zij interessant vindt. Zo kunnen we allerlei selecties maken, met bijvoorbeeld alleen nieuws dat relevant is voor mensen uit Limburg. We kunnen ook ervoor zorgen dat je nieuws, weerverwachtingen, sportuitslagen of filemeldingen hoort wanneer dat voor jou relevant is, dus niet tijdgebonden en maar één keer per uur, maar ‘near realtime’. Bovendien is de audio gebaseerd op geschreven content, waardoor alles makkelijk doorzoekbaar is en SEO-geoptimaliseerd kan worden, waardoor audio en video veel beter op het web te vinden zijn. Onderwerpen die bijvoorbeeld in een reguliere podcast besproken worden, zijn niet of nauwelijks via een zoekmachine terug te vinden. XS2RADIO heeft hiervoor ook een technische oplossing door audio van gesproken podcasts om te zetten in tekst.’

SOUNDSCAPING
Het idee voor XS2RADIO, dat het begin van het bedrijf vormde, ontstond door een samenloop van omstandigheden. Plasschaert en compagnon en medeoprichter Richard Otto, leerden elkaar kennen op de middelbare school in Hilversum en kwamen elkaar dertig jaar later, in 2019, toevallig weer tegen op de markt in Hilversum. Otto bleek
na te denken over een project om uitgevers te helpen zelf eenvoudig hun geschreven content om te zetten in radio.
Toen Plasschaert zich ging verdiepen in de mogelijkheden van Text-to-Speech, was XS2RADIO snel geboren. ‘Ik was verbaasd over de kwaliteit van wat er toen al mo gelijk was’, zegt Plasschaert. ‘Wat wij doen is geen radio 2.0, en onze stemmen maken een echte presentator ook niet overbodig. Het is een extra toevoeging, we bouwen soundscaping om content heen. Hierdoor kun je zeer toegankelijke content genereren van alle bestaande artikelen.’

LAAGDREMPELIG EN AANGENAAM
‘Voor organisaties die geschreven content produceren is dit een laagdrempelige manier om mensen van informatie te voorzien. Natuurlijk kun je op de gebruikelijke wijze audiovisuele producties gaan maken, maar dat kost tijd en menskracht en is daardoor relatief duur. Wij bieden een geautomatiseerd alternatief, van hoge kwaliteit. Die
kwaliteit hebben we ook getest in een panel van 400 lezers van een krant en een aparte groep consumenten. Onderzoek en consultancy zijn extra diensten, die wij bieden om klanten te ondersteunen in nieuwe audiotechnieken.
Voor uitgevers biedt ons systeem, dus snelheid, schaal- en kostenvoordelen, maar ook kansen voor een nieuw verdienmodel.’ Tekstuele content heeft een beperkt gebruikersmoment, mensen zitten niet overal en altijd te lezen. Audio biedt wat dat betreft meer mogelijkheden, je kunt vaker even luisteren, en het is voor de consument een makkelijke en aangename manier om informatie te krijgen. Vergeet ook niet dat er wetgeving aankomt die onder meer de overheid verplicht om alle informatie toegankelijk te maken, ook voor bijvoorbeeld voor mensen met een beperking of laaggeletterden, mensen die digitaal niet zo vaardig zijn. Dat zijn alleen al zo’n 2 miljoen Nederlanders, een grote groep dus.’