TERUG VAN NOOIT WEGGEWEEST
Tien jaar nadat L&H op de fles ging, zorgt het begrip ‘spraaktechnologie’ in ons land nog altijd voor koude rillingen. Maar in de VS is praten met je computer aan een opmars bezig, en Apple en Google zetten er hoog op in. Hadden Jo en Pol het dan toch goed gezien?
‘Ik wil met dat toestel kunnen praten.’ Klaterend applaus van een wild enthousiaste zaal! Nee, het zijn niet Jo Lernout en Pol Hauspie toen ze nog de wind in de zeilen hadden, wel Tim Cook, ceo van Apple en opvolger van de betreurde Steve Jobs, bij de voorstelling van de iPhone 4S op 4 oktober 2011. De grootste nieuwigheid die Apple voor de wereld in huis had, bleek, jawel, spraaktechnologie. Meer bepaald een persoonlijke assistent die uw voicemailberichten voorleest, en op eenvoudig verzoek ‘het weer’ of ‘de files’ voor u ophaalt van het internet. De aarde moet even gebeefd hebben in Ieper, de thuisbasis van het beruchte spraaktechnologiebedrijf Lernout & Hauspie, dat tien jaar geleden, op 24 oktober 2001, failliet ging. Wie dacht dat met de val van de West-Vlaamse wonderboys de spraaktechnologie naar de marge was verdreven: think again. ‘Bij ons denken veel mensen nog altijd: het was allemaal gelogen wat die mannen verkondigden. Maar dat idee leeft alleen in België’, zegt Dirk Van Compernolle, professor spraaktechnologie van de K.U.Leuven en destijds vicepresident research bij L&H. ‘Dat hele drama kwam er door de boekhoudkundige fraude en door te snel te willen groeien, en niet door het falen van de technologie. Dat de mensen hier denken dat spraaktechnologie nu verdwenen is, komt vooral door het verwachtingspatroon dat L&H hier gecreëerd had. Spraaktechnologie werd geprezen als de toekomst. We zouden binnen afzienbare tijd zo goed als alle elektronische apparaten met onze stem besturen, en het toetsenbord zou overbodig worden. Dat is inderdaad niet gebeurd. Maar in de rest van de wereld had men die verwachting niet en kent men L&H ook niet meer, en daar is de spraaktechnologie aan een vrij normaal parcours bezig.’
Kakofonie op de werkvloer
Dat die grote doorbraak er in de voorbije tien jaar niet kwam voor spraakbesturing, in tegenstelling tot de handige touchscreens die toetsenborden wel overbodig maakten, heeft enkele duidelijke oorzaken, zegt Peter Spyns, expert spraaktechnologie van de Vrije Universiteit Brussel. ‘Het meest concrete voorbeeld waar L&H promotie mee maakte, was de computer die je volledig met je stem kon besturen. Maar daarvoor moest je wel een half uur lang een tekst inlezen, om je pc en het systeem te trainen. En dat moest ook met de radio op, zodat de pc aan achtergrondgeluid kon wennen. Veel moeite dus. Intussen is die trainingsarbeid wel al gereduceerd tot vijf minuten, wat de drempel zeker kleiner maakt. Ook belangrijk is een goede microfoon, anders werkt het evenmin. Nuance, de opvolger van L&H en grootste speler op de markt, levert een headset bij zijn programma’s. En er is natuurlijk het feit dat je Standaardnederlands moet spreken tegen je computer, anders lukt het evenmin. Ook dat is voor sommige mensen een obstakel.’ Bovendien bleek het voor professioneel gebruik vaak bijzonder knullig. Als iedereen op kantoor tegen zijn computer begint te praten, is het resultaat een kakofonie. Dat doen de werknemers van Nuance zelf trouwens ook niet, ook al hebben ze alle nieuwste stembesturingsprogramma’s gratis ter beschikking, vertellen insiders.
Spraakherkenning heeft bovendien nog altijd de naam veel fouten te maken. Maar de sector maakt zich sterk dat die foutenlast de voorbije jaren drastisch omlaag is gehaald. Ook Pedro Moreno, expert spraaktechnologie op het hoofdkantoor van Google in Californië, is daarvan overtuigd. ‘Had u me vijf jaar geleden gevraagd of spraak als besturing qua accuratesse ooit zou kunnen concurreren met het toetsenbord of de touchscreen, dan zou ik nee gezegd hebben. Maar vandaag zijn we toch wel erg dichtbij. Mensen maken ook fouten bij het begrijpen en uitschrijven van gesproken berichten, en tests hebben uitgewezen dat we met onze technologie ongeveer evenveel fouten maken als de menselijke proefpersonen. In cijfers: op honderd woorden zijn er een vijf of zes verkeerd. En die mensen bleken trouwens ongeveer evenveel last te hebben met achtergrondgeluid.’ Bij Nuance is hetzelfde geluid te horen. ‘Dat van die fouten, dat is echt een verouderde kijk op spraaktechnologie’, zegt Vanessa Richter. ‘De technologie heeft ook duidelijk geprofiteerd van de verbeteringen in hardware en de toegenomen processorkracht van pc’s en andere digitale apparaten.’
Door alle beperkingen waar de spraaktechnologie aanvankelijk mee te kampen kreeg, kozen maar enkele specifieke sectoren voor de systemen, zegt professor Van Compernolle. ‘Advocaten en dokters, bijvoorbeeld. Dat zijn mensen voor wie het heel gewoon is om rapporten te dicteren, en als dat dan aan een computer is die dat meteen in tekst omzet, dan zijn zij een stap vooruit. Bovendien zijn het doorgaans mensen die duidelijk praten, en die vaak dezelfde termen gebruiken. Dat maakt het voor de pc gemakkelijker. Zulke professio-nals nemen ook de moeite om te wennen aan het systeem, tot ze er vlot mee kunnen werken. Maar voor de doorsneeconsument moet het metéén werken, anders is het stom. We zien ook dat mensen bij het eerste gebruik altijd de neiging hebben om het systeem uit te dagen, om het te doen falen. Maar zodra hij overtuigd is, wordt de consument meegaander.’
De technologie bleek ook van goudwaarde voor mensen met beperkingen. Het bedrijf Sensotec uit Jabbeke, bijvoorbeeld, bouwde voort op de L&H-tool om slechtzienden te assisteren door hun teksten te laten voorlezen. Sensotec heeft intussen ook software die de teksten van dyslectici automatisch corrigeert en aanvult. Grote sprongen voorwaarts voor die groepen, zonder twijfel.
Nieuw: praten tegen je telefoon!
Anno 2011 lijkt de sector een toepassing te hebben gevonden die het brede publiek kan inpakken: apps voor smartphones. Apple pakte er in september mee uit, maar is dit keer niet bepaald de trendsetter. Eigenlijk is Siri meer een inhaaloperatie op die andere computergigant, Google, die al flink geïnvesteerd heeft in spraaktechnologie, zegt Van Compernolle. ‘Google Voice en Google Voice Search (programma’s die voicemailberichten uitschrijven en een zoekrobot die naar gesproken instructies luistert, nvdr.) zijn in de VS gratis downloadbaar, en worden steeds populairder. En als die grote bedrijven er aandacht voor hebben, weet je dat het menens is.’
Er is bovendien een logische verklaring waarom spraak zo interessant is voor de mobiele toestelletjes. ‘Spraak is bij een telefoon de meest natuurlijke manier van communiceren tussen mens en machine. Het is logisch om tegen je smartphone te praten’, aldus Moreno van Google. ‘Bovendien blijft het moeilijk om tekst te typen op die kleine toestelletjes, en voor sommige talen is tekst typen sowieso moeilijk, zoals het Japans. In de toekomst zal het uitdraaien op een combinatie van beide. Dat je op mobiele toestellen een klavier hebt, met daarop één toets met een microfoontje om de spraaktechnologie in te schakelen.’ Zo kunnen mensen kiezen wat ze op dat moment het handigst vinden, want in een vergadering wil je misschien toch liever typen op je BlackBerry in plaats van ertegen te praten.
Bij Nuance zien ze het uiteraard ook helemaal zitten met hun apps, zoals Dragon Dictation en Dragon Search. ‘Die zijn beschikbaar in meer dan twintig talen en gratis downloadbaar uit de Belgische Apps Store. Tientallen miljoenen gebruikers van over de hele wereld hebben dat al gedaan. Dragon Dictation voor de iPhone was deze zomer zelfs een hele week de populairste iPhone-app in België. De lancering van de Apple iPhone 4S vinden wij natuurlijk ook ontzettend boeiend, omdat het een hele omwenteling inluidt van de manier waarop consumenten met stemtechnologie zullen omgaan. Teksten dicteren en toestellen met je stem besturen wordt steeds populairder, en nu zullen nog eens miljoenen consumenten wereldwijd kennismaken met de mogelijkheden van stembesturing. We boeken steeds meer vooruitgang in zogenaamde Natural Language Understanding (NLU), waardoor spraakherkenning steeds beter aansluit bij menselijk taalgebruik en steeds breder kan worden ingezet. Daardoor zal het gebruik ervan de komende drie à vier jaar nog sterk toenemen’, meent Vanessa Richter. Ook Peter Spyns (VUB) ziet het grote publiek finaal voor de bijl gaan voor de spraaktechnologie, dankzij een zoekfunctie op de smartphone. ‘En eigenlijk is dát wat Jo Lernout al in 2000 voorstelde om te maken: via een draagbaar toestel allerhande informatie op het web opvragen met spraak. Hij zag daar zelfs een samenwerking met de Belgische Post in.’
En er is nog een product waar er overlevingskansen liggen voor de L&H-technologie: de auto. Ook hier is de redenering logisch. Je hebt je handen niet vrij, dus wordt toestellen besturen met je stem weer handiger én sneller dan een touchscreen. Om je gps de goede richting uit te sturen, bijvoorbeeld. Zo goed als alle automerken bieden die mogelijkheid vandaag al aan, zelfs in het Nederlands. ‘En de consumenten raken er steeds meer gewoon aan. Dat die gps met je praat, en dat je terugpraat.’ Wat de toepassingen wel bemoeilijkt, is dat er in de auto altijd veel omgevingslawaai is.
Gemiste kans
Zou er dan toch nog een dag komen dat de Belgen spijt krijgen dat het hart van de spraaktechnologie vandaag niet in de Westhoek ligt? ‘Het had in ieder geval gekund’, zucht Van Compernolle. ‘Want het is geen markt met plaats voor vijf grote concurrenten. Daar zaten Lernout en Hauspie juist: ze wisten dat er maar één speler was die dat kon ontwikkelen, en ze hoopten dat zelf te worden. Ze hadden ook alle state of the art-technologie van dat moment in huis om die ene speler te worden. Maar ze wilden te snel gaan, en ze stelden de markt overdreven voor. Na het faillissement was een overname met drastische ingrepen onvermijdelijk. Ik heb zelf nog geld gezocht, met anderen, om het in Belgische handen te houden, maar de technologie was hier “verbrand”. De situatie was te emotioneel. En dat is jammer, want spraaktechnologie had vandaag één van de speerpunten van de Belgische industrie kunnen zijn.’
DOOR THOMAS VERBEKE
‘In de toekomst krijg je een combinatie: Een mobiel toestel met een klavier, met daarop één toets met een microfoontje om de spraaktechnologie in te schakelen.’
‘Je moet natuurlijk Standaard- nederlands spreken tegen je computer, anders lukt het niet. En dat is voor sommige mensen een obstakel.’