Mysterie van de dag: waarom vindt een automatisch vertaalsysteem soms nieuwe woorden uit?

Lieve Macken Vertaalwetenschapper UGent

Vertaalwetenschapper UGent 18-07-2019, 07:21 Bijgewerkt op: 21-01-2021, 07:53

De kwaliteit van automatische vertaalsystemen zoals Google Translate of DeepL is de laatste jaren enorm verbeterd. Maar af en toe creëert zo’n systeem nieuwe woorden zoals bekinnen, klotterend of zetmeelarchitect. Hoe komt dat?

Een automatisch vertaalsysteem is datagebaseerd. Aan de hand van enorm veel voorbeeldvertalingen leert zo’n systeem hoe het moet vertalen. Om eender welke tekst over eender welk onderwerp te kunnen vertalen heb je echter een quasi oneindige lijst van woorden nodig. En daar zit nu het probleem. Automatische vertaalsystemen zijn beperkt in het aantal woorden dat ze kunnen coderen. Daarom werken ze met eenheden die kleiner zijn dan woorden, `subwoorden’ zeg maar. Dat heeft veel voordelen. Door te werken met subwoorden weet een automatisch vertaalsysteem dat laugh, laughing, laughed, laughter allemaal gerelateerde woorden zijn.

Een automatisch vertaalsysteem leert die subwoorden op basis van frequentie. Vaak voorkomende karaktersequenties onder het woordniveau vormen telkens een subwoord. Een automatisch vertaalsysteem vertaalt dus niet enkel op basis van woorden maar ook op basis van subwoorden. Heel vaak gaat het goed, maar af en toe gaat het mis en dan krijg je als lezer heel vreemde woorden voorgeschoteld zoals bekinnen voor pelvic fins (pelvic = bekken + fins = vinnen).

Een ander voordeel van het werken met subwoorden is dat een automatisch vertaalsysteem ook woorden die het zelf nooit heeft geleerd, zoals bijvoorbeeld neologismen, of foutief gespelde woorden, kan vertalen. Neologismen zijn nieuwe woorden in een taal. Een voorbeeld van een neologisme is starchitect, een nieuw Engels woord voor een gerenomeerde of beroemde architect, dat door DeepL vertaald werd aan de hand van subwoorden als zetmeelarchitect (starch = zetmeel + architect = architect).

Mensen zijn echter niet altijd in staat om te begrijpen wat de automatische vertaalmachine nu precies bedoelt met die nieuwe creaties. Onderzoek heeft aangetoond dat in 60% van de gevallen lezers die nieuw uitgevonden woorden niet begrijpen, alhoewel ze soms zelf van het tegendeel overtuigd zijn.

Mysterie van de dag

Mysterie van de dag: waarom hebben we wijsheidstanden?

Mysterie van de dag: waarom heeft flessenwater een vervaldatum?

Mysterie van de dag: waarom vliegt een zwaluw lager bij slecht weer?

Waarom geloven mensen de meest waanzinnige complottheorieën?

Waarom bestaat er geen geneesmiddel of vaccin tegen een verkoudheid?

Lees alle artikelen over Mysterie van de dag

Fout opgemerkt of meer nieuws? Meld het hier

Deel dit artikel:

Partner Content

Meest gelezen

Van schoolvakanties tot Vlaamse toetsen: de Zuhal Demir-trein dendert voort

Huisarts schrijft aanklacht tegen voedingsindustrie: ‘Appelcake uit de fabriek? Dat eet ik niet meer’

Louis Tobback hekelt ‘schaamteloze’ afspraken tussen Bart De Wever en Conner Rousseau

David Criekemans over de escalatie in Oekraïne: ‘Niks Derde Wereldoorlog, dit is normaal in de machtspolitiek’

Bart De Wever onderhandelt over waar het pijn zal doen, en voor wie

Meest recent

Factcheck: nee, je hoeft geen uur te wachten voor je ’s morgens koffie drinkt

Rusland vuurde intercontinentale ballistische raket af, zegt Oekraïense luchtmacht

‘Vlaamse verkiezingen lostrekken van de federale is een goede zaak voor de democratie’

'Trump in de schemertijd: wie is nu de baas in de VS?'

Knack is er voor mensen met een lenige geest. Want wie slim is, durft twijfelen. Kritisch, doordacht, diepgaand, open voor alle meningen en invalshoeken. Dat voedt de twijfel en zorgt voor meer inzichten. Word Knack-abonnee.

Abonneer nu

€ 19,95 /maand

Schrijf je in voor onze nieuwsbrief.
Mis niet langer het belangrijkste nieuws van de dag.
Inschrijven

Abonneren

Jongerenabonnement

Mijn Magazines App

Adverteren

Contact & Info

Corrections Policy

Redactionele richtlijnen

AI: redactioneel charter Roularta Media Group

Knack

Factcheck

Auto

België

Cultuur

Geschiedenis

Gezondheid

Milieu

Sport

Technologie

Wereld

Wetenschap

Opinie

Rubrieken

Amerikaanse verkiezingen

Dirk Draulans' Beestenboel

De Leraarskamer van Knack

Maai Mei Niet

Dossiers

Knack voordelen

Knack Club

Knack puzzelclub

Knack shop

Knack reizen

Kortingscodes

Video

Podcast

Politiek ABC

Bekijk ook…

Artsenkrant

Data News Jobs

de Apotheker

De Zondag

Feeling

Flair

Gocar.be

Immovlan.be

KW.be

Libelle

Regiotalent

Vakantieweb

Jobs bij Roularta

Partners

Blijf op de hoogte

Knack is er voor mensen met een lenige geest. Want wie slim is, durft twijfelen. Kritisch, doordacht, diepgaand, open voor alle meningen en invalshoeken. Dat voedt de twijfel en zorgt voor meer inzichten. Word Knack-abonnee.

Abonneer nu

€ 19,95 /maand

Partners:

Artsenkrant

Data News Jobs

de Apotheker

De Zondag

Feeling

Flair

Gocar.be

Immovlan.be

KW.be

Libelle

Regiotalent

Vakantieweb

Jobs bij Roularta

Knack is een onderdeel van de Roularta Media Group
© 2024 Roularta Media Group Alle rechten voorbehouden

Copyright

Disclaimer

Privacy Policy

Cookie Instellingen

Cookiebeleid

© 2024 Roularta Media Group
Alle rechten voorbehouden