Vertaalapps: onderzoeksrapport

Maar liefst 89% van de mensen in de openbare sector gebruiken regelmatig vertaalapps in hun mondelinge communicatie met anderstaligen. Maar hoe goed zijn deze apps eigenlijk in het leveren van nauwkeurige en betrouwbare vertalingen? Daarom organiseerde het Agentschap Integratie en Inburgering een onderzoek in juni 2024. Het doel van het onderzoek: inzicht geven in hoe deze apps presteren in verschillende talen en gesprekken. We letten daarbij op de accuraatheid en betrouwbaarheid van de vertalingen, de gebruiksvriendelijkheid van de apps en het talenaanbod.

Afbeelding
Illustratie van een smartphone met de letter 'A' erop en een tekstballon met een Chinees karakter erin

De kwaliteitsgids van de vertaalapps is gebaseerd op een onderzoek. In juni 2024 testten meertalige medewerkers van het Agentschap Integratie en Inburgering en Atlas vier populaire apps uit: Microsoft Translator, Google Translate, ChatGPT-4o en SayHi. Helaas werd SayHi ondertussen stopgezet. Deze app kunnen we dus niet langer aanbevelen.

Graag meer weten over dit onderzoek, de methodologie en de resultaten? Lees het volledige onderzoeksrapport over vertaaltechnologie.

Onderzoek kwaliteit per vertaalapp

Opvallend genoeg bleken de kwaliteitsverschillen tussen de apps minimaal, waardoor er geen duidelijke winnaar uit de test komt. Een interessante nieuwkomer in de wereld van vertaaltechnologie is ChatGPT-4o, de AI-tool die, naast heel wat andere functionaliteiten, ook mondelinge gesprekken kan begrijpen en vertalen. Hoewel het op het moment van de test nog niet erg gebruiksvriendelijk was, was de vertaalkwaliteit voor sommige talen wel veelbelovend door de sterkere gevoeligheid voor context en intonatie. Het is met andere woorden een app om verder in de gaten te houden.  

Onderzoek kwaliteit per taal

De verschillen per taal zijn wel opmerkelijk. De kwaliteit van de vertalingen (in alle vertaalapps) varieert tussen de 50% (Tigrinya) en 92% (Spaans). Hoewel de scores bij sommige talen relatief hoog liggen, moeten we nuanceren dat de vertaalapps nog steeds in een laboratoriumomgeving werden getest. De tests bestonden meestal uit korte zinnen met weinig subzinnen, wat de werkelijke prestaties in complexere, levensechte situaties niet volledig weerspiegelt.
 

Afbeelding

DELEN