Qu’en est-il de l’avenir des GML et de la traduction automatique?
Alors que nous envisageons un avenir dans lequel les GML deviendraient de plus en plus sophistiqués, il semble qu’à l’heure actuelle, les modèles de TAN adaptés fournissent des résultats plus cohérents, plus faciles à postéditer pour obtenir une qualité élevée, en particulier lorsqu’il s’agit de contenu de la vie réelle traité dans des flux de travaux classiques de système de gestion de traduction.
Il est également important de souligner que les modèles de TAN hautement entraînés (recourant à un contenu et à une terminologie spécifiques à un domaine) ne sont pas soumis aux difficultés techniques et bizarreries qui persistent avec l’IA générative.
La TAN offre une plus grande prévisibilité, en particulier au fil du temps, et pour les langues adaptées. Nous avions également comparé les résultats de la TAN générique et des GML, et alors que la qualité est inférieure (score distance de postédition accru, etc.), la prévisibilité du résultat est constante. Avec les GML, la qualité diminue rapidement, notamment avec des langues autres que l’anglais comme source, et avec des langues moins bien documentées de manière générale. La qualité du contenu peut varier considérablement au fil du temps.
Un exemple concerne les hallucinations de l’IA – en particulier pour les langues moins documentées – qui peuvent affecter le résultat au point d’obtenir une traduction inexploitable. Ce cas a été observé lors de la mauvaise gestion de contenu technique tel que des URL, de la terminologie spécifique à un client ou au domaine et des courtes phrases. Cela démontre que les GML ne produisent pas encore de résultats aussi fiables lorsque le contenu est traité dans de gros volumes, ou à grande échelle.
Dans l’ensemble, les résultats d’Acolad associés à la révision par un spécialiste ont révélé que bien que l’évaluation des résultats produits par les GML est relativement élevée, le contenu plus complexe, compte tenu d’éléments structurels comme le formatage ou le balisage en ligne, présente un plus grand défi.
Par ailleurs, pour répondre à l’exigence de traiter des requêtes relativement complexes dans plusieurs langues et modèles, l’application plus étendue de la technologie de GML dans les flux de traduction ajoutera au coût total de la traduction, même si les coûts de traitement brut sont en baisse.
Effectivement, si vous avez besoin de traduire automatiquement des volumes importants de contenu sans intervention humaine ou en postédition, il est préférable, pour l’instant, d’opter pour une solution de traduction automatique de qualité éprouvée.
Comme évoqué précédemment, même en faisant appel à un humain pour éditer le résultat de la traduction automatique, il peut être plus coûteux d’utiliser la traduction automatique par rapport à l’IA générative, simplement grâce au temps économisé par la répétition des requêtes pour peaufiner le résultat du GML. En outre, la TAN affiche des scores de distance de postédition et un taux de modification de la traduction inférieurs, elle nécessite donc moins de travail de correction comparativement aux résultats de GML.
Malgré ces résultats, il est clair que les GML de l’IA générative auront toujours un rôle important à jouer dans l’automatisation des traductions, en particulier grâce à la précision des modèles. Ils présentent un potentiel intéressant dans leur application, par exemple pour la réécriture stylistique du résultat de TA. Des éléments extrêmement probants indiquent que les GML pourraient jouer un rôle décisif dans l’évaluation de la qualité, ce qui pourrait soutenir les capacités en traduction telles que la postédition auto-réflective.
Ils affichent clairement des possibilités intéressantes dans le traitement des ambiguïtés, expressions idiomatiques, références culturelles, et même des tournures humoristiques que certains modèles de TA ont du mal à traiter, compte tenu des ensembles de données utilisés pour façonner leurs modèles.