IA pour la traduction : Les modèles d’IA comme DeepSeek, ChatGPT et Gemini sont-ils les meilleures solutions en matière de localisation?

Les grands modèles linguistiques de l’IA pour la traduction suscitent un engouement considérable – mais remplacent-ils vraiment la localisation professionnelle?

date icon19 mars 2025     tag iconTraduction

On ne compte plus les discussions autour de la révolution de l’IA et de ses répercussions sur la traduction et la localisation à l’occasion de conférences et de webinaires ou encore dans les commentaires postés sur LinkedIn. Bien qu’ils ne soient pas expressément conçus pour la traduction, les LLM sont de plus en plus utilisés pour créer du contenu multilingue – cependant, le débat se poursuit quant à leur efficacité en la matière.

Mais qu’en disent les experts ?

  • Comment les modèles d’IA se situent-ils par rapport aux moteurs spécialisés de traduction automatique neuronale (NMT)?
  • Sont-ils adaptés à une localisation à grande échelle ou sont-ils mieux adaptés aux tâches créatives et spécialisées? 
  • Quels défis éthiques, réglementaires et de sécurité des données posent-ils? 
  • Les modèles d’IA open weight comme DeepSeek offrent-ils une véritable alternative aux solutions propriétaires ?

Étudions, en compagnie de quelques experts, l’évolution du paysage de la traduction alimentée par l’IA et ce que cela augure pour l’avenir du contenu multilingue.

 

Traduction alimentée par l’IA : Comment les LLM se situent-ils par rapport à d’autres modèles ?

Bien que les LLM ne soient pas nécessairement conçus au départ pour la traduction, nombreux sont les professionnels et organisations du secteur qui comparent leur performance par rapport aux systèmes de traduction automatique neuronale (NMT) établis.

Certains modèles, comme les derniers modèles V3 et R1 de Deepseek, ont été salués pour leurs capacités de raisonnement, tandis que les utilisateurs louent les excellents résultats en termes de fluidité et de créativité des modèles tels que GPT4 et Claude.

  • DeepSeek : Selon certains experts, DeepSeek s’impose pour la qualité de sa traduction dans la paire de langue chinois-anglais qui éclipse celle des autres modèles. Ce modèle excelle également dans les tâches de raisonnement mathématique. Toutefois, certains tests montrent, qu’en comparaison avec d’autres modèle, DeepSeek manque encore de finesse dans l'interprétation du contexte et peut produire des réponses moins nuancées.
  • ChatGPT et Claude : Ces modèles se distinguent par leur capacité à produire des traductions de grande qualité, nuancées et créatives, et sont notamment très appréciés pour la traduction de contenu marketing ou créatif. Ils peuvent également s’avérer très utiles à toutes étapes des workflows de localisation. Dans une étude récente, des experts ont aboutit à la conclusion que Claude Sonnet affiche une performance supérieure aux autres modèles dans les tâches générales de traduction, et ce, dans plusieurs paires de langues.
  • Gemini & LLaMa : Les modèles Gemini de Google intègrent des capacités multimodales, améliorant la compréhension contextuelle de différents types de contenu, tandis que la LLaMa de Meta met l’accent sur l’efficacité et l’adaptabilité pour diverses tâches d’IA.

Présentation du secteur :

Renato Beninatto, expert de ce domaine chez Nimdzi, et qui a présenté ses réflexions sur les grandes tendances qui façonneront le secteur de la langue et du contenu en 2025 dans notre E-book exclusif, a mené une expérience visant à tester une erreur de traduction. Il a ainsi découvert une différence intéressante entre GPT-4o et DeepSeek V3 lors de la traduction d’une phrase espagnole particulièrement délicate.

Voici ce qu’il a publié sur LinkedIn : « Cette expérience révèle un écart important dans les capacités de raisonnement entre ces modèles d’IA. Bien que DeepSeek ait témoigné d’une solide analyse grammaticale, il éprouve davantage de difficultés à appréhender le contexte plus large. ChatGPT a fait preuve d'un raisonnement supérieur en comprenant la relation entre la prémisse du contenu (quatre mots) et la traduction. »


La traduction alimentée par l’IA, un modèle rentable? Une nouvelle ère

Le coût est un facteur important pour de nombreux dirigeants qui cherchent à favoriser l’adoption de modèles d’IA dans la création et la localisation de contenu. Alors que bon nombre des grands acteurs de l’IA présentent des prix par jeton similaires, l’un des principaux agents perturbateurs en termes de coût LLM a été l’arrivée sur le marché de DeepSeek.

La start-up dit avoir entraîné son modèle pour une fraction du coût de ses concurrents, le coût par jeton de DeepSeek est généralement bien inférieur à celui de ses concurrents. Cette solution plus économique devrait permettre l’exploitation des LLM par les petites entreprises et les autres organisations, car bien plus viable financièrement.

Les coûts des LLM devraient afficher une tendance à la baisse. Mais pour de nombreuses entreprises qui ont déjà investi dans la construction d’une base terminologique ou d’une mémoire de traduction avec la traduction automatique neuronale, ou pour les cas d’utilisation impliquant un volume élevé, l’utilisation de la NMT pourrait rester plus rentable pour le moment – d’autant plus que cette dernière peut traiter de grands volumes de contenu plus rapidement.

Présentation du secteur 

« Il n’existe pas d’approche unique permettant de choisir entre un LLM et une NMT pour effectuer des traductions. Le degré de rentabilité d’une solution dépend du type de contenu, du public cible, du volume et de nombreux autres facteurs. C’est pourquoi les fournisseurs de services linguistiques – forts de leur expertise dans la mise en œuvre de solutions de NMT et d’IA – sont particulièrement bien placés pour aider à trouver le juste équilibre. »

Pavel Soukenik, Head of Global Solutions, Acolad

Vous êtes curieux de savoir comment l’IA peut transformer votre contenu?

Personnalisation et modèles open weight : Une révolution pour la localisation ?

La différence la plus importante entre DeepSeek et ses principaux rivaux LLM réside peut-être dans le fait que le modèle est disponible en open weight. Alors que d’aucuns seraient enclins à le décrire comme un modèle open source, de nombreux experts insistent sur le fait qu’un modèle d’IA qui rend ses paramètres entraînés publiquement accessibles tout en gardant d’autres aspects du modèle privés doit être considéré comme un modèle open weight.

Quoi qu’il en soit, contrairement à la plupart de ses concurrents LLM, DeepSeek offre des options de personnalisation, avec la possibilité de télécharger, de modifier et de déployer des modèles sur site permettant aux entreprises d’affiner l’IA et de l’adapter à des tâches spécifiques - par exemple, en fonction des paires de langues et de la terminologie propre au secteur.

Cet aspect pourrait bouleverser le développement de nouveaux modèles conçus spécialement pour traiter les travaux dans des langues peu dotées, qui sont peu ou pas du tout prises en charge par des modèles propriétaires. De plus, les entreprises pourraient entraîner le modèle en toute sécurité sur leurs propres mémoires de traduction, bases de données terminologiques et lignes directrices de la marque, le tout sans courir le risque que des données sensibles soient accessibles à des tiers.

Les modèles open weight ont le potentiel de véritablement démocratiser la technologie linguistique avancée, tout en permettant aux organisations de conserver leurs avantages linguistiques concurrentiels. Un plus grand nombre d’entreprises pourraient être en mesure d’exécuter des applications personnalisées des modèles, sans avoir à supporter les coûts initiaux, considérables, d’entraînement du modèle.

 

Traduction alimentée par l’IA et conformité : Le dilemme de la sécurité des données

La généralisation de l’adoption de l’IA s’accompagne de certaines préoccupations relatives à la sécurité, à la conformité et à l’éthique des données.

Ainsi, les autorités en Australie, aux États-Unis, en Italie, à Taïwan et en Corée du Sud ont déjà adopté des restrictions quant à l’utilisation de DeepSeek, invoquant des préoccupations en matière de confidentialité et de données. L'Italie a d’abord adopté une position similaire lors du lancement de ChatGPT.

La protection des données, les cadres réglementaires et d’autres préoccupations en matière de conformité demeurent un obstacle majeur à l’adoption de l’IA par les entreprises de nombreux secteurs, en particulier les secteurs réglementés.

Voici les principales questions que les dirigeants d’entreprise doivent se poser :

  • Les modèles d’IA peuvent-ils assurer la protection des données et le respect des réglementations locales lorsqu’ils sont utilisés à des fins de traduction ?

  • Est-il possible pour les entreprises d’opter pour des modèles d’IA hébergés localement afin de préserver la sécurité des données ?

  • Quelle sera l’incidence des divergences en matière de réglementation de l’IA entre l’Europe, les États-Unis et l’Asie?

Bien qu’il n’y ait pas de réponses simples à ces questions, les organisations doivent évaluer attentivement si les outils de traduction IA sont en mesure de répondre à leurs obligations en matière de conformité, étudier la viabilité des modèles hébergés localement et se préparer aux répercussions des divergences entre les approches réglementaires régionales.



Quelles sont les prochaines étapes du développement de la traduction alimentée par l’IA?

Comme nous l’avons vu, le paysage ne cesse d’évoluer avec l’émergence de modèles open weight qui remettent en question les systèmes propriétaires traditionnels, tandis que la rentabilité et les capacités de personnalisation deviennent des facteurs de différenciation clés sur le marché.

L’avenir pointe peut-être vers une démocratisation de l’accès à la technologie de l’IA, les LPS et les entreprises de petite taille ayant alors la capacité de déployer et de personnaliser leurs propres solutions d’IA. La tendance au déploiement local et à la personnalisation des modèles va probablement s’accélérer, particulièrement pour les organisations qui travaillent avec des langues peu dotées et qui utilise une terminologie spécialisée, propre à leur secteur.

Toutefois, cette évolution doit naviguer dans des eaux réglementaires complexes, car les approches en matière de gouvernance de l’IA divergent selon les pays. Le secteur va devoir trouver un équilibre entre innovation et conformité, d’autant plus que des différences régionales dans la réglementation de l’IA continuent de voir le jour.

Principaux points à retenir pour les entreprises et les professionnels de la localisation :

✔ Les modèles d’IA s’améliorent, mais dans certains cas, notamment s’agissant des volumes de contenu élevés, les moteurs NMT traditionnels peuvent encore s’avérer la meilleure option.

✔ Les modèles d’IA open weight peuvent stimuler l’innovation du secteur, mais leur adoption dépend de la clarté réglementaire.

✔ La traduction alimentée par l’IA doit être utilisée de façon stratégique, par exemple, pour le contenu créatif et la post-édition automatisée.

✔ Les préoccupations en matière de sécurité et de conformité des données demeurent des facteurs essentiels dans le choix des outils d’IA.

Présentation du secteur

« L’avenir de l’IA en traduction et en localisation ne repose pas seulement sur la technologie, mais aussi sur la façon dont nous concilions sécurité, conformité et innovation. L'IA redessine le secteur des langues, mais la véritable force vient de l'adaptation de ces technologies à des contextes spécifiques. »

Pavel Soukenik, Head of Global Solutions, Acolad


date icon19 mars 2025     tag iconTraduction

Vous souhaitez comprendre l’apport de l’IA à la traduction?

Découvrez comment l'IA transforme la localisation et rencontrez Lia, la solution de contenu alimentée par l'IA d'Acolad

Articles connexes