IA para traducción: ¿los modelos como DeepSeek, ChatGPT y Gemini son la mejor opción para la localización?
Se está hablando mucho de los modelos del lenguaje de gran tamaño de IA para la traducción, pero ¿pueden sustituir realmente a la localización profesional?
19 de marzo de 2025
Traducción
En las salas de juntas, los comentarios de LinkedIn y los seminarios web se sigue hablando mucho de la revolución de la IA y de su impacto en la traducción y la localización. Aunque los LLM no están diseñados expresamente para la traducción, cada vez se utilizan más para crear contenido multilingüe. Sin embargo, sigue manteniéndose el debate sobre su eficacia para este tipo de tareas.
Pero ¿qué dicen los expertos?
- ¿Cómo se comparan los modelos de IA y los motores de traducción automática neuronal (TAN) especializados?
- ¿Son viables para la localización a gran escala o son mejores para las tareas específicas y creativas?
- ¿Qué retos éticos, normativos y de seguridad de los datos presentan?
- ¿Los modelos de IA de peso abierto como DeepSeek ofrecen una verdadera alternativa a las soluciones patentadas?
Echemos un vistazo, con la ayuda de algunas opiniones expertas, al horizonte cambiante de la traducción basada en IA y lo que significa para el futuro del contenido multilingüe.
Traducción basada en IA ¿Cómo se comparan los LLM?
Si bien los LLM no están necesariamente diseñados para la traducción, numerosos profesionales y organizaciones del sector han probado su rendimiento en comparación con los sistemas de traducción automática neuronal (NMT) establecidos.
Algunos modelos, como los últimos modelos V3 y R1 de DeepSeek, han recibido elogios por sus capacidades de razonamiento, mientras que los usuarios informan de resultados fantásticos en cuanto a fluidez y creatividad con modelos como GPT4 y Claude.
- DeepSeek: hay especialistas que sugieren que la calidad de la traducción chino-inglés supera a la de muchos otros modelos. También es particularmente potente con las tareas de razonamiento matemático. Sin embargo, algunas pruebas tempranas muestran que puede tener dificultades con los matices contextuales en comparación con otros modelos.
- ChatGPT y Claude: muchas personas prefieren usar estos modelos para trabajar con traducciones creativas, con matices y de gran calidad, a menudo para contenido creativo o de marketing. También pueden ser útiles para diferentes etapas de los flujos de trabajo de localización. En un estudio reciente, Claude Sonnet fue evaluado por especialistas como el mejor modelo de traducción en diferentes combinaciones lingüísticas para tareas de traducción generales.
- Gemini y LLaMa: los modelos de Gemini de Google integran capacidades multimodales, que mejoran la comprensión contextual entre diferentes tipos de contenido, mientras que LLaMa de Meta se centra en la eficacia y adaptabilidad para varias tareas de IA.
Perspectiva del sector:
el experto de Nimdzi, Renato Beninatto, que ya delineó sus ideas sobre las principales tendencias que darían forma al sector lingüístico y de contenido en 2025 en nuestro exclusivo libro electrónico, llevó a cabo un experimento para probar un error de traducción y descubrió una diferencia interesante entre GPT-4o y DeepSeek V3 a la hora de traducir una frase en español especialmente complicada.
Publicó en LinkedIn: «Este experimento revela que existe una importante brecha entre estos modelos de IA en lo que respecta a las capacidades de razonamiento. DeepSeek demostró contar con un análisis gramatical sólido, pero tuvo dificultades con el contexto más amplio. ChatGPT demostró tener un razonamiento superior porque comprendió la relación entre la premisa del contenido (cuatro palabras) y la traducción».
¿Traducción basada en IA rentable? Una nueva era
El coste es una cuestión importante para muchos responsables que quieren impulsar la adopción de modelos de IA en la creación y localización de contenido. Si bien muchos de los grandes actores de la IA tienen precios de token similares, uno de los principales disruptores en cuanto a coste de LLM ha sido la llegada de DeepSeek.
Se dice que el entrenamiento de DeepSeek se ha realizado por una fracción del coste de sus rivales, por lo que su coste por token también es generalmente mucho menor. Es probable que este coste menor también permita que aprovechar el poder de un LLM sea mucho más viable a nivel financiero para las pequeñas empresas y otras organizaciones.
Es muy probable que los costes de los LLM desciendan. Pero para muchas empresas que ya han invertido en crear una base terminológica o una memoria de traducción con la traducción automática neuronal, o para casos de uso de gran volumen, por ahora podría seguir siendo más rentable utilizar la TAN, especialmente porque la TAN es capaz de procesar grandes volúmenes de contenido más rápido.
Perspectiva del sector
«A la hora de elegir usar un LLM o NMT para traducir no hay una opción que se adapte a todas las circunstancias. La solución más rentable depende del tipo de contenido, el público objetivo, el volumen del contenido y muchos más factores. Por eso, los proveedores de servicios lingüísticos, con su experiencia en la implementación de soluciones de IA y TAN, tienen una posición privilegiada para ayudar a encontrar el equilibrio perfecto».
Pavel Soukenik, responsable de soluciones globales, Acolad
Modelos de peso abierto y personalización: ¿la revolución de la localización?
Tal vez la diferencia más importante entre DeepSeek y los principales LLM rivales es que el primero está disponible a través de un modelo de peso abierto. Aunque hay quien puede describirla como código abierto, un gran número de especialistas insiste en que un modelo de IA que hace accesibles al público sus parámetros entrenados mientras mantiene privados otros aspectos del modelo debería denominarse «peso abierto».
En cualquier caso, a diferencia de la mayoría de los LLM rivales, DeepSeek se puede personalizar, con la posibilidad de descargar, modificar y desplegar modelos «in situ» que permiten a las empresas ajustar la IA de una forma concreta, como para adaptarse a combinaciones lingüísticas y terminología específica del sector.
Esto podría ser especialmente revolucionario para el desarrollo de nuevos modelos diseñados especialmente para manejar el trabajo en idiomas con pocos recursos que pueden estar desatendidos por los modelos propios. Además, las organizaciones podrían entrenar al modelo de forma segura con sus propias memorias de traducción, bases de datos terminológicas y directrices de marca, todo ello sin exponer datos sensibles a terceros.
Los modelos de peso abierto tienen el potencial de democratizar realmente la tecnología lingüística avanzada, al tiempo que permiten que las organizaciones mantengan sus ventajas lingüísticas competitivas. Muchas más empresas podrían ejecutar aplicaciones personalizadas de los modelos, sin los enormes costes iniciales que conlleva el entrenamiento del modelo.
Traducción basada en IA y conformidad normativa: el dilema de la seguridad de los datos
A medida que crece la adopción de la IA, no desaparecen las preocupaciones sobre la seguridad de los datos, la conformidad normativa y la ética.
Por ejemplo, en Australia, Estados Unidos, Italia, Taiwán y Corea del Sur, las autoridades ya han tomado medidas para aplicar restricciones al uso de DeepSeek por la preocupación con respecto a los datos y la confidencialidad. En un principio, Italia siguió un camino similar cuando se lanzó ChatGPT.
La protección de los datos, los marcos normativos y otras cuestiones sobre la conformidad normativa siguen siendo un obstáculo importante para la adopción de la IA en muchas áreas, especialmente en los sectores regulados.
Estas son algunas de las cuestiones clave que los líderes empresariales deben tener en cuenta:
¿Pueden los modelos de IA asegurar la protección de los datos y la conformidad con las normas locales cuando se utilizan para las traducciones?
¿Es factible que las empresas opten por modelos de IA hospedados a nivel local para salvaguardar la seguridad de los datos?
¿Cuál será el impacto de los enfoques divergentes sobre la regulación de la IA entre Europa, Estados Unidos y Asia?
Si bien no hay respuestas sencillas para estas preguntas, las organizaciones tienen que evaluar de forma cuidadosa si las herramientas de traducción basadas en IA pueden responder a sus obligaciones de conformidad normativa, tener en cuenta la viabilidad de los modelos hospedados localmente y prepararse para las implicaciones de los enfoques regulatorios divergentes entre las grandes regiones del mundo.
¿Cuál es el futuro de la traducción impulsada por IA?
Tal y como hemos visto, el panorama sigue cambiando y los modelos de peso abierto están desafiando a los sistemas propios tradicionales, mientras que las capacidades de personalización y la rentabilidad se están convirtiendo en diferenciadores clave del mercado.
El futuro tal vez apunte hacia un acceso más democratizado a la tecnología de IA que permita que los proveedores de servicios lingüísticos y empresas más pequeñas puedan tener la capacidad de desplegar y personalizar sus propias soluciones de IA. Es probable que se acelere la tendencia a la implantación local y la personalización de los modelos, especialmente en las organizaciones que trabajan con idiomas con recursos escasos y terminología de sectores especializados.
Sin embargo, esta evolución debe sortear aguas normativas complejas, ya que cada país tiene su propio enfoque con respecto a la gobernanza de la IA. El sector tendrá que encontrar un buen equilibrio entre la innovación y la conformidad normativa, sobre todo a medida que continúan surgiendo diferencias regionales con respecto a la regulación aplicable a la IA.
Aprendizajes clave para empresas y profesionales de la localización:
✔ Los modelos de IA están mejorando, pero, en algunos casos, como cuando hay grandes volúmenes de contenido, los motores de TAN tradicionales podrían seguir siendo la mejor opción.
✔ Los modelos de IA de peso abierto pueden impulsar la innovación en el sector, pero la adopción depende de la claridad normativa.
✔ La traducción basada en IA debería utilizarse de forma estratégica; por ejemplo, con contenido creativo y posedición automática.
✔ Las preocupaciones sobre la seguridad y la conformidad de los datos siguen siendo factores fundamentales a la hora de elegir una herramienta de IA.
Perspectiva del sector
«El futuro de la IA en la traducción y la localización no solo está relacionado con la tecnología, sino con nuestra forma de encontrar un equilibrio entre seguridad, conformidad e innovación. La IA está transformando el sector lingüístico, pero el auténtico poder viene de la adaptación de estas tecnologías a contextos concretos».
Pavel Soukenik, responsable de soluciones globales, Acolad
19 de marzo de 2025
Traducción
Artículos relacionados