2025 年 3 月 19 日出版

人工智能翻译:DeepSeek、ChatGPT 和 Gemini 等模式是否最适合本地化?

人工智能大语言模型在翻译领域的应用被炒得沸沸扬扬,但它们真的能取代专业本地化吗?
人工智能翻译:DeepSeek、ChatGPT 和 Gemini 等模式是否最适合本地化?
人工智能大语言模型在翻译领域的应用被炒得沸沸扬扬,但它们真的能取代专业本地化吗?

会议室、LinkedIn 评论和网络研讨会仍在热火朝天地讨论人工智能革命及其对翻译和本地化的影响。尽管 LLM 并非专门为翻译而设计,但越来越多的 LLM 被用于创建多语言内容--然而,关于 LLM 在这些任务中的有效性的争论仍在继续。

但专家们是怎么说的呢?

  • 人工智能模型与专门的神经机器翻译 (NMT) 引擎相比如何?
  • 它们适用于大规模本地化,还是更适合创意和小众任务?
  • 它们会带来哪些道德、监管和数据安全方面的挑战?
  • DeepSeek 等开放式人工智能模型是否能真正替代专有解决方案?
  • 在一些专家意见的帮助下,让我们来看看不断演变的人工智能翻译格局,以及它对多语言内容的未来意味着什么。

人工智能翻译:法学硕士如何比较?

虽然 LLM 不一定是为翻译而设计的,但许多业内专业人士和机构一直在测试它们与成熟的神经机器翻译 (NMT) 系统相比的性能。

一些模型,如 Deepseek 最新的 V3 和 R1 模型,因其推理能力而备受赞誉,而 GPT4 和 Claude 等模型则在流畅性和创造性方面取得了很好的效果。

  • DeepSeek:一些专家认为,它的中英翻译质量超过了其他机型。在数学推理任务中,它的表现也尤为突出。不过,一些早期测试表明,与其他一些模型相比,它在处理上下文的细微差别时可能会比较吃力。
  • ChatGPT & Claude:对于高质量、细致入微和富有创意的翻译(通常用于营销或创意内容)而言,这些模式是许多人的首选。它们还可用于本地化工作流程中的各个阶段。在最近的一项研究中,克劳德-桑内特被专家们评为若干语言对中的最佳翻译模型,用于一般翻译任务。
  • 双子座 & LLaMa:谷歌的 Gemini 模型集成了多模态功能,提高了对不同类型内容的上下文理解能力,而 Meta 的 LLaMa 则侧重于各种人工智能任务的效率和适应性。

行业洞察

Nimdzi 行业专家雷纳托-贝尼纳托(Renato Beninatto)在我们的独家电子书中概述了他对 2025 年语言和内容行业主要发展趋势的看法,他进行了一次翻译错误测试实验,发现在翻译一个特别棘手的西班牙语短语时,GPT-4o 和 DeepSeek V3 之间存在有趣的差异。

他在 LinkedIn 上发帖:"这个实验揭示了这些人工智能模型在推理能力上的巨大差距。虽然 DeepSeek 显示出很强的语法分析能力,但它在处理更广泛的语境方面却很吃力。ChatGPT 通过理解内容的前提(四个单词)与翻译之间的关系,展示了卓越的推理能力。"

成本效益高的人工智能翻译?新时代

对于许多希望推动在内容创建和本地化中采用人工智能模型的领导者来说,成本是一个主要考虑因素。虽然许多大型人工智能公司的代币价格都差不多,但在 LLM 成本方面,DeepSeek 的出现是主要的颠覆者之一。

据说,DeepSeek 只用了竞争对手的一小部分成本就完成了培训,因此其每个代币的成本通常远远低于竞争对手。这种较低的成本很可能意味着,对于小型企业和其他组织而言,利用法律硕士的力量在经济上更加可行。

法律硕士的费用很可能呈下降趋势。但是,对于许多已经投资使用神经机器翻译建立术语库或翻译记忆库的企业来说,或者对于大批量使用的案例来说,目前继续使用 NMT 可能更具成本效益,尤其是因为 NMT 可以更快地处理大量内容。

行业洞察

"在选择使用 LLM 或 NMT 进行翻译时,没有放之四海而皆准的方法。最具成本效益的解决方案取决于内容类型、目标受众、内容数量等诸多因素。这就是为什么语言服务提供商--凭借其在实施 NMT 和人工智能解决方案方面的专业知识--能够独当一面,帮助找到正确的平衡点"。

- Pavel Soukenik,Acolad 全球解决方案主管

是否对人工智能改变内容的力量感到好奇?

定制和开放式重量模型:本地化革命?

DeepSeek 与其主要 LLM 竞争对手之间最重要的区别或许在于,该模型是通过开放权重模型提供的。虽然有些人可能会将其描述为开放源代码,但许多专家坚持认为,如果一个人工智能模型将其训练好的参数公开,同时又将模型的其他方面保密,那么这个模型就应该被称为 "开放权重"(Open Weight)。

无论如何,与大多数其他 LLM 竞争对手不同的是,DeepSeek 可进行定制,能够下载、修改和部署内部模型,使企业能够对人工智能进行专门的微调,例如,适应语言对和特定行业的术语。

这对于开发专为处理低资源语言工作而设计的新模型来说,尤其具有开创性意义。除此之外,企业还可以在自己的翻译记忆库、术语数据库和品牌指南上安全地训练该模型,而不会将敏感数据泄露给第三方。

开放式加权模式有可能真正实现先进语言技术的民主化,同时让企业保持其语言竞争优势。更多的企业可以运行这些模型的定制应用,而无需支付培训模型的巨额初始费用。

人工智能翻译与合规:数据安全困境

随着人工智能应用的增长,人们对数据安全、合规性和道德的担忧也不会消失。

例如,澳大利亚、美国、意大利、中国台湾和韩国当局以隐私和数据问题为由,已经开始对 DeepSeek 的使用进行限制。在 ChatGPT 推出之初,意大利也采取了类似的做法。

数据保护、监管框架和其他合规问题仍然是许多领域,特别是受监管行业采用人工智能的主要障碍。

企业领导者需要考虑的关键问题包括

  • 在用于翻译时,人工智能模型能否确保数据保护并符合当地法规?
  • 企业选择本地托管的人工智能模型来保障数据安全是否可行?
  • 欧洲、美国和亚洲在人工智能监管方面的不同做法会产生什么影响?

虽然这些问题没有简单的答案,但企业必须仔细评估人工智能翻译工具能否满足其合规义务,考虑本地托管模式的可行性,并为全球主要地区之间不同监管方法的影响做好准备。

两位同事正在办公室的办公桌前一起审阅和处理一份文件,时间可能是晚上。

 

人工智能助力翻译的下一步是什么?

正如我们所看到的那样,市场格局在不断变化,开放重量级模型正在挑战传统的专有系统,而成本效益和定制能力正在成为市场的关键差异因素。

未来,人工智能技术的使用可能会更加民主化,小型 LSP 和企业将获得部署和定制自己的人工智能解决方案的能力。本地部署和模型定制的趋势可能会加快,特别是对于使用低资源语言和专业行业术语的组织而言。

然而,由于各国对人工智能治理采取了不同的方法,这种演变必须在复杂的监管水域中航行。该行业需要在创新与合规之间取得平衡,尤其是在人工智能监管的地区差异不断显现的情况下。

企业和本地化专业人士的主要收获:

✔ 人工智能模型正在不断改进,但在某些情况下,如内容量大,传统的 NMT 引擎可能仍是最佳选择。
✔ 开放权重的人工智能模型可能会推动行业创新,但采用与否取决于监管的清晰度。
✔ 应战略性地使用人工智能翻译,例如创意内容和自动后期编辑。
✔ 安全和数据合规问题仍然是人工智能工具选择的关键因素。

行业洞察

"人工智能在翻译和本地化领域的未来不仅仅是技术问题,而是我们如何平衡安全性、合规性和创新性的问题。人工智能正在重塑语言行业,但真正的力量来自于使这些技术适应特定环境"。

- Pavel Soukenik,Acolad 全球解决方案主管

freelancer-avatars-centered 1

对人工智能在翻译方面的威力感到好奇?

探索人工智能如何改变本地化,了解 Acolad 的人工智能内容解决方案 Lia。