2025 年 7 月 2 日发布

人工智能时代的机器翻译:MT 的过去、现在和未来

在 Acolad 庆祝 30 周年之际,我们探讨了机器翻译和人工智能的发展及其对全球通信的革命性影响。
人工智能时代的机器翻译:MT 的过去、现在和未来
在 Acolad 庆祝 30 周年之际,我们探讨了机器翻译和人工智能的发展及其对全球通信的革命性影响。

机器翻译的基础

自动翻译的理念是人类历史上最强大的理念之一。从《星球大战》中的 C-3PO 到《银河系漫游指南》中的巴别鱼,我们的文化表明,即时翻译任何语言的能力都具有强大的诱惑力。

在 Acolad 庆祝成立 30 周年之际,正是回顾机器翻译(MT) 发展历程的最佳时刻。在过去的三十年里,我们亲眼见证了这项技术的发展。从早期的基于规则的系统到神经网络和生成式人工智能的兴起,我们不仅见证了 MT 的变革,还一直在帮助推动这一开创性技术向前发展。

因此,请与我们一起探索 MT 是如何发展起来的,以及它在人工智能时代的下一个发展方向。

在本文中,我们将介绍

  • 冷战时期机器翻译的起源
  • 从基于规则的模型到统计模型的转变
  • 神经网络如何彻底改变 MT 精确度
  • 生成式人工智能在下一阶段翻译技术中的作用
  • Acolad 对 MT 和企业就绪型人工智能平台的贡献
  • 在人工智能创新的世界里,自动翻译的下一步是什么?

了解 Acolad Lia 如何帮助您大规模释放人工智能的优势

基于规则和统计的系统

自动翻译的起源

第二次世界大战期间,出于破译密码信息的需要,播下了机器翻译的种子。沃伦-韦弗(Warren Weaver)和叶霍舒亚-巴尔-希勒(Yehoshua Bar-Hillel)等早期先驱奠定了基础,他们尝试使用基于规则的系统,这些系统依赖于字典和语法结构。1954 年的乔治敦-IBM 实验展示了俄语到英语的初级翻译,吸引了公众的注意力,并激发了人们的乐观情绪,尽管当时该技术仍处于起步阶段。

从规则到数据RBMT 和 SMT 的崛起

基于规则的机器翻译(RBMT)是第一个被广泛使用的方法。这些系统使用复杂的语言规则和词典来指导翻译过程。RBMT 在语言的复杂性和细微差别方面举步维艰,经常产生直译和呆板的译文,尤其是在有歧义的短语或成语表达方面。

紧随其后的是统计机器翻译 (SMT),它在 20 世纪 80 年代开始成为现实。SMT 不只是依靠规则,而是利用大量文本数据(源语言和目标语言的示例文本)来学习统计模式,从而做出更明智的翻译选择。虽然这有助于提高翻译质量,但在处理上下文和罕见词汇方面仍有困难。不过,利用大量文本数据 "训练 "模型的方法将是一项重要的进步,即使在当今更先进的模型中也仍在使用。

显示国旗和数据的增强图像

 

神经网络机器翻译

神经网络的突破

千禧年后的几十年里,神经机器翻译(NMT)的发展可以说是该领域的一场革命。NMT 采用人工神经网络(一种受人脑启发的机器学习模型)来分析和理解句子的含义。通过捕捉上下文关系和长距离依赖关系,NMT 生成的翻译比以往的统计方法准确得多。大多数人都熟悉谷歌翻译或 Acolad Partner DeepL,这些都是使用 NMT 的工具。

Acolad 在 NMT 创新中的作用

Acolad 很自豪地说,它在推动 NMT 技术发展方面发挥了作用。自从十多年前 MT 技术开始大显身手以来,我们一直在开发和维护我们的专业 MT 引擎,并通过与德国人工智能研究中心 (DFKI) 的合作开创了这项技术。开源框架是以协作方式开发新技术的重要途径,我们在推动开源 NMT 框架方面发挥了重要作用。

人工智能和 MT - 未来?

进入生成式人工智能

随着 2022 年 11 月 ChatGPT 的公开发布,生成式人工智能的崛起成为公众关注的焦点,我们正在进入一个自动翻译的新时代。尽管 NMT 和 Gen AI 肯定是相邻的技术--语言建模是两者的一个重要方面--但两者还是存在一些关键区别。NMT 利用神经网络学习语言数据中的模式,根据统计概率翻译文本。而生成式人工智能则使用大型语言模型,根据学习到的模式和对上下文的理解来生成翻译。

虽然 MT 在许多翻译任务中仍有其优势,尤其是在使用成熟引擎大规模处理内容时,但似乎越来越多的企业正在寻求在其内容创建和本地化管道的某个阶段利用人工智能,无论是用于翻译、质量评估、自动后期编辑,还是更多。

Slator 的《2025 年语言行业市场报告》显示,54% 的语言服务集成商已经在其业务工作流程中采用了人工智能或 LLM,而 2024 年这一比例仅为三分之一--采用率正在快速增长。

人类 + 人工智能 通往可扩展质量之路

目前,使用人工智能来优化翻译已被证明是有效和具有成本效益的,再加上人工作为专家提示工程师或后期编辑,可以提供高质量的内容。为此,许多语言服务提供商开发了人工智能平台或套件,努力将人工智能的生产力优势与人类的专业知识结合起来。我们自己的 Lia 平台正处于开发这些功能的前沿,以提高多语言内容的卓越性和效率。

尽管如此,如果没有提供高质量提示的专业人员、进行后期编辑的语言专家以及将技术与企业现有内容工作流程无缝整合的技术诀窍,所有这些技术开发都是不可能实现的。

通过人与技术的合作扩大创新规模

我们专业的 Acolad 团队将继续推进我们在这一领域的工作,他们的开创性工作使我们能够开发创新方法,有效地融合人类、人工智能和机器学习能力,确保开创性的新人工智能技术能够有效地为全球各大企业大规模实施。

因此,在我们庆祝走在语言技术前沿的 30 年之际,为下一个 30 年干杯!

freelancer-avatars-centered 1

与我们的专家探讨您的下一个全球性项目