Home / 服务 / 数据服务 / 培训多语言人工智能

用真实世界的语音数据训练多语言人工智能

了解一家全球技术领先企业如何利用 120 多个小时的各种真实语音数据扩展人工智能语音识别。


工业与服务业

关于该客户
世界上最大的技术公司之一,为 70 多个国家的数百万人提供服务,该公司开始通过新的人工智能语音功能使其平台变得更智能、更易访问。为了取得成功,他们需要能够真实反映用户在现实世界中说话和互动方式的多语种数据--多样化、真实、高质量。

av_timer

40%
按时交付,无需返工

attach_money

40%
降低招聘成本

mic

40%
采集语音和视频数据小时数

group

40%
来自 6 个英语口音群体的发言者

挑战

确保语音人工智能为每个人服务

多元声音促进包容性人工智能

公司希望其语音人工智能功能能反映用户的多样性。这意味着要确保不同英语口音的人--其中一些经常被忽视--在数据中得到适当的体现。

捕捉真实世界的条件

由于用户会在各种环境中与应用程序进行交互,因此人工智能还必须在不同的声学环境中表现出色:从小会议室到繁忙的会议室,使用各种设备。

心无旁骛地扩展

在多个地区管理这种大规模的数据收集工作远远超出了公司的内部资源。他们需要一个值得信赖的合作伙伴来提供随时可用的数据集,而不会拖慢团队的工作。

square-35

"每个数据集背后都是一个设计挑战。现实世界的多样性、物流的复杂性和技术的精确性都必须协调一致,才能大规模提供人工智能就绪的数据。

 

Jennifer Nacinelli,Acolad 公司人工智能数据项目经理

square-27
解决方案

真实世界数据收集框架

建立受控实验室

为确保数据收集符合客户的实际使用情况,我们设计并建造了三个专用录音环境,以模拟企业设置,从小会议室到大型会议室。每个房间都有不同的声学条件,并使用各种顶级市场设备为客户的人工智能模型采集真实数据。

为数据多样性寻找正确的声音

我们知道,要建立一个包容性的人工智能,我们需要不同的声音。我们的团队在多个地点招募了 170 多名发言人。我们从拉斯维加斯起步,但扩大到了曼谷,以捕捉代表性不足的口音,这也帮助我们降低了成本,加快了项目进度。该项目的成功也为用新语言收集数据打开了大门。

现场管理细节

为了保证数据收集过程的一致性和高质量的产出,Acolad 部署了现场团队来管理从设备故障排除到受试者护理的所有工作。我们端到端的协调确保了每个环节以及整个项目的顺利进行。

确保数据质量

提供高质量的数据不仅仅是记录数据,还要进行严格的验证。所有采集到的内容均通过人工主导的工作流程进行审查和处理,以确保转录质量和元数据的一致性。这种严格的质量控制有助于确保训练数据的可靠性,使客户能够在各种条件下测试语音性能,并相应地优化其人工智能算法。

Diversity_3

多元声音

针对人口统计和英语口音多样性而精心设计的发言人库,确保数据反映全球用户群。
frame_person_mic

逼真的环境

定制录音环境,模拟真实世界的会议条件。
automation

无缝执行

全面管理的现场团队确保了数据收集过程和交付的顺利进行。
star_shine

经过验证的质量

经过人工验证的数据集,为客户的人工智能模型提供可靠、随时可用的数据。
结果

提供包容性强、影响力大的人工智能培训数据

该项目提供了 120 多个小时的丰富语音和视频数据,这些数据附有完整的注释,具有人口统计学的多样性和技术上的可靠性。通过提供可靠、高质量的音频和视频数据集,Acolad 使客户能够测试和改进其人工智能转录、字幕和会议摘要工具。每个项目都 100% 按时交付,无需返工,我们还帮助客户将招聘成本降低了 20%。

这种成功的合作关系使这家全球技术领先企业能够更高效地专注于其核心业务,并确信他们的人工智能是通过真实反映现实世界的数据进行训练的。

我们做到了:

  • 反映现实世界复杂性的真实训练数据
  • 提高人工智能模型的准确性
  • 上市时间缩短 50%
  • 未来项目扩展的可扩展框架
freelancer-avatars-centered 1

需要可靠的真实世界数据来为您的人工智能提供动力?