Home / Serviços / Serviços de dados / Formação de IA multilingue

Treinar IA multilingue com dados de voz do mundo real

Descubra como um líder tecnológico global escalou o reconhecimento de voz de IA com mais de 120 horas de dados de voz diversos e reais.


Indústria e serviços

Sobre o cliente
Uma das maiores empresas de tecnologia do mundo, que serve milhões de pessoas em mais de 70 países, decidiu tornar a sua plataforma mais inteligente e mais acessível através de novas funcionalidades de voz alimentadas por IA. Para serem bem sucedidos, precisavam de dados multilingues que reflectissem verdadeiramente a forma como os seus utilizadores falam e interagem no mundo real - diversificada, autêntica e de alta qualidade.

av_timer

100%
entrega atempada, sem necessidade de retrabalho

attach_money

20%
redução dos custos de recrutamento

mic

120+
horas de dados de voz e vídeo captados

group

170+
falantes de 6 grupos de sotaque inglês

O desafio

Garantir que a IA de voz funciona para todos

Vozes diversas para uma IA inclusiva

A empresa pretendia que as suas funcionalidades de IA vocal reflectissem a diversidade dos seus utilizadores. Isso significava garantir que as pessoas com diferentes sotaques ingleses - algumas delas frequentemente ignoradas - estavam corretamente representadas nos dados.

Capturar condições do mundo real

Uma vez que os utilizadores interagem com a aplicação em todos os tipos de ambientes, a IA também tinha de ter um bom desempenho em diferentes ambientes acústicos: desde pequenas salas de reuniões a salas de reuniões movimentadas, utilizando uma variedade de dispositivos.

Escalar sem distração

A gestão deste tipo de recolha de dados em grande escala em várias regiões estava muito para além dos recursos internos da empresa. Precisavam de um parceiro de confiança para fornecer um conjunto de dados pronto a utilizar sem atrasar as suas equipas.

square-35

"Por detrás de cada conjunto de dados está um desafio de conceção. A diversidade do mundo real, a complexidade logística e a precisão tecnológica devem estar alinhadas para fornecer dados prontos para IA em escala."

 

Jennifer Nacinelli, Gestora do Programa de Dados de IA, Acolad

square-27
A solução

Um quadro para a recolha de dados no mundo real

Construir um laboratório controlado

Para garantir que a recolha de dados era autêntica para os casos de utilização reais do cliente, concebemos e construímos três ambientes de gravação dedicados para imitar as configurações empresariais, desde pequenas salas de reunião a grandes salas de reuniões. Cada sala apresentava condições acústicas diferentes e utilizava uma variedade de dispositivos de topo de gama para captar dados autênticos para os modelos de IA do cliente.

Encontrar as vozes certas para a diversidade de dados

Sabíamos que, para construir uma IA inclusiva, precisávamos de vozes diversas. A nossa equipa recrutou mais de 170 oradores em vários locais. Começámos em Las Vegas, mas expandimo-nos para Banguecoque para captar sotaques pouco representados, o que também nos ajudou a reduzir os custos e a acelerar o calendário do projeto. O êxito do projeto abriu também a porta à recolha de dados em novas línguas.

Gerir os pormenores no local

Para garantir um processo de recolha de dados consistente e uma produção de alta qualidade, a Acolad implementou equipas no local para gerir tudo, desde a resolução de problemas dos dispositivos até aos cuidados com os participantes. A nossa coordenação de ponta a ponta garantiu que cada sessão - e o projeto em geral - se mantivesse no caminho certo.

Garantir a qualidade dos dados

Fornecer dados de alta qualidade não era apenas registá-los; era também uma questão de validação rigorosa. Todo o conteúdo capturado foi revisto e processado através de fluxos de trabalho conduzidos por humanos para garantir a qualidade da transcrição e a consistência dos metadados. Este rigoroso controlo de qualidade ajudou a garantir a fiabilidade dos dados de formação, permitindo ao cliente testar o desempenho da voz em condições variadas e otimizar os seus algoritmos de IA em conformidade.

Diversity_3

Vozes diversas

Um grupo de oradores selecionados para diversidade demográfica e de sotaque inglês, garantindo que os dados reflectem a base global de utilizadores.
frame_person_mic

Ambientes realistas

Ambientes de gravação personalizados para simular as condições de reunião do mundo real.
automation

Execução sem falhas

Equipas totalmente geridas no local asseguraram um processo de recolha de dados e entrega sem problemas.
star_shine

Qualidade validada

Conjuntos de dados validados por humanos, fornecendo ao cliente dados fiáveis e prontos a utilizar para os seus modelos de IA.
Os resultados

Fornecer dados de formação em IA inclusivos e de grande impacto

O projeto forneceu mais de 120 horas de dados de voz e vídeo de grande qualidade - totalmente anotados, demograficamente diversificados e tecnicamente robustos. Ao fornecer um conjunto de dados de áudio e vídeo fiável e de alta qualidade, a Acolad permitiu ao cliente testar e aperfeiçoar as suas ferramentas de transcrição de IA, legendagem e resumo de reuniões. Todos os projectos foram entregues 100% dentro do prazo, sem necessidade de retrabalho, e ajudámos o cliente a conseguir uma redução de 20% nos custos de recrutamento.

Esta parceria de sucesso permitiu a este líder tecnológico global concentrar-se de forma mais eficiente no seu negócio principal, confiante de que a sua IA estava a ser treinada com dados que reflectiam verdadeiramente o mundo real.

Nós cumprimos:

  • Dados de treino realistas que reflectem a complexidade do mundo real.
  • Melhoria da precisão do modelo de IA.
  • de redução do time-to-market
  • Um quadro escalável para a futura expansão do projeto.
freelancer-avatars-centered 1

Precisa de dados fiáveis do mundo real para alimentar a sua IA?