Home / Servicios / Servicios de datos / Entrenamiento de IA multilingüe

Entrenamiento de IA multilingüe con datos de voz del mundo real

Descubra cómo un líder tecnológico mundial ha ampliado el reconocimiento de voz mediante IA con más de 120 horas de datos de voz reales y diversos.


Acerca del cliente
Una de las mayores empresas tecnológicas del mundo, que presta servicio a millones de personas en más de 70 países, se propuso hacer su plataforma más inteligente y accesible a través de nuevas funciones de voz impulsadas por IA. Para tener éxito, necesitaban datos multilingües que reflejaran realmente la forma en que sus usuarios hablan e interactúan en el mundo real: diversos, auténticos y de alta calidad.

av_timer

100%
entrega puntual, sin necesidad de retoques

attach_money

20%
reducción de los costes de contratación

mic

+120
horas de datos de voz y vídeo capturados>

group

+170
hablantes de 6 grupos de acento inglés

El reto

Garantizar que la IA de voz funcione para todos

Voces diversas para una IA inclusiva

La empresa quería que sus funciones de IA por voz reflejaran la diversidad de sus usuarios. Eso significaba asegurarse de que las personas con diferentes acentos ingleses -algunos de ellos a menudo pasados por alto- estuvieran debidamente representados en los datos.

Capturar las condiciones del mundo real

Dado que los usuarios interactúan con la aplicación en todo tipo de entornos, la IA también tenía que funcionar bien en diferentes entornos acústicos: desde pequeñas salas de reuniones hasta concurridas salas de juntas, utilizando diversos dispositivos.

Escalar sin distracciones

Gestionar este tipo de recogida de datos a gran escala en múltiples regiones superaba con creces los recursos internos de la empresa. Necesitaban un socio de confianza que les proporcionara un conjunto de datos listos para usar sin ralentizar a sus equipos.

square-35

"Detrás de cada conjunto de datos hay un reto de diseño. La diversidad del mundo real, la complejidad logística y la precisión tecnológica deben alinearse para ofrecer datos listos para la IA a escala."

 

Jennifer Nacinelli, Directora del Programa de Datos de Inteligencia Artificial, Acolad

square-27
La solución

Un marco para la recogida de datos del mundo real

Construir un laboratorio controlado

Para garantizar que la recopilación de datos se ajustaba a los casos de uso reales del cliente, diseñamos y construimos tres entornos de grabación específicos para imitar las configuraciones empresariales, desde pequeñas salas de reuniones hasta grandes salas de juntas. Cada sala presentaba condiciones acústicas diferentes y utilizaba diversos dispositivos de primera línea para capturar datos auténticos para los modelos de IA del cliente.

Encontrar las voces adecuadas para la diversidad de datos

Sabíamos que para construir una IA inclusiva necesitábamos voces diversas. Nuestro equipo contrató a más de 170 ponentes en múltiples lugares. Empezamos en Las Vegas, pero nos expandimos a Bangkok para captar acentos poco representados, lo que también nos ayudó a reducir costes y acelerar los plazos del proyecto. El éxito del proyecto también abrió la puerta a la recogida de datos en nuevas lenguas.

Gestión de los detalles in situ

Para garantizar un proceso de recopilación de datos coherente y unos resultados de alta calidad, Acolad desplegó equipos in situ para gestionar todos los aspectos, desde la resolución de problemas de los dispositivos hasta la atención a los participantes. Nuestra coordinación de principio a fin garantizó que todas las sesiones -y el proyecto en general- siguieran su curso.

Garantizar la calidad de los datos

Ofrecer datos de alta calidad no consistía sólo en registrarlos, sino también en validarlos rigurosamente. Todos los contenidos capturados se revisaron y procesaron mediante flujos de trabajo dirigidos por personas para garantizar la calidad de la transcripción y la coherencia de los metadatos. Este riguroso control de calidad ayudó a garantizar la fiabilidad de los datos de entrenamiento, lo que permitió al cliente probar el rendimiento de la voz en distintas condiciones y optimizar sus algoritmos de IA en consecuencia.

Diversity_3

Voces diversas

Un grupo de hablantes seleccionados por su diversidad demográfica y de acento inglés, para garantizar que los datos reflejen la base de usuarios global.
frame_person_mic

Entornos realistas

Entornos de grabación personalizados para simular las condiciones reales de una reunión.
automation

Ejecución perfecta

Equipos in situ totalmente gestionados garantizaron un proceso de recopilación y entrega de datos sin contratiempos.
star_shine

Calidad validada

Conjuntos de datos validados por humanos, que proporcionan al cliente datos fiables y listos para usar en sus modelos de IA.
El resultado

Datos de entrenamiento de IA inclusivos y de gran impacto

El proyecto proporcionó más de 120 horas de ricos datos de voz y vídeo, totalmente anotados, demográficamente diversos y técnicamente sólidos. Al proporcionar un conjunto de datos de audio y vídeo fiable y de alta calidad, Acolad permitió al cliente probar y perfeccionar sus herramientas de transcripción, subtitulación y resumen de reuniones mediante IA. Todos los proyectos se entregaron 100% a tiempo, sin necesidad de repeticiones, y ayudamos al cliente a reducir en un 20% los costes de contratación.

Esta fructífera colaboración permitió a este líder tecnológico mundial centrarse más eficazmente en su actividad principal, con la seguridad de que su IA se estaba entrenando con datos que reflejaban realmente el mundo real.

Cumplimos:

  • Datos de entrenamiento realistas que reflejan la complejidad del mundo real.
  • Mejora de la precisión del modelo de IA.
  • Reducción del plazo de comercialización
  • Un marco escalable para la futura ampliación del proyecto.
freelancer-avatars-centered 1

¿Necesita datos fiables del mundo real para alimentar su IA?