100%
entrega puntual, sin necesidad de retoques
Entrenamiento de IA multilingüe con datos de voz del mundo real
Descubra cómo un líder tecnológico mundial ha ampliado el reconocimiento de voz mediante IA con más de 120 horas de datos de voz reales y diversos.
Acerca del cliente
Una de las mayores empresas tecnológicas del mundo, que presta servicio a millones de personas en más de 70 países, se propuso hacer su plataforma más inteligente y accesible a través de nuevas funciones de voz impulsadas por IA. Para tener éxito, necesitaban datos multilingües que reflejaran realmente la forma en que sus usuarios hablan e interactúan en el mundo real: diversos, auténticos y de alta calidad.
20%
reducción de los costes de contratación
+120
horas de datos de voz y vídeo capturados>
+170
hablantes de 6 grupos de acento inglés
Garantizar que la IA de voz funcione para todos
Voces diversas para una IA inclusiva
La empresa quería que sus funciones de IA por voz reflejaran la diversidad de sus usuarios. Eso significaba asegurarse de que las personas con diferentes acentos ingleses -algunos de ellos a menudo pasados por alto- estuvieran debidamente representados en los datos.
Capturar las condiciones del mundo real
Dado que los usuarios interactúan con la aplicación en todo tipo de entornos, la IA también tenía que funcionar bien en diferentes entornos acústicos: desde pequeñas salas de reuniones hasta concurridas salas de juntas, utilizando diversos dispositivos.
Escalar sin distracciones
Gestionar este tipo de recogida de datos a gran escala en múltiples regiones superaba con creces los recursos internos de la empresa. Necesitaban un socio de confianza que les proporcionara un conjunto de datos listos para usar sin ralentizar a sus equipos.

"Detrás de cada conjunto de datos hay un reto de diseño. La diversidad del mundo real, la complejidad logística y la precisión tecnológica deben alinearse para ofrecer datos listos para la IA a escala."
Jennifer Nacinelli, Directora del Programa de Datos de Inteligencia Artificial, Acolad

Un marco para la recogida de datos del mundo real
Construir un laboratorio controlado
Para garantizar que la recopilación de datos se ajustaba a los casos de uso reales del cliente, diseñamos y construimos tres entornos de grabación específicos para imitar las configuraciones empresariales, desde pequeñas salas de reuniones hasta grandes salas de juntas. Cada sala presentaba condiciones acústicas diferentes y utilizaba diversos dispositivos de primera línea para capturar datos auténticos para los modelos de IA del cliente.
Encontrar las voces adecuadas para la diversidad de datos
Sabíamos que para construir una IA inclusiva necesitábamos voces diversas. Nuestro equipo contrató a más de 170 ponentes en múltiples lugares. Empezamos en Las Vegas, pero nos expandimos a Bangkok para captar acentos poco representados, lo que también nos ayudó a reducir costes y acelerar los plazos del proyecto. El éxito del proyecto también abrió la puerta a la recogida de datos en nuevas lenguas.
Gestión de los detalles in situ
Para garantizar un proceso de recopilación de datos coherente y unos resultados de alta calidad, Acolad desplegó equipos in situ para gestionar todos los aspectos, desde la resolución de problemas de los dispositivos hasta la atención a los participantes. Nuestra coordinación de principio a fin garantizó que todas las sesiones -y el proyecto en general- siguieran su curso.
Garantizar la calidad de los datos
Ofrecer datos de alta calidad no consistía sólo en registrarlos, sino también en validarlos rigurosamente. Todos los contenidos capturados se revisaron y procesaron mediante flujos de trabajo dirigidos por personas para garantizar la calidad de la transcripción y la coherencia de los metadatos. Este riguroso control de calidad ayudó a garantizar la fiabilidad de los datos de entrenamiento, lo que permitió al cliente probar el rendimiento de la voz en distintas condiciones y optimizar sus algoritmos de IA en consecuencia.
Voces diversas
Entornos realistas
Ejecución perfecta
Calidad validada
Datos de entrenamiento de IA inclusivos y de gran impacto
El proyecto proporcionó más de 120 horas de ricos datos de voz y vídeo, totalmente anotados, demográficamente diversos y técnicamente sólidos. Al proporcionar un conjunto de datos de audio y vídeo fiable y de alta calidad, Acolad permitió al cliente probar y perfeccionar sus herramientas de transcripción, subtitulación y resumen de reuniones mediante IA. Todos los proyectos se entregaron 100% a tiempo, sin necesidad de repeticiones, y ayudamos al cliente a reducir en un 20% los costes de contratación.
Esta fructífera colaboración permitió a este líder tecnológico mundial centrarse más eficazmente en su actividad principal, con la seguridad de que su IA se estaba entrenando con datos que reflejaban realmente el mundo real.
Cumplimos:
- Datos de entrenamiento realistas que reflejan la complejidad del mundo real.
- Mejora de la precisión del modelo de IA.
- Reducción del plazo de comercialización
- Un marco escalable para la futura ampliación del proyecto.