100%
livraison dans les délais, aucune retouche nécessaire
Formation d'une IA multilingue à l'aide de données vocales réelles
Découvrez comment un leader mondial de la technologie a développé la reconnaissance vocale de l'IA avec plus de 120 heures de données vocales diverses et réelles.
Au sujet du client
L'une des plus grandes entreprises technologiques au monde, au service de millions de personnes dans plus de 70 pays, a entrepris de rendre sa plateforme plus intelligente et plus accessible grâce à de nouvelles fonctions vocales alimentées par l'IA. Pour réussir, ils avaient besoin de données multilingues qui reflétaient vraiment la façon dont leurs utilisateurs parlaient et interagissaient dans le monde réel - diversifiées, authentiques et de haute qualité.
20%
réduction des coûts de recrutement
+120
heures de données vocales et vidéo capturées
+170
des locuteurs de 6 groupes d'accents anglais
L'IA vocale au service de tous
Des voix diverses pour une IA inclusive
L'entreprise souhaitait que ses fonctions d'IA vocale reflètent la diversité de ses utilisateurs. Cela signifie qu'il fallait s'assurer que les personnes ayant des accents anglais différents - dont certains sont souvent négligés - étaient correctement représentées dans les données.
Saisir les conditions du monde réel
Comme les utilisateurs interagissent avec l'application dans toutes sortes d'environnements, l'IA devait également être performante dans différents contextes acoustiques : des petites salles de réunion aux salles de conférence très fréquentées, en utilisant une grande variété d'appareils.
La mise à l'échelle sans distraction
La gestion de ce type de collecte de données à grande échelle dans plusieurs régions dépassait largement les ressources internes de l'entreprise. Ils avaient besoin d'un partenaire de confiance pour fournir un ensemble de données prêt à l'emploi sans ralentir leurs équipes.

"Derrière chaque ensemble de données se cache un défi de conception. La diversité du monde réel, la complexité logistique et la précision technologique doivent toutes s'aligner pour fournir des données prêtes pour l'IA à grande échelle."
Jennifer Nacinelli, responsable du programme de données sur l'IA, Acolad

Un cadre pour la collecte de données dans le monde réel
Construire un laboratoire contrôlé
Pour s'assurer que la collecte des données soit authentiquement conforme aux cas d'utilisation réels du client, nous avons conçu et construit trois environnements d'enregistrement dédiés pour imiter les configurations d'entreprise, des petites salles de réunion aux grandes salles de conférence. Chaque pièce présentait des conditions acoustiques différentes et utilisait une variété d'appareils haut de gamme pour capturer des données authentiques pour les modèles d'IA du client.
Trouver les bonnes voix pour la diversité des données
Nous savions que pour créer une IA inclusive, nous avions besoin de voix diverses. Notre équipe a recruté plus de 170 orateurs dans de nombreux endroits. Nous avons commencé à Las Vegas, mais nous nous sommes étendus à Bangkok pour prendre en compte les accents sous-représentés, ce qui nous a également permis de réduire les coûts et d'accélérer le calendrier du projet. Le succès du projet a également ouvert la voie à la collecte de données dans de nouvelles langues.
Gérer les détails sur place
Pour garantir un processus de collecte de données cohérent et des résultats de haute qualité, Acolad a déployé des équipes sur place pour tout gérer, du dépannage des appareils aux soins des participants. Notre coordination de bout en bout a permis à chaque session - et au projet dans son ensemble - de rester sur la bonne voie.
Garantir la qualité des données
Fournir des données de haute qualité ne se limite pas à les enregistrer ; il s'agit également de les valider de manière rigoureuse. Tous les contenus capturés ont été revus et traités par des flux de travail humains afin de garantir la qualité de la transcription et la cohérence des métadonnées. Ce contrôle rigoureux de la qualité a contribué à garantir la fiabilité des données de formation, permettant au client de tester la performance vocale dans des conditions variées et d'optimiser ses algorithmes d'IA en conséquence.
Des voix diverses
Environnements réalistes
Exécution sans faille
Qualité validée
Fournir des données de formation à l'IA inclusives et à fort impact
Le projet a permis d'obtenir plus de 120 heures de données vocales et vidéo riches, entièrement annotées, diversifiées sur le plan démographique et robustes sur le plan technique. En fournissant un ensemble de données audio et vidéo fiables et de haute qualité, Acolad a permis au client de tester et d'affiner ses outils de transcription, de sous-titrage et de résumé de réunion par IA. Chaque projet a été livré à 100 % dans les délais, sans aucune retouche, et nous avons aidé le client à réduire de 20 % ses coûts de recrutement.
Ce partenariat fructueux a permis à ce leader mondial de la technologie de se concentrer plus efficacement sur son cœur de métier, en sachant que son IA était entraînée avec des données qui reflétaient véritablement le monde réel.
Nous l'avons fait :
- Des données d'entraînement réalistes reflétant la complexité du monde réel.
- Amélioration de la précision du modèle d'IA.
- Délai de mise sur le marché réduit
- Un cadre évolutif pour l'expansion future des projets.