100%
tijdige levering, geen herbewerking nodig
Meertalige AI trainen met spraakgegevens uit de echte wereld
Ontdek hoe een wereldwijd technologisch leider AI spraakherkenning opschaalde met meer dan 120 uur aan uiteenlopende spraakgegevens uit de echte wereld.
Over de klant
Een van 's werelds grootste technologiebedrijven, die miljoenen mensen in meer dan 70 landen bedient, wilde zijn platform slimmer en toegankelijker maken met nieuwe AI-gestuurde spraakfuncties. Om te slagen, hadden ze meertalige gegevens nodig die echt een afspiegeling waren van de manier waarop hun gebruikers spreken en met elkaar omgaan in de echte wereld - divers, authentiek en van hoge kwaliteit.
20%
lagere wervingskosten
+120
uren aan spraak- en videogegevens vastgelegd
+170
sprekers van 6 Engelse accentgroepen
Spraak-AI werkt voor iedereen
Diverse stemmen voor inclusieve AI
Het bedrijf wilde dat zijn voice AI-functies de diversiteit van zijn gebruikers zouden weerspiegelen. Dat betekende dat we ervoor moesten zorgen dat mensen met verschillende Engelse accenten - waarvan sommige vaak over het hoofd worden gezien - goed werden vertegenwoordigd in de gegevens.
Omstandigheden in de echte wereld vastleggen
Omdat gebruikers de app in allerlei omgevingen gebruiken, moest de AI ook goed presteren in verschillende akoestische omgevingen: van kleine vergaderruimtes tot drukke bestuurskamers, met gebruik van verschillende apparaten.
Schalen zonder afleiding
Het beheren van dit soort grootschalige gegevensverzameling in meerdere regio's ging de interne middelen van het bedrijf ver te boven. Ze hadden een betrouwbare partner nodig die een gebruiksklare dataset kon leveren zonder hun teams te vertragen.

"Achter elke dataset schuilt een ontwerpuitdaging. Diversiteit in de echte wereld, logistieke complexiteit en technologische precisie moeten op één lijn worden gebracht om AI-ready data op schaal te kunnen leveren."
Jennifer Nacinelli, programmamanager AI-gegevens, Acolad

Een kader voor gegevensverzameling in de echte wereld
Een gecontroleerd laboratorium bouwen
Om ervoor te zorgen dat de gegevensverzameling authentiek was voor de echte gebruikssituaties van de klant, ontwierpen en bouwden we drie speciale opnameomgevingen om bedrijfsomgevingen na te bootsen, van kleine vergaderruimtes tot grote bestuurskamers. Elke ruimte had verschillende akoestische omstandigheden en er werden verschillende apparaten uit de topmarkt gebruikt om authentieke gegevens vast te leggen voor de AI-modellen van de klant.
De juiste stemmen vinden voor gegevensdiversiteit
We wisten dat we verschillende stemmen nodig hadden om een inclusieve AI te bouwen. Ons team wierf meer dan 170 sprekers op verschillende locaties. We begonnen in Las Vegas maar breidden uit naar Bangkok om ondervertegenwoordigde accenten te leggen, wat ons ook hielp om de kosten te drukken en de tijdlijn van het project te versnellen. Het succes van het project opende ook de deur naar het verzamelen van gegevens in nieuwe talen.
De details ter plaatse beheren
Om een consistent gegevensverzamelingsproces en uitvoer van hoge kwaliteit te garanderen, zette Acolad teams op locatie in om alles te beheren, van het oplossen van problemen met apparaten tot de zorg voor de deelnemers. Onze end-to-end coördinatie zorgde ervoor dat elke sessie - en het project als geheel - op schema bleef.
Datakwaliteit garanderen
Het leveren van gegevens van hoge kwaliteit was niet alleen een kwestie van registreren, maar ook van rigoureus valideren. Alle vastgelegde inhoud werd beoordeeld en verwerkt via menselijke workflows om de kwaliteit van de transcriptie en de consistentie van de metadata te garanderen. Deze rigoureuze kwaliteitscontrole hielp de betrouwbaarheid van de trainingsgegevens te garanderen, zodat de klant de stemprestaties onder verschillende omstandigheden kon testen en zijn AI-algoritmen dienovereenkomstig kon optimaliseren.
Diverse stemmen
Realistische omgevingen
Naadloze uitvoering
Gevalideerde kwaliteit
Inclusieve AI-trainingsgegevens met grote impact leveren
Het project leverde meer dan 120 uur aan rijke spraak- en videodata op - volledig geannoteerd, demografisch divers en technisch robuust. Door een betrouwbare, hoogwaardige audio- en videodataset te leveren, stelde Acolad de klant in staat om hun AI-transcriptie, ondertiteling en tools voor het samenvatten van vergaderingen te testen en te verfijnen. Elk project werd 100% op tijd opgeleverd, er was geen herbewerking nodig en we hebben de klant geholpen om de wervingskosten met 20% te verlagen.
Dankzij deze succesvolle samenwerking kon deze wereldwijde technologieleider zich efficiënter richten op zijn kernactiviteiten, in het vertrouwen dat zijn AI werd getraind met gegevens die de echte wereld weerspiegelden.
We hebben geleverd:
- Realistische trainingsgegevens die de complexiteit van de echte wereld weerspiegelen.
- Verbeterde nauwkeurigheid AI-model.
- kortere time-to-market
- Een schaalbaar kader voor toekomstige projectuitbreiding.