Casestudy: AI-gegevensverzameling voor slimmere spraaktechnologie

100%
tijdige levering, geen herbewerking nodig

20%
lagere wervingskosten

+120
uren aan spraak- en videogegevens vastgelegd

+170
sprekers van 6 Engelse accentgroepen

De uitdaging

Spraak-AI werkt voor iedereen

Diverse stemmen voor inclusieve AI

Het bedrijf wilde dat zijn voice AI-functies de diversiteit van zijn gebruikers zouden weerspiegelen. Dat betekende dat we ervoor moesten zorgen dat mensen met verschillende Engelse accenten - waarvan sommige vaak over het hoofd worden gezien - goed werden vertegenwoordigd in de gegevens.

Omstandigheden in de echte wereld vastleggen

Omdat gebruikers de app in allerlei omgevingen gebruiken, moest de AI ook goed presteren in verschillende akoestische omgevingen: van kleine vergaderruimtes tot drukke bestuurskamers, met gebruik van verschillende apparaten.

Schalen zonder afleiding

Het beheren van dit soort grootschalige gegevensverzameling in meerdere regio's ging de interne middelen van het bedrijf ver te boven. Ze hadden een betrouwbare partner nodig die een gebruiksklare dataset kon leveren zonder hun teams te vertragen.

"Achter elke dataset schuilt een ontwerpuitdaging. Diversiteit in de echte wereld, logistieke complexiteit en technologische precisie moeten op één lijn worden gebracht om AI-ready data op schaal te kunnen leveren."

Jennifer Nacinelli, programmamanager AI-gegevens, Acolad

De oplossing

Een kader voor gegevensverzameling in de echte wereld

Een gecontroleerd laboratorium bouwen

Om ervoor te zorgen dat de gegevensverzameling authentiek was voor de echte gebruikssituaties van de klant, ontwierpen en bouwden we drie speciale opnameomgevingen om bedrijfsomgevingen na te bootsen, van kleine vergaderruimtes tot grote bestuurskamers. Elke ruimte had verschillende akoestische omstandigheden en er werden verschillende apparaten uit de topmarkt gebruikt om authentieke gegevens vast te leggen voor de AI-modellen van de klant.

De juiste stemmen vinden voor gegevensdiversiteit

We wisten dat we verschillende stemmen nodig hadden om een inclusieve AI te bouwen. Ons team wierf meer dan 170 sprekers op verschillende locaties. We begonnen in Las Vegas maar breidden uit naar Bangkok om ondervertegenwoordigde accenten te leggen, wat ons ook hielp om de kosten te drukken en de tijdlijn van het project te versnellen. Het succes van het project opende ook de deur naar het verzamelen van gegevens in nieuwe talen.

De details ter plaatse beheren

Om een consistent gegevensverzamelingsproces en uitvoer van hoge kwaliteit te garanderen, zette Acolad teams op locatie in om alles te beheren, van het oplossen van problemen met apparaten tot de zorg voor de deelnemers. Onze end-to-end coördinatie zorgde ervoor dat elke sessie - en het project als geheel - op schema bleef.

Datakwaliteit garanderen

Het leveren van gegevens van hoge kwaliteit was niet alleen een kwestie van registreren, maar ook van rigoureus valideren. Alle vastgelegde inhoud werd beoordeeld en verwerkt via menselijke workflows om de kwaliteit van de transcriptie en de consistentie van de metadata te garanderen. Deze rigoureuze kwaliteitscontrole hielp de betrouwbaarheid van de trainingsgegevens te garanderen, zodat de klant de stemprestaties onder verschillende omstandigheden kon testen en zijn AI-algoritmen dienovereenkomstig kon optimaliseren.

Diverse stemmen

Een gecureerde sprekerspool voor demografische diversiteit en diversiteit in Engelse accenten, zodat de gegevens een afspiegeling vormen van het wereldwijde gebruikersbestand.

Realistische omgevingen

Op maat gemaakte opnameomgevingen om echte vergaderomstandigheden te simuleren.

Naadloze uitvoering

Volledig beheerde teams op locatie zorgden voor een soepel proces van gegevensverzameling en levering.

Gevalideerde kwaliteit

Menselijk gevalideerde datasets, die de klant voorzien van betrouwbare, gebruiksklare gegevens voor hun AI-modellen.

De resultaten

Inclusieve AI-trainingsgegevens met grote impact leveren

Het project leverde meer dan 120 uur aan rijke spraak- en videodata op - volledig geannoteerd, demografisch divers en technisch robuust. Door een betrouwbare, hoogwaardige audio- en videodataset te leveren, stelde Acolad de klant in staat om hun AI-transcriptie, ondertiteling en tools voor het samenvatten van vergaderingen te testen en te verfijnen. Elk project werd 100% op tijd opgeleverd, er was geen herbewerking nodig en we hebben de klant geholpen om de wervingskosten met 20% te verlagen.

Dankzij deze succesvolle samenwerking kon deze wereldwijde technologieleider zich efficiënter richten op zijn kernactiviteiten, in het vertrouwen dat zijn AI werd getraind met gegevens die de echte wereld weerspiegelden.

We hebben geleverd:

Realistische trainingsgegevens die de complexiteit van de echte wereld weerspiegelen.
Verbeterde nauwkeurigheid AI-model.
kortere time-to-market
Een schaalbaar kader voor toekomstige projectuitbreiding.