100%
leverans i tid, inget omarbete krävs
Träning av flerspråkig AI med röstdata från verkliga världen
Upptäck hur en global teknikledare skalade upp AI-taligenkänning med 120+ timmar av olika röstdata från verkligheten.
Om kunden
Ett av världens största teknikföretag, som betjänar miljontals människor i mer än 70 länder, ville göra sin plattform smartare och mer tillgänglig genom nya AI-drivna röstfunktioner. För att lyckas behövde de flerspråkig data som verkligen återspeglade hur deras användare talar och interagerar i den verkliga världen - mångsidig, autentisk och av hög kvalitet.
20%
minskade rekryteringskostnader
120+
timmar av röst- och videodata som samlats in
170%
talare från 6 engelska accentgrupper
Säkerställa att AI för röst fungerar för alla
Olika röster för inkluderande AI
Företaget ville att dess röst-AI-funktioner skulle återspegla mångfalden bland användarna. Det innebar att se till att personer med olika engelska accenter - några av dem förbises ofta - var korrekt representerade i uppgifterna.
Fånga upp förhållanden i den verkliga världen
Eftersom användarna interagerar med appen i alla typer av miljöer måste AI:n också fungera bra i olika akustiska miljöer: från små mötesrum till hektiska styrelserum, med en mängd olika enheter.
Skalning utan distraktion
Att hantera den här typen av storskalig datainsamling i flera regioner var långt bortom företagets interna resurser. De behövde en pålitlig partner som kunde leverera ett färdigt dataset utan att fördröja arbetet för deras team.

"Bakom varje dataset finns en designutmaning. Mångfalden i den verkliga världen, den logistiska komplexiteten och den tekniska precisionen måste alla samverka för att leverera AI-klara data i stor skala."
Jennifer Nacinelli, programansvarig för AI-data, Acolad

Ett ramverk för datainsamling i den verkliga världen
Bygga ett kontrollerat laboratorium
För att säkerställa att datainsamlingen var autentisk i förhållande till kundens verkliga användningsfall designade och byggde vi tre särskilda inspelningsmiljöer för att efterlikna företagskonfigurationer, från små mötesrum till stora styrelserum. I varje rum rådde olika akustiska förhållanden och en mängd olika toppmodeller användes för att samla in autentiska data till kundens AI-modeller.
Hitta de rätta rösterna för mångfald inom data
Vi visste att vi behövde olika röster för att bygga en inkluderande AI. Vårt team rekryterade över 170 talare på flera olika platser. Vi började i Las Vegas men utökade till Bangkok för att fånga upp underrepresenterade accenter, vilket också hjälpte oss att minska kostnaderna och påskynda projektets tidslinje. Projektets framgångar öppnade också dörren för att samla in data på nya språk.
Hantering av detaljer på plats
För att garantera en konsekvent datainsamlingsprocess och högkvalitativa resultat använde Acolad team på plats för att hantera allt från felsökning av enheter till vård av deltagare. Vår samordning från början till slut säkerställde att varje session - och projektet som helhet - höll sig på rätt spår.
Säkerställa datakvalitet
Att leverera högkvalitativa data handlade inte bara om att registrera dem, det handlade också om rigorös validering. Allt insamlat innehåll granskades och bearbetades genom mänskliga arbetsflöden för att säkerställa transkriptionskvalitet och metadatakonsistens. Denna rigorösa kvalitetskontroll bidrog till att säkerställa tillförlitligheten i utbildningsdata, vilket gjorde det möjligt för kunden att testa röstprestanda under olika förhållanden och optimera sina AI-algoritmer därefter.
Olika röster
Realistiska miljöer
Sömlöst genomförande
Validerad kvalitet
Leverera inkluderande AI-utbildning med stor genomslagskraft Data
Projektet levererade över 120 timmar med omfattande röst- och videodata - helt annoterade, demografiskt diversifierade och tekniskt robusta. Genom att tillhandahålla en tillförlitlig, högkvalitativ ljud- och videodatauppsättning gjorde Acolad det möjligt för kunden att testa och förfina sina AI-verktyg för transkribering, textning och sammanfattning av möten. Varje projekt levererades till 100% i tid, utan omarbetningar, och vi hjälpte kunden att minska sina rekryteringskostnader med 20%.
Det framgångsrika partnerskapet gjorde det möjligt för denna globala teknikledare att fokusera mer effektivt på sin kärnverksamhet, i förvissning om att deras AI tränades med data som verkligen återspeglade den verkliga världen.
Vi levererade:
- Realistiska träningsdata som återspeglar komplexiteten i verkligheten.
- Förbättrad precision i AI-modellen.
- minskad tid till marknaden
- Ett skalbart ramverk för framtida projektutvidgning.