Home / Tjänster / Datatjänster / Träning av flerspråkig AI

Träning av flerspråkig AI med röstdata från verkliga världen

Upptäck hur en global teknikledare skalade upp AI-taligenkänning med 120+ timmar av olika röstdata från verkligheten.


Industri och tjänster

Om kunden
Ett av världens största teknikföretag, som betjänar miljontals människor i mer än 70 länder, ville göra sin plattform smartare och mer tillgänglig genom nya AI-drivna röstfunktioner. För att lyckas behövde de flerspråkig data som verkligen återspeglade hur deras användare talar och interagerar i den verkliga världen - mångsidig, autentisk och av hög kvalitet.

av_timer

100%
leverans i tid, inget omarbete krävs

attach_money

20%
minskade rekryteringskostnader

mic

120+
timmar av röst- och videodata som samlats in

group

170%
talare från 6 engelska accentgrupper

Utmaningen

Säkerställa att AI för röst fungerar för alla

Olika röster för inkluderande AI

Företaget ville att dess röst-AI-funktioner skulle återspegla mångfalden bland användarna. Det innebar att se till att personer med olika engelska accenter - några av dem förbises ofta - var korrekt representerade i uppgifterna.

Fånga upp förhållanden i den verkliga världen

Eftersom användarna interagerar med appen i alla typer av miljöer måste AI:n också fungera bra i olika akustiska miljöer: från små mötesrum till hektiska styrelserum, med en mängd olika enheter.

Skalning utan distraktion

Att hantera den här typen av storskalig datainsamling i flera regioner var långt bortom företagets interna resurser. De behövde en pålitlig partner som kunde leverera ett färdigt dataset utan att fördröja arbetet för deras team.

square-35

"Bakom varje dataset finns en designutmaning. Mångfalden i den verkliga världen, den logistiska komplexiteten och den tekniska precisionen måste alla samverka för att leverera AI-klara data i stor skala."

 

Jennifer Nacinelli, programansvarig för AI-data, Acolad

square-27
Lösningen

Ett ramverk för datainsamling i den verkliga världen

Bygga ett kontrollerat laboratorium

För att säkerställa att datainsamlingen var autentisk i förhållande till kundens verkliga användningsfall designade och byggde vi tre särskilda inspelningsmiljöer för att efterlikna företagskonfigurationer, från små mötesrum till stora styrelserum. I varje rum rådde olika akustiska förhållanden och en mängd olika toppmodeller användes för att samla in autentiska data till kundens AI-modeller.

Hitta de rätta rösterna för mångfald inom data

Vi visste att vi behövde olika röster för att bygga en inkluderande AI. Vårt team rekryterade över 170 talare på flera olika platser. Vi började i Las Vegas men utökade till Bangkok för att fånga upp underrepresenterade accenter, vilket också hjälpte oss att minska kostnaderna och påskynda projektets tidslinje. Projektets framgångar öppnade också dörren för att samla in data på nya språk.

Hantering av detaljer på plats

För att garantera en konsekvent datainsamlingsprocess och högkvalitativa resultat använde Acolad team på plats för att hantera allt från felsökning av enheter till vård av deltagare. Vår samordning från början till slut säkerställde att varje session - och projektet som helhet - höll sig på rätt spår.

Säkerställa datakvalitet

Att leverera högkvalitativa data handlade inte bara om att registrera dem, det handlade också om rigorös validering. Allt insamlat innehåll granskades och bearbetades genom mänskliga arbetsflöden för att säkerställa transkriptionskvalitet och metadatakonsistens. Denna rigorösa kvalitetskontroll bidrog till att säkerställa tillförlitligheten i utbildningsdata, vilket gjorde det möjligt för kunden att testa röstprestanda under olika förhållanden och optimera sina AI-algoritmer därefter.

Diversity_3

Olika röster

En kurerad talarpool för demografisk och engelsk accentdiversitet, vilket säkerställde att uppgifterna återspeglade den globala användarbasen.
frame_person_mic

Realistiska miljöer

Specialbyggda inspelningsmiljöer för att simulera verkliga mötesförhållanden.
automation

Sömlöst genomförande

Fullt hanterade team på plats säkerställde en smidig datainsamlingsprocess och leverans.
star_shine

Validerad kvalitet

Datauppsättningar som validerats av människor, vilket ger kunden tillförlitliga data som är färdiga att använda för deras AI-modeller.
Resultatet

Leverera inkluderande AI-utbildning med stor genomslagskraft Data

Projektet levererade över 120 timmar med omfattande röst- och videodata - helt annoterade, demografiskt diversifierade och tekniskt robusta. Genom att tillhandahålla en tillförlitlig, högkvalitativ ljud- och videodatauppsättning gjorde Acolad det möjligt för kunden att testa och förfina sina AI-verktyg för transkribering, textning och sammanfattning av möten. Varje projekt levererades till 100% i tid, utan omarbetningar, och vi hjälpte kunden att minska sina rekryteringskostnader med 20%.

Det framgångsrika partnerskapet gjorde det möjligt för denna globala teknikledare att fokusera mer effektivt på sin kärnverksamhet, i förvissning om att deras AI tränades med data som verkligen återspeglade den verkliga världen.

Vi levererade:

  • Realistiska träningsdata som återspeglar komplexiteten i verkligheten.
  • Förbättrad precision i AI-modellen.
  • minskad tid till marknaden
  • Ett skalbart ramverk för framtida projektutvidgning.
freelancer-avatars-centered 1

Behöver du tillförlitliga data från verkligheten för att driva din AI?