Home / Palvelut / Datapalvelut / Monikielisen tekoälyn koulutus

Monikielisen tekoälyn kouluttaminen reaalimaailman äänidatan avulla

Tutustu siihen, miten globaali teknologiajohtaja skaalasi tekoälyn puheentunnistusta yli 120 tunnin erilaisilla, todellisista olosuhteista saaduilla äänitiedoilla.


Teollisuus & palvelut

Tietoa asiakkaastamme
Yksi maailman suurimmista teknologiayrityksistä, joka palvelee miljoonia ihmisiä yli 70 maassa, pyrki tekemään alustastaan älykkäämmän ja helppokäyttöisemmän uusien tekoälypohjaisten puheominaisuuksien avulla. Onnistuakseen he tarvitsivat monikielistä dataa, joka todella kuvastaa sitä, miten heidän käyttäjänsä puhuvat ja ovat vuorovaikutuksessa reaalimaailmassa - monipuolista, aitoa ja laadukasta.

av_timer

100%
oikea-aikainen toimitus, ei lainkaan jälkitöitä

attach_money

20%
rekrytointikustannusten vähentäminen

mic

+120
tunteja tallennettua puhe- ja videodataa

group

+170
puhujia 6 englannin aksenttiryhmästä

Haaste

Äänitekoälyn toimivuuden varmistaminen kaikille

Monenlaisia ääniä osallistavan tekoälyn puolesta

Yhtiö halusi, että sen tekoälyominaisuudet heijastavat käyttäjien moninaisuutta. Tämä tarkoitti sen varmistamista, että ihmiset, joilla on erilainen englannin aksentti - jotkut heistä jätetään usein huomiotta - olivat asianmukaisesti edustettuina tiedoissa.

Todellisen maailman olosuhteiden kuvaaminen

Koska käyttäjät ovat vuorovaikutuksessa sovelluksen kanssa kaikenlaisissa ympäristöissä, tekoälyn oli myös toimittava hyvin erilaisissa akustisissa ympäristöissä: pienistä kokoushuoneista kiireisiin neuvotteluhuoneisiin, joissa käytetään erilaisia laitteita.

Skaalautuminen ilman häiriötekijöitä

Tällaisen laajamittaisen tiedonkeruun hallinnointi useilla alueilla ylitti yrityksen sisäiset resurssit. He tarvitsivat luotettavan kumppanin, joka voisi toimittaa käyttövalmiin tietokokonaisuuden hidastamatta heidän tiimejään.

square-35

"Jokaisen tietokokonaisuuden takana on suunnitteluhaaste. Todellisen maailman moninaisuuden, logistisen monimutkaisuuden ja teknologisen tarkkuuden on sovitettava yhteen, jotta tekoälyvalmiita tietoja voidaan tuottaa mittakaavassa."

 

Jennifer Nacinelli, tekoälytietojen ohjelmapäällikkö, Acolad

square-27
Ratkaisu

Puitteet reaalimaailman tiedonkeruulle

Valvotun laboratorion rakentaminen

Varmistaaksemme, että tiedonkeruu vastaa aidosti asiakkaan todellisia käyttötapauksia, suunnittelimme ja rakensimme kolme erillistä tallennusympäristöä jäljittelemään yritysasetelmia pienistä neuvotteluhuoneista suuriin kokoushuoneisiin. Jokaisessa huoneessa oli erilaiset akustiset olosuhteet, ja niissä käytettiin erilaisia huippumarkkinoiden laitteita autenttisten tietojen keräämiseksi asiakkaan tekoälymalleja varten.

Oikeiden äänten löytäminen tietojen monimuotoisuutta varten

Tiesimme, että osallisuutta edistävän tekoälyn rakentamiseen tarvitaan erilaisia ääniä. Tiimimme rekrytoi yli 170 puhujaa useissa eri paikoissa. Aloitimme Las Vegasista, mutta laajensimme toimintaamme Bangkokiin, jotta saimme mukaan aliedustettuja aksentteja, mikä auttoi meitä myös vähentämään kustannuksia ja nopeuttamaan hankkeen aikataulua. Hankkeen onnistuminen avasi myös mahdollisuuden kerätä tietoja uusilla kielillä.

Yksityiskohtien hallinta paikan päällä

Yhdenmukaisen tiedonkeruuprosessin ja laadukkaan tuotoksen takaamiseksi Acolad asetti paikan päälle tiimejä, jotka hoitivat kaikkea laitteiden vianmäärityksestä osallistujien hoitoon. Kokonaisvaltainen koordinointimme varmisti, että jokainen istunto - ja koko projekti - pysyi aikataulussa.

Tietojen laadun varmistaminen

Laadukkaiden tietojen tuottaminen ei ollut vain niiden tallentamista, vaan myös niiden tarkkaa validointia. Kaikki tallennettu sisältö tarkistettiin ja käsiteltiin ihmisen johtamien työnkulkujen avulla transkription laadun ja metatietojen yhdenmukaisuuden varmistamiseksi. Tämä tiukka laadunvalvonta auttoi varmistamaan harjoitusdatan luotettavuuden, minkä ansiosta asiakas pystyi testaamaan äänen suorituskykyä erilaisissa olosuhteissa ja optimoimaan tekoälyalgoritmejaan sen mukaisesti.

Diversity_3

Monenlaisia ääniä

Kuratoitu puhujajoukko demografisen ja englannin kielen aksentin moninaisuuden varmistamiseksi, jotta tiedot heijastavat maailmanlaajuista käyttäjäkuntaa.
frame_person_mic

Realistiset ympäristöt

Räätälöidyt tallennusympäristöt, jotka simuloivat todellisia kokousolosuhteita.
automation

Saumaton toteutus

Täysin hallitut paikan päällä toimivat tiimit varmistivat sujuvan tiedonkeruuprosessin ja toimituksen.
star_shine

Validoitu laatu

Ihmisen validoimat tietokokonaisuudet, jotka tarjoavat asiakkaalle luotettavaa, käyttövalmista dataa tekoälymalleja varten.
Tulos

Osallistavan ja vaikuttavan tekoälykoulutusdatan tuottaminen

Hankkeen tuloksena saatiin yli 120 tuntia runsaasti ääni- ja videotietoja, jotka olivat täysin kommentoituja, demografisesti monipuolisia ja teknisesti vankkoja. Toimittamalla luotettavan ja laadukkaan ääni- ja videotietoaineiston Acolad antoi asiakkaalle mahdollisuuden testata ja kehittää tekoälyn transkriptio-, tekstitys- ja kokousten yhteenvetotyökaluja. Jokainen projekti toimitettiin 100-prosenttisesti ajallaan, eikä siihen tarvittu lainkaan jälkitöitä, ja autoimme asiakasta vähentämään rekrytointikustannuksia 20 prosenttia.

Onnistuneen kumppanuuden ansiosta tämä globaali teknologiajohtaja pystyi keskittymään tehokkaammin ydinliiketoimintaansa luottaen siihen, että tekoälyä koulutettiin todellisuutta todella kuvaavilla tiedoilla.

Me toimitimme:

  • Realistinen harjoitusaineisto, joka heijastaa todellisen maailman monimutkaisuutta.
  • Tekoälymallin tarkkuuden parantaminen.
  • nopeampi markkinoille pääsy
  • Skaalautuva kehys tulevaa hankkeen laajentamista varten.
freelancer-avatars-centered 1

Tarvitsetko luotettavaa reaalimaailman dataa tekoälyn käyttämiseen?