Home / professionali / Servizi dati / Addestramento dell'intelligenza artificiale multilingue

Addestrare l'intelligenza artificiale multilingue con i dati vocali del mondo reale

Scoprite come un leader tecnologico globale ha scalato il riconoscimento vocale AI con oltre 120 ore di dati vocali diversi e reali.


Industria e servizi

Il nostro cliente
Una delle più grandi aziende tecnologiche del mondo, che serve milioni di persone in oltre 70 paesi, ha deciso di rendere la sua piattaforma più intelligente e accessibile grazie a nuove funzioni vocali basate sull'intelligenza artificiale. Per avere successo, avevano bisogno di dati multilingue che riflettessero davvero il modo in cui i loro utenti parlano e interagiscono nel mondo reale: diversi, autentici e di alta qualità.

av_timer

100%
consegna puntuale, nessuna rilavorazione

attach_money

20%
riduzione dei costi di assunzione

mic

+120
ore di dati vocali e video acquisiti

group

+170
parlanti di 6 gruppi di accenti inglesi

La sfida

Garantire che l'intelligenza artificiale vocale funzioni per tutti

Voci diverse per un'intelligenza artificiale inclusiva

L'azienda voleva che le sue funzioni di intelligenza artificiale vocale riflettessero la diversità dei suoi utenti. Ciò significava assicurarsi che le persone con accenti inglesi diversi - alcune delle quali spesso trascurate - fossero adeguatamente rappresentate nei dati.

Catturare le condizioni del mondo reale

Poiché gli utenti interagiscono con l'app in tutti i tipi di ambienti, l'intelligenza artificiale doveva funzionare bene anche in ambienti acustici diversi: da piccole sale riunioni a sale riunioni affollate, utilizzando una varietà di dispositivi.

Scalare senza distrazioni

La gestione di questo tipo di raccolta dati su larga scala in più regioni andava ben oltre le risorse interne dell'azienda. Avevano bisogno di un partner fidato che fornisse un set di dati pronto all'uso senza rallentare i loro team.

square-35

"Dietro ogni serie di dati c'è una sfida di progettazione. La diversità del mondo reale, la complessità logistica e la precisione tecnologica devono allinearsi per fornire dati pronti per l'IA su scala".

 

Jennifer Nacinelli, Responsabile del programma dati AI, Acolad

square-27
La soluzione

Un quadro per la raccolta di dati dal mondo reale

Costruire un laboratorio controllato

Per garantire che la raccolta dei dati fosse autentica rispetto ai casi d'uso reali del cliente, abbiamo progettato e costruito tre ambienti di registrazione dedicati per imitare le configurazioni aziendali, dalle piccole huddle room alle grandi sale riunioni. Ogni stanza presentava condizioni acustiche diverse e utilizzava una varietà di dispositivi di alta gamma per acquisire dati autentici per i modelli di intelligenza artificiale del cliente.

Trovare le voci giuste per la diversità dei dati

Sapevamo che per costruire un'IA inclusiva avevamo bisogno di voci diverse. Il nostro team ha reclutato oltre 170 relatori in diverse sedi. Abbiamo iniziato a Las Vegas ma ci siamo espansi a Bangkok per catturare gli accenti sottorappresentati, il che ci ha anche aiutato a ridurre i costi e ad accelerare i tempi del progetto. Il successo del progetto ha anche aperto la strada alla raccolta di dati in nuove lingue.

Gestione dei dettagli in loco

Per garantire un processo di raccolta dei dati coerente e un risultato di alta qualità, Acolad ha dispiegato team in loco per gestire tutto, dalla risoluzione dei problemi dei dispositivi all'assistenza ai partecipanti. Il nostro coordinamento end-to-end ha garantito che ogni sessione - e il progetto nel suo complesso - rimanesse in linea con i tempi.

Garantire la qualità dei dati

Fornire dati di alta qualità non significava solo registrarli, ma anche convalidarli in modo rigoroso. Tutti i contenuti acquisiti sono stati rivisti ed elaborati attraverso flussi di lavoro guidati da personale umano per garantire la qualità della trascrizione e la coerenza dei metadati. Questo rigoroso controllo di qualità ha contribuito a garantire l'affidabilità dei dati di addestramento, consentendo al cliente di testare le prestazioni vocali in condizioni diverse e di ottimizzare di conseguenza i propri algoritmi di intelligenza artificiale.

Diversity_3

Voci diverse

Un pool di speaker curato per garantire la diversità demografica e di accento inglese, assicurando che i dati riflettessero la base di utenti globale.
frame_person_mic

Ambienti realistici

Ambienti di registrazione personalizzati per simulare le condizioni reali delle riunioni.
automation

Esecuzione senza soluzione di continuità

I team in loco, completamente gestiti, hanno garantito un processo di raccolta e consegna dei dati senza intoppi.
star_shine

Qualità convalidata

Set di dati convalidati dall'uomo, che forniscono al cliente dati affidabili e pronti all'uso per i suoi modelli di intelligenza artificiale.
I risultati

Fornire dati di formazione sull'intelligenza artificiale inclusivi e di grande impatto

Il progetto ha fornito oltre 120 ore di dati vocali e video, completamente annotati, demograficamente diversificati e tecnicamente robusti. Fornendo un set di dati audio e video affidabile e di alta qualità, Acolad ha permesso al cliente di testare e perfezionare i propri strumenti di trascrizione AI, sottotitolazione e riassunto delle riunioni. Ogni progetto è stato consegnato al 100% nei tempi previsti, con zero rielaborazioni, e abbiamo aiutato il cliente a ridurre del 20% i costi di assunzione.

Questa partnership di successo ha permesso a questo leader tecnologico globale di concentrarsi in modo più efficiente sul proprio core business, con la certezza che l'IA venisse addestrata con dati che rispecchiassero realmente il mondo reale.

Abbiamo consegnato:

  • Dati di allenamento realistici che riflettono la complessità del mondo reale.
  • Miglioramento dell'accuratezza del modello AI.
  • di riduzione del time-to-market
  • Un quadro scalabile per l'espansione futura del progetto.
freelancer-avatars-centered 1

Avete bisogno di dati affidabili del mondo reale per alimentare la vostra IA?