Home / Leistungen / Datenservices / Training mehrsprachiger KI

Training mehrsprachiger KI mit Sprachdaten aus der realen Welt

Erfahren Sie, wie ein weltweit führendes Technologieunternehmen die KI-Spracherkennung mit mehr als 120 Stunden an unterschiedlichen, realen Sprachdaten skaliert hat.


Industrie und Dienstleistungen

Über unseren Kunden
Eines der weltweit größten Technologieunternehmen, das Millionen von Menschen in mehr als 70 Ländern bedient, hat sich vorgenommen, seine Plattform durch neue KI-gestützte Sprachfunktionen intelligenter und zugänglicher zu machen. Um erfolgreich zu sein, brauchte das Unternehmen mehrsprachige Daten, die wirklich die Art und Weise widerspiegeln, wie seine Nutzer in der realen Welt sprechen und interagieren - vielfältig, authentisch und von hoher Qualität.

av_timer

100%
pünktliche Lieferung, keine Nacharbeit erforderlich

attach_money

20%
Senkung der Einstellungskosten

mic

120+
Stunden an aufgezeichneten Sprach- und Videodaten

group

170+
Sprecher aus 6 englischen Akzentgruppen

Die Herausforderung

Sicherstellen, dass Voice AI für alle funktioniert

Vielfältige Stimmen für integrative AI

Das Unternehmen wollte, dass seine Sprach-KI-Funktionen die Vielfalt seiner Nutzer widerspiegeln. Das bedeutete, dass wir sicherstellen mussten, dass Menschen mit unterschiedlichen englischen Akzenten - von denen einige oft übersehen werden - in den Daten angemessen vertreten sind.

Erfassung der realen Bedingungen

Da die Nutzer in den unterschiedlichsten Umgebungen mit der App interagieren, musste die KI auch in verschiedenen akustischen Umgebungen gut funktionieren: von kleinen Besprechungsräumen bis hin zu geschäftigen Sitzungssälen und unter Verwendung einer Vielzahl von Geräten.

Skalierung ohne Ablenkung

Die Verwaltung dieser Art von groß angelegter Datenerfassung in mehreren Regionen überstieg bei weitem die internen Ressourcen des Unternehmens. Sie brauchten einen vertrauenswürdigen Partner, der einen gebrauchsfertigen Datensatz liefern konnte, ohne ihre Teams zu verlangsamen.

square-35

"Hinter jedem Datensatz steht eine gestalterische Herausforderung. Die Vielfalt der realen Welt, die logistische Komplexität und die technologische Präzision müssen in Einklang gebracht werden, um KI-fähige Daten in großem Umfang zu liefern."

 

Jennifer Nacinelli, Leiterin des KI-Datenprogramms, Acolad

square-27
Die Lösung

Ein Rahmen für die Datenerfassung in der realen Welt

Aufbau eines kontrollierten Labors

Um sicherzustellen, dass die Datenerfassung den realen Anwendungsfällen des Kunden entspricht, haben wir drei spezielle Aufzeichnungsumgebungen entworfen und eingerichtet, die die Gegebenheiten in Unternehmen nachahmen - von kleinen Besprechungsräumen bis hin zu großen Sitzungssälen. In jedem Raum herrschten unterschiedliche akustische Bedingungen, und es wurde eine Vielzahl von Spitzengeräten verwendet, um authentische Daten für die KI-Modelle des Kunden zu erfassen.

Die richtigen Stimmen für Datenvielfalt finden

Wir wussten, dass wir für den Aufbau einer integrativen KI vielfältige Stimmen brauchen. Unser Team rekrutierte über 170 Redner an verschiedenen Standorten. Wir begannen in Las Vegas, expandierten aber nach Bangkok, um unterrepräsentierte Akzente zu erfassen, was uns auch half, die Kosten zu senken und die Projektlaufzeit zu beschleunigen. Der Erfolg des Projekts eröffnete auch die Möglichkeit, Daten in neuen Sprachen zu sammeln.

Verwaltung der Details vor Ort

Um einen konsistenten Datenerhebungsprozess und eine hohe Qualität der Ergebnisse zu gewährleisten, setzte Acolad Teams vor Ort ein, die sich um alles kümmerten, von der Fehlerbehebung bei den Geräten bis zur Betreuung der Teilnehmer. Unsere durchgängige Koordination sorgte dafür, dass jede Sitzung - und das Projekt insgesamt - im Zeitplan blieb.

Sicherstellung der Datenqualität

Bei der Bereitstellung hochwertiger Daten ging es nicht nur um die Erfassung, sondern auch um eine strenge Validierung. Alle erfassten Inhalte wurden überprüft und in von Menschen geleiteten Arbeitsabläufen verarbeitet, um die Qualität der Transkription und die Konsistenz der Metadaten zu gewährleisten. Diese strenge Qualitätskontrolle trug dazu bei, die Zuverlässigkeit der Trainingsdaten zu gewährleisten, so dass der Kunde die Sprachleistung unter verschiedenen Bedingungen testen und seine KI-Algorithmen entsprechend optimieren konnte.

Diversity_3

Vielfältige Stimmen

Ein kuratierter Sprecherpool für demografische und englische Akzentvielfalt, um sicherzustellen, dass die Daten die globale Nutzerbasis widerspiegeln.
frame_person_mic

Realistische Umgebungen

Maßgeschneiderte Aufnahmeumgebungen zur Simulation realer Konferenzbedingungen.
automation

Nahtlose Ausführung

Vollständig verwaltete Teams vor Ort sorgten für einen reibungslosen Ablauf der Datenerhebung und -lieferung.
star_shine

Geprüfte Qualität

Von Menschen validierte Datensätze, die dem Kunden zuverlässige, einsatzbereite Daten für seine KI-Modelle liefern.
Das Ergebnis

Bereitstellung inklusiver, hochwirksamer KI-Trainingsdaten

Das Projekt lieferte mehr als 120 Stunden umfangreicher Sprach- und Videodaten - vollständig kommentiert, demografisch vielfältig und technisch robust. Durch die Bereitstellung eines zuverlässigen, qualitativ hochwertigen Audio- und Videodatensatzes ermöglichte Acolad dem Kunden, seine KI-Transkriptions-, Untertitel- und Meeting-Zusammenfassungs-Tools zu testen und zu verfeinern. Jedes Projekt wurde zu 100 % pünktlich und ohne Nacharbeiten geliefert, und wir halfen dem Kunden, seine Einstellungskosten um 20 % zu senken.

Diese erfolgreiche Partnerschaft ermöglichte es dem weltweit führenden Technologieunternehmen, sich effizienter auf sein Kerngeschäft zu konzentrieren und sich darauf zu verlassen, dass seine KI mit Daten trainiert wird, die die reale Welt widerspiegeln.

Wir haben geliefert:

  • Realistische Trainingsdaten, die die Komplexität der realen Welt widerspiegeln.
  • Verbesserte Genauigkeit des AI-Modells.
  • Texte schneller veröffentlichen
  • Ein skalierbarer Rahmen für künftige Projekterweiterungen.
freelancer-avatars-centered 1

Benötigen Sie zuverlässige reale Daten als Grundlage für Ihre KI?