Home / Services / Transskribering / Automatisk talegenkendelse

Automatisk talegenkendelse (ASR)

Øjeblikkelig konvertering af tale til tekst, der revolutionerer kommunikation og produktivitet.

UBS
De Forenede Nationer
Adobe
Amazon
Johnson & Johnson
Air France
IBM
Coca-Cola
Tesla
ExxonMobil
L'Oreal
Lilly

Optag, transskriber og drag fordel af talt indhold

automation

Tech-drevet ekspertise
Udnyt af AI til at forbedre effektiviteten og nøjagtigheden af dit indhold med forbedrede ekspeditionstider og skalerbarhed.

stars_2

Styrk din organisation

Vores interne team bestående af ingeniører og lingvister er i stand til at tilpasse AI-løsninger, så de kan give maksimal effekt i hele din virksomheds økosystem.

security

Privatlivscentreret tilgang
Dit indhold og dine data bliver beskyttet ved hjælp af krypteringsprotokoller, sikker opbevaring, adgangskontrol og branchespecifik overholdelse af lovgivning.

Se nærmere på, hvordan ASR fungerer

Selvom ASR har oplevet en betydelig udvikling i de senere år, kan det beskrives som en proces i fire trin.

counter_1

Registrering af stemmeaktivitet

Transskriberingen starter med at identificere tilstedeværelsen af tale eller samtale i den optagede lyd. Gennem avancerede algoritmer registrerer og segmenterer systemet lydsporet, så maskinen kan behandle hvert segment individuelt.

counter_2

Dagbog

Det næste, vi skal gøre, er at identificere de forskellige talere i hver optagelse og gruppere dem i segmenter. Dette løser udfordringen med "hvem taler hvornår?" For at besvare dette spørgsmål bruger maskinen forskellige modeller, der indeholder specifikke data (sprog, stemme). På denne måde kan den differentiere et sprogs finesser (for eksempel accenter). Bemærk, at vi på dette tidspunkt stadig behandler dataene på en "matematisk" måde.

counter_3

Afkodning

Det er her, den egentlige transskribering starter. Der oprettes en liste over mulige stavelser (fonemer) for hvert lydsegment. Indtil videre er der ikke genereret hele sætninger, kun én lang liste af muligheder, hver med en score.

counter_4

Rescoring

For at sikre den mest nøjagtige transskribering vælger computeren fonemer og ord, den har lært i den indledende fase (svarende til, hvordan en GPS identificerer den bedste rute). Den valgte sætning transskriberes derefter til dokumentet. Denne proces gentages for hvert segment af optagelsen, hvilket udmøntes i en komplet transskribering.

Efter denne automatiserede proces gennemgår vores eksperter dokumentet. Udover at verificere det overordnede indhold sikrer korrekturlæseren også korrekt tildeling af det, der bliver sagt, til de respektive talere. Denne omhyggelige gennemgang garanterer en præcis og pålidelig transskribering.

Acolad logo in 3d rendering on blue background with studio lighting

Fremtiden for talegenkendelse til din disposition

Banebrydende ASR-teknologi

Med mange års erfaring på dette felt udnytter vi de seneste fremskridt inden for AI- og ASR-teknologi til at levere enestående nøjagtighed og ydeevne.

Brancheeksperter

Vi sætter os ind i virksomhedens kunders unikke behov og udfordringer, hvilket gør os i stand til at levere skræddersyede løsninger, der opfylder dine specifikke krav.

Skalerbar og pålidelig

Vores ASR-tjenester er designet til at skalere sammen med din virksomhed, hvilket sikrer pålidelig ydeevne selv i miljøer med høj efterspørgsel.

Sikkerhed og fortrolighed

Vi prioriterer privatlivets fred for dine virksomhedsdata, sikrer beskyttelse af følsomme oplysninger og overholdelse af branchens regler.

 

colorful portraits of people surrounding the Acolad logo

Kontakt os i dag for at aftale et rådgivningsmøde

Opdag, hvordan vores ASR-tjenester kan styrke din organisation med tilgængelighed og produktivitet.

Ofte stillede spørgsmål

Er du nysgerrig på at lære mere om automatisk talegenkendelse? Se vores ofte stillede spørgsmål.

Hvad er automatisk talegenkendelse?

Automatisk talegenkendelse (ASR) er betegnelsen for den teknologi, der bruges til at transskribere talte ord til skrevet tekst. ASR har oplevet en betydelig udvikling i de seneste år, og vores F&U-team bidrager til dens fortsatte vækst. 

Hvad er den ASR-teknologi, der bruges hos Acolad?

Hos Acolad bruger vi én Large Vocabulary Continuous Speech Recognition (LVCSR) – baseret på automatisk identifikation af meget korte lydsekvenser fra et stort ordforråd. Denne teknologi gør det muligt at producere en transskribering af ekstrem høj kvalitet, forudsat at den anvendte optagelse er foretaget korrekt. Vores arbejdsmetode betyder, at vi ikke kun kan håndtere optagelser, der indeholder ikke-specialiseret ordforråd, men også dem, der indeholder mere specifikke termer (tekniske, juridiske, medicinske osv.).

Hvad er de mest almindelige use cases for ASR?

ASR-teknologi er blevet et vigtigt værktøj på tværs af forskellige brancher, herunder jura og finans, den offentlige sektor, sundhedssektoren og mediebranchen. På disse områder, hvor kontinuerlige samtaler og nøjagtig registrering er afgørende, tjener ASR flere formål. Her er nogle eksempler på use cases:

  • Juridisk: I retssager er det afgørende at fange hvert ord, der bliver sagt af vidner og involverede parter. ASR-teknologi giver en skalerbar og pålidelig løsning til digital transskribering, der afhjælper manglen på retsreferenter og sikrer nøjagtige og omfattende optegnelser.
  • Læring og uddannelse: ASR-tekster og -transskriberinger understøtter elever med høretab eller handicap i klasseværelset. Det gavner også ikke-modersmålstalende, pendlere og studerende med forskellige behov, hvilket fremmer et inkluderende læringsmiljø.
  • Sundhedssektoren: ASR bruges af læger til at transskribere notater fra patientkonsultationer eller dokumentere procedurer under operationer, hvilket øger effektiviteten og nøjagtigheden i medicinsk dokumentation.
  • Multimedier: Medieproduktionsselskaber er afhængige af ASR til live undertekster og medietransskribering for at sikre tilgængelighed af og overensstemmelsesregler for forskelligt medieindhold.

     
    Til virksomheder Undertekstning og transskribering med ASR hjælper virksomheder med at skabe inkluderende miljøer ved at levere tilgængeligt undervisningsmateriale. Det henvender sig til medarbejdere med forskellige behov og fremmer lige deltagelse og forståelse.
Hvad er fordelene ved ASR sammenlignet med traditionel transskribering?

Udover at dække den voksende mangel på dygtige traditionelle transskriptører kan ASR accelerere og forbedre kvaliteten af undertekster og transskriberinger. Med sine AI-baserede maskiner kan ASR indlære og absorbere information hurtigere og bedre end mennesker. Det ideelle format kræver dog stadig brug af menneskelig intelligens til at faktatjekke AI-produceret indhold. Dette redigeringstrin er særligt vigtigt, når ASR'en understøtter tilgængelighedsinitiativer, hvor retningslinjer og love kræver næsten perfekt nøjagtighed.