Suurten kielimallien ja konekääntämisen tulevaisuus
Tulevaisuudessa suuret kielimallit kehittyvät varmasti entistä taitavimmiksi, mutta toistaiseksi koulutetut NMT-mallit vaikuttavat tuottavan johdonmukaisempia tuloksia, jotka on helpompi jälkieditoida vaaditulle laatutasolle. Tämä pätee erityisesti tosielämän sisältöön, jota käsitellään perinteisissä käännöksenhallintajärjestelmien työnkuluissa.
On myös tärkeää huomata, että toimialakohtaisella sisällöllä ja terminologialla koulutetut NMT-mallit eivät kärsi tietyistä teknisistä haasteista ja omituisuuksista, jotka vaivaavat generatiivista tekoälyä.
NMT toimii ajan myötä ennustettavammin kielissä, joita se on viritetty kääntämään. Vertasimme aiemmin myös geneerisen NMT:n tuotosta LLM:n tuotokseen, ja vaikka laatu oli heikompi (pidempi editointietäisyys jne.), tulosten ennakoituvuus oli hyvä. Suurten kielimallien osalta laatu heikkenee nopeasti, erityisesti kun lähdekieli on muu kuin englanti ja yleisesti kielissä, joissa materiaalia on saatavilla vähemmän. Tuotetun sisällön laatu voi vaihdella merkittävästi.
Yksi esimerkki liittyy tekoälyn hallusinointiin – erityisesti pienemmissä kielissä – joka voi tehdä käännöksestä jopa hyödyttömän. Tämä näkyi erityisesti teknisen sisällön, kuten URL-osoitteiden, asiakas- tai alakohtaisen terminologian ja lyhyiden virkkeiden virheellisenä käsittelynä. LLM:t eivät siis vielä tuota yhtä luotettavia tuloksia, kun käsitellään suuria määriä sisältöä.
Yleisesti Acoladin tulokset asiantuntijan tekemän tarkistuksen jälkeen osoittivat, että vaikka suurten kielimallien tuottamat käännökset saivat verrattain korkeat pisteet, monimutkainen sisältö, joka sisälsi esimerkiksi rakenteellisia elementtejä ja muotoilua, aiheutti ongelmia.
Lisäksi verrattain monimutkaisten kehotteiden hallitseminen eri kielissä ja malleissa nostaa suurten kielimallien laajan hyödyntämisen kustannuksia, vaikka raa’an käsittelyn kustannukset ovatkin laskeneet.
Jos siis tarkoitus on kääntää automaattisesti suuria määriä sisältöjä ilman ihmisen työpanosta, laadukas konekäännösratkaisu on todennäköisesti parempi ratkaisu – ainakin toistaiseksi.
Kuten aiemmin totesimme, myös ihmisen osallistuessa käännöksen editointiin konekäännös voi olla kustannustehokkaampi vaihtoehto generatiiviseen tekoälyyn verrattuna, kun kehotteiden hiomiseen ei tarvitse käyttää aikaa. NMT:n editointietäisyys (PED) ja käännösten muokkaustarve (TER) ovat myös pienemmät, eli raakakäännösten korjaaminen vaatii vähemmän työtä kuin suurten kielimallien käännösten.
Näistä tuloksista huolimatta on selvää, että suuriin kielimalleihin perustuvalla generatiivisella tekoälyllä on tulevaisuudessa suuri rooli automaattisessa kääntämisessä – erityisesti mallien kehittyessä entisestään. Sille voidaan löytää mielenkiintoisia käyttötapauksia, kuten konekäännöksen tyylillinen hiominen. Löydösten perusteella suurilla kielimalleilla voi olla merkittävä rooli laatuarvioinneissa, ja mallien kykyjä voidaan hyödyntää myös esimerkiksi automaattisessa jälkieditoinnissa.
LLM:t tarjoavat mielenkiintoisia mahdollisuuksia liittyen monimerkityksellisyyksien, idiomien, kulttuuristen viittausten ja jopa huumorin käsittelyyn. Juuri tällaisten elementtien kanssa jotkin konekäännösmallit ovat olleet vaikeuksissa liittyen datasarjoihin, joiden pohjalta mallit on rakennettu.