Andre Tättar kaitseb doktoritööd „Multilingual machine translation for under-resourced languages“

Mees seisab
Autor:
Marianne Liiv

23. mail kell 10.15 kaitseb Andre Tättar doktoritööd „Multilingual machine translation for under-resourced languages“ („Mitmekeelne masintõlge ressursivaestele keeltele“).

Juhendaja:
professor Mark Fišel, Tartu Ülikool

Oponendid:
professor Jörg Tiedemann, Helsingi Ülikool
David Vilar Torres, Google Berlin (Saksamaa)

Kokkuvõte
Kujutlege maailma, kus igal keelel on arenenud loomuliku keele rakendused nagu ChatGPT või on esindatud Google'i tõlkemootoris, hoolimata nende suurusest. See on visioon minu doktoritöö taga, mis keskendub väheste ressurssidega keelte masintõlkele, mille põhifookus on just soome-ugri keeltel. Soome-ugri keelte perekonnas on üle 40 keele ja rääkijaid üle 20 miljoni inimese Euroopas ja Põhja-Aasias. Need keeled, alates eesti, soome või ungari rahvuskeeltest kuni väiksemate kohalike keelteni nagu võru, liivi või komi, kannavad endas rikkalikke kultuuripärandeid, kuid seisavad silmitsi märkimisväärse digitaalse mahajäämisega.

Minu doktoritöö ülesanne on vähendada lõhet suurte ja väikeste keelte vahel, arendades välja tehisnärvivõrkudel põhinevad masintõlkesüsteemid keeleressursivaeste keelte jaoks. Doktoritöö keskendub ressursirohketest ressursivaeste keelteni, kasutades uusimaid teaduslikult tõestatud meetodeid, et lahendada andmete vähesusest ning tõlke kvaliteedi ja effektiivsusega seotud probleeme. Doktoritöös välja toodud süsteemid toetavad 23 soome-ugri keelt ning toetavad seeläbi avalikku juurdepääsu teabele ja teenustele väikestes kogukondades.

Selle doktoritöö praktiline tulemus on olnud oluline, eriti eesti-kesksete tõlkimisvahendite arendamisel, mis suudavad konkureerida Google'i ja DeepL'i tõlkesüsteemidega. Eesti avalik sektor on need süsteemid kasutusele võtnud, näidates nende tõhusust igapäevaolukordades. Lisaks riiklikule kasutusele on kõik töös välja töötatud mudelid avatud litsensiga, võimaldades tehtud tööd teistel kasutusele võtta ja edasi arendada.

See töö demonstreerib, kuidas tehnoloogia aitab tagada võrdse juurdepääsu digitaalsetele ressurssidele igas keeles. Oleme ehitamas kaasavamat digitaalset keskkonda, tagades, et väiksemaid keeli ei jäeta tähelepanuta. Uurimus ei tõsta ainult keeletehnoloogia piire, vaid rõhutab ka keelelise mitmekesisuse väärtust tehnoloogilises edus. See on samm tuleviku suunas, kus ühtegi keelt ei jäeta digitaalajastul maha.

Kaitsmist saab jälgida ka Zoomis (kohtumise ID: 670 504 9543, pääsukood: ati).

Kas leidsite vajaliku informatsiooni? *
Aitäh tagasiside eest!