Skip to main content

Elizaveta Yankovskaya kaitseb doktoritööd „Quality estimation through attention“

17. juunil kell 16.15 kaitseb Elizaveta Yankovskaya informaatika erialal doktoritööd „Quality estimation through attention“ („Kvaliteedi hindamine tähelepanu abil“).

Juhendaja:
prof Mark Fišel, Tartu Ülikool

Oponendid:
prof Rico Sennrich, Zürichi Ülikool (Šveits)
dr Chi-Kiu Lo, Kanada Riiklik Teadusnõukogu (Kanada)

Kokkuvõte
Masintõlge on saanud osaks mitte ainult keeleteadlaste ja professionaalsete tõlkijate, vaid peaaegu kõigi elust. Enamik inimesi, kes on kasutanud masintõlget, on kohanud naljakaid ja kohati täiesti valesid tõlkeid, mis lause tähendust täielikult moonutavad. Seega peame peale masintõlke mudeli kasutama hindamismehhanismi, mis teavitab inimesi tõlgete kvaliteedist. Loomulikult saavad professionaalsed tõlkijad masintõlke väljundit hinnata ja vajadusel toimetada. Inimeste märkuste kasutamine veebipõhiste masintõlkesüsteemide tõlgete hindamiseks on aga äärmiselt kulukas ja ebapraktiline. Seetõttu  on automatiseeritud tõlkekvaliteedi hindamise süsteemid masintõlke töövoo oluline osa.

Kvaliteedihinnangu eesmärk on ennustada masintõlke väljundi kvaliteeti, ilma etalontõlgeteta. Selles töös keskendusime kvaliteedihinnangu mõõdikutele ja käsitleme tõlkekvaliteedi näitajana tähelepanumehhanismi ennustatud jaotusi, mis on üks kaasaegsete neuromasintõlke (NMT) süsteemide sisemistest parameetritest. Kõigepealt rakendasime seda rekurrentsetel närvivõrkudel (RNN) põhinevatele masintõlkemudelitele ja analüüsisime pakutud meetodite toimivust juhendamata ja juhendatud ülesannete jaoks. Kuna RNN-põhised MT-süsteemid on nüüdseks asendunud transformeritega, mis muutusid peamiseks tipptaseme masintõlke tehnoloogiaks, kohandasime oma lähenemisviisi ka transformeri arhitektuurile. Näitasime, et tähelepanupõhised meetodid sobivad nii juhendatud kui ka juhendamata ülesannete jaoks, kuigi teatud piirangutega. Kuna annotatsiooni andmete hankimine on üsna kulukas, uurisime, kui palju annoteeritud andmeid on vaja kvaliteedihinnangu mudeli treenimiseks.

Kaitsmine toimub Zoomis (kohtumise ID: 955 3734 8678, pääsukood: ati).

#teadus
Kristjan Krips

Doktoritöö: e-hääletamise kontrollitavusele seab piirid häälteostmise risk

Jaga
21.06.2022
#rahvusvaheline #teadus
AGA_3690_Lumi_CSC_2109_smaller.jpg

Euroopa võimsaim superarvuti LUMI asub lahendama üleilmseid probleeme ja edendama rohepööret

Jaga
13.06.2022
#teadus #ühiskonnale

Seminar „Sensors for the METAVERSE“

Jaga
30.05.2022