Anti Ingel kaitseb doktoritööd „Algorithms using information theory: classification in brain-computer interfaces and characterising reinforcement-learning agents“

22. septembril kell 14.15 kaitseb Anti Ingel informaatika erialal doktoritööd „Algorithms using information theory: classification in brain-computer interfaces and characterising reinforcement-learning agents“ („Informatsiooniteooriat kasutavad algoritmid: klassifitseerimine aju-arvuti liidestes ja stiimulõppe agentide iseloomustamine“).

Juhendajad:
prof Raul Vicente Zafra, Tartu Ülikool
kaasprof Dirk Oliver Theis, Tartu Ülikool

Oponendid:
prof Mikhail Prokopenko, Sydney ülikool (Austraalia)
kaasprof Luigi Bianchi, Rooma Tor Vergata ülikool (Itaalia)

Kokkuvõte
Informatsiooniteooria on matemaatika haru, mis on teoreetiliseks aluseks tänapäeva kommunikatsioonitehnoloogiatele. Samuti on informatsiooniteooria abil proovitud defineerida abstraktseid mõisteid nagu autonoomsus. Antud töös kasutataksegi äsja nimetatud informatsiooniteooria rakendusi masinõppes esile tulnud probleemide lahendamiseks. Kommunikatsioonivaldkonnast käsitleti aju-arvuti liideseid (AAL). AAL on otsene suhtluskanal kasutaja aju ja välise seadme vahel  seega võimaldab mõttejõul seadmeid juhtida. Väliseks seadmeks võib olla näiteks arvuti või elektriline ratastool. AAL kasutab käskude tuvastamiseks kasutaja ajust pärit signaale, mida saab mõõta pea peale paigutatud elektroodidega. Teist rakendust, nimelt informatsiooniteoorial põhinevat autonoomsuse mõõtmist kasutati antud töös stiimulõppe agentide käitumise iseloomustamiseks. Stiimulõpe on teatavat tüüpi masinõpe, milles agent õpib keskkonnast saadud tagasiside põhjal.

Antud töös töötati välja algoritmid, mis põhinevad informatsiooniteooria tulemustel. AALide puhul kasutatakse informatsiooniteooria vahendeid informatsiooni edastamise kiiruse mõõtmiseks. Seda kasutatakse laialdaselt AALide efektiivsuse mõõdikuna. AALide puhul keskenduti antud töös küsimusele, kas on võimalik leida optimaalne klassifitseerija AALi jaoks ning mis eeldustel see oleks optimaalne. Töötati välja algoritmid optimaalse klassifitseerija leidmiseks.

Stiimulõppe agentide puhul saab informatsiooniteooriat kasutada agentide autonoomsuse ja teiste käitumist iseloomustavate suuruste mõõtmiseks. Stiimulõppe puhul tugineti antud töös olemasolevatele informatsiooniteooriast pärit mõistetele, mille abil saab mõõta agentide autonoomsust ja keskkonna internaliseeritust. Lisaks kasutati osalist informatsiooni lahutamise meetodit. Antud töö panus stiimulõppe valdkonnas on algoritm nende informatsiooniteooria suuruste mõõtmiseks; see võimaldab masinõppega treenitud agentide käitumist iseloomustada.