Anglicko-český překladač CUBBITT založený na využití umělých neuronových sítí dohání v překladu novinových článků práci lidských překladatelů. Na jeho vývoji spolupracovali vědci z Matematicko-fyzikální fakulty Univerzity Karlovy.
V testu byly výsledky překladače hodnoceny jako méně plynulé, avšak obsahově přesnější než lidské. Mluvčí Univerzity Karlovy (UK) Václav Hájek o tom informoval v tiskové zprávě. Článek o překladači publikoval odborný časopis Nature Communications.
Vědci využili neuronovou síť, kterou připravili na anglické texty a jejich protějšky přeložené do češtiny. Šlo o 58 milionů párů vět. Překladač pak použili k přeložení vzorku anglických novinových textů. Na stejném vzorku pracovali také profesionální překladatelé z překladové agentury. Kvalitu automatických i ručních překladů pak hodnotilo 15 rodilých mluvčích češtiny, kteří posuzovali přesnost a plynulost překladu. Hodnotitelé přitom nevěděli, kdo na daných větách pracoval.
"Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost překladu," uvedl hlavní autor studie Martin Popel.
Podle vědců spočívala jedna z inovací ve způsobu, jak byla překladači střídavě předkládána autentická a syntetická paralelní data - tedy páry českých vět a jejich automatických překladů do angličtiny. Při experimentu vědci pozorovali, že je výhodnější neuronové síti předložit autentická a syntetická data nikoliv rovnoměrně promísená, ale ve specificky vyváženém rytmu střídajících se autentických a syntetických bloků.
Autoři studie upozornili, že měření se uskutečnilo pouze na specifickém žánru novinových článků, výsledky tedy nelze zobecňovat na překladatelskou práci jako celek.
Vědci z UK spolupracovali s kolegy z Oxfordské univerzity a z týmu Google Brain.