Rozpoznání koronavirové nákazy z nahrávky kašle patří k oblastem možného uplatnění takzvaných řečových technologií. Věnují se jim také odborníci z brněnských firem a univerzit. Česko díky tomu poprvé hostí mezinárodní konferenci Interspeech. Příští týden dorazí stovky odborníků, kteří se specializují na zpracování řeči a analýzy audiozáznamů. Další se připojí alespoň on-line, oznámila mluvčí Vysokého učení technického (VUT) Radana Koudelová.
"Řečaři" s pomocí strojového učení získávají z audiozáznamů informace o zdravotním stavu pacienta, případně o jeho mentálním rozpoložení. Před pandemií analyzovali různé formy kašle kvůli diagnostice chronických plicních chorob, tuberkulózy či astmatu, v posledních dvou letech se zaměřili na zvukové projevy koronaviru. Rozpoznávání nákazy z nahrávky by mohlo ušetřit finance na testování a urychlit diagnostiku. Tématu spojenému s pandemií se na konferenci věnují dvě programové sekce.
Rozpoznávání řeči se jako obor dynamicky rozvíjí, nyní je zahrnuto v každém chytrém telefonu a mnoha dalších zařízeních. Lidské řeči naslouchá chytrá lednička, auto i roboti na telefonních linkách. "Zatím ale stále nejsme s výzkumem a rozvojem u konce. Velkým tématem této doby je také trénování modelů strojového učení jen na malém množství dat. Přeci jen získat data z audiozáznamů je dost náročné i finančně nákladné, proto se teď výzkumné týmy z celého světa snaží naučit stroje, jak se mají učit jen z malých databází, které lze jednoduše stáhnout z YouTube či internetu obecně," uvedl jeden z hlavních organizátorů, Jan Černocký z Fakulty informačních technologií VUT.
Data získaná z audiozáznamů se stále zpřesňují. "Postupně se vědci z celého světa snaží naučit umělou inteligenci pracovat se zvukem i ve zhoršených podmínkách, jako je rozhovor lidí v dálce, s ozvěnou v kostele nebo třeba v restauraci plné lidí. Musíme řešit i jazykové pokrytí, protože nyní je velký rozvoj spíš u komerčně užívaných jazyků, jako je angličtina, francouzština, němčina a podobně, ale v budoucnu bude potřeba věnovat se i méně reprezentovaným jazykům, které kolikrát ani nemají písemnou formu, jen tu mluvenou," doplnil Černocký.
Brno začalo usilovat o pořadatelství konference v roce 2015, a to i proto, že ve městě působí řada IT firem, které se věnují právě zpracování dat ze zvuku. Interspeech 2021 bude poprvé kombinovat prezenční a on-line podobu. Do Brna zavítá přes 350 vědců, virtuálně se k akci připojí dalších téměř 1400.