Vogue LeadersBez lidského vkladu se ještě neobejdeme, tvrdí CTO překladatelské a tlumočnické společnosti Aspena
tým VOGUE20. 9. 2024
„Myslím si, že strojovým překladem pomocí AI bez lidského vstupu zabíjíme krásu a diverzitu jazyka, a tím i našeho myšlení," říká Václav Matyasko, CTO Aspeny. V rozhovoru pro Vogue.cz vysvětluje, jakou budoucnost mají nejen AI překlady, ale i AI tlumočení.
Foto: Václav Matyasko/ Aspena
Václav Matyasko, CTO Aspena
Jak vaše agentura v současné době využívá AI technologie?
Překlady byly jedním z prvních oborů, v nichž se využívalo strojové učení. Nejprve se jednalo o systém Statistical Machine Translation, který jsme nasadili a používali již roku 2012, a pak následoval takzvaný Neural Machine Translation, který v různých kombinacích s překladovými pamětmi a terminologickými databázemi aktivně používáme dodnes. Zároveň si na bázi jazykových modelů vyvíjíme i vlastní nástroje. Zajímavý je fakt, že v rámci oboru překladů dochází k průběžným inovacím a využití jazykových modelů už dlouho. Vývoj AI překladů tak u nás vnímáme lineárně, zatímco laická veřejnost současný výskyt AI vnímá jako přelomový.
Do jaké míry budou ještě zapotřebí k pořizování překladů živí překladatelé?
Větu o 14 slovech můžeme přeložit asi 76 000 způsoby. Některé jsou srozumitelné více, některé méně. Strojové a AI překlady se dnes pohybují, v závislosti na jazyku, na úrovni těch lepších stovek způsobů. Srozumitelný a lehce dostupný překlad se stává komoditou, která však nezaručí úspěch na trhu. Ze zkušenosti víme, že když chcete mít při prodeji produktu konkurenční výhodu nebo kvalitně vnímaný brand, musí být kvalita textu a jeho obsahu vyšší než strojová. Myslím si, že strojovým překladem pomocí AI bez lidského vstupu zabíjíme krásu a diverzitu jazyka, a tím i našeho myšlení. Výstupy AI překladačů jsou a budou sterilní. Zároveň si myslím, že v budoucnu u většinové populace obsah zvítězí nad formou.
Daří se vám v tomto směru usměrňovat očekávání klientů? Není to tak, že očekávají robota z filmu „Číslo 5 žije“, který vytvoří bezchybný překlad?
Zákazníky se snažíme vždy v dostatečné míře edukovat. Pokud náš zákazník poptává strojový předklad například kvůli velkému objemu textu nebo ceně, vždy jej upozorňujeme na jeho specifika a nabízíme službu lidského posteditingu, která výsledný obsah upraví do přirozeně čitelné podoby.
Jak konkrétně probíhá proces posteditingu strojového překladu a jakou roli v něm hrají překladatelé?
Pomocí posteditingu opravujeme chyby, které strojový překlad obsahuje. Jde například o nesprávné významy, gramatické chyby nebo nesprávnou stylistiku, a dosahujeme tak kvality srovnatelné s lidským překladem. Zatímco klasická jazyková korektura nad výstupem lidského překladatele pracuje již se smysluplným textem, v posteditingu obvykle opravujeme text, který může být nejasný nebo zavádějící. Jak korektura, tak postediting tedy mají za cíl zlepšit kvalitu textu po překladu, jsou však rozdílné v rozsahu a typu prováděných úprav. Role překladatele či posteditora je proto náročnější. Musí rozhodnout, kdy je vhodné text jen lehce upravit, ale kdy je nutné ho do určité míry přepracovat. Postediting proto od překladatele vyžaduje jak jazykovou zdatnost, tak i schopnost rychle kriticky hodnotit výstupy strojového překladu.
Jaké jsou největší výzvy při implementaci AI nástrojů v překladatelských procesech, zejména pokud jde o udržení kvality a autenticity textu?
Vzhledem ke skokově zvyšující se kvalitě verzí jazykových modelů je potřeba vždy s nasazením nové verze věnovat dostatečné množství času rekonfiguraci AI nástrojů a změnám v promptech. Další vlastností, na kterou je třeba dát si pozor, je rozdílná terminologie v rozdílných instancích téhož AI nástroje. Pokud terminologii nevynucujeme třeba kontextem, tak AI sama o sobě nedrží konzistenci pojmenování a vlastně ani překladu. Rovněž se setkáváme s určitou strohostí AI nástrojů při zpracování textů v jazycích s malým objemem trénovacích dat – např. ve slovinštině, slovenštině, estonštině... Další výzvou bývá omezení rozsahu použitelného kontextu a samozřejmě biasy (systémové chyby – pozn. red.). Musíme si uvědomit, že pracujeme spíše s umělou intuicí než s inteligencí.
Jak vidíte AI v budoucnosti tlumočení? Interpretace mluveného slova je přece jenom náročnější disciplína.
Tlumočení je o trochu složitější než překlad textu už jen proto, že kromě samotného překladu je třeba pracovat s rozpoznáváním jednotlivých slov v rámci dialogu a zvuků okolního prostředí. Ve stávajícím pojetí jsou při tlumočení obvyklé tři po sobě navazující procesy: speech2text – překlad textu – text2speech. Nyní však začínají některé AI nástroje, například ChatGPT 4.o, fungovat i na čistě mluvené bázi, takže v příštích letech očekáváme významné posuny i v této oblasti. V tlumočení nás čekají velké změny. Ke klasickému AI tlumočení s možností automatického rozpoznávání zdrojového jazyka, které jsme realizovali na Vogue AI konferenci v červnu, přibudou nové funkcionality. Jako klíčovou vnímám možnost hlasového klonování, při němž bude zdrojový hlas využit k vygenerování hlasu cílového. To znamená, že cizojazyčný posluchač uslyší váš hlas ve svém preferovaném jazyce, ačkoliv vy jej neovládáte. Co jsme si rovněž ověřili v praxi, výzvou pro AI tlumočení zůstává (a ještě nějaký čas to tak zůstane) czenglish, tedy použití anglických slovíček v kombinaci s českým slovosledem. Lze vysledovat zřetelný kvalitativní rozdíl v tlumočení z angličtiny do češtiny, když AI tlumočí řeč rodilého anglického mluvčího a anglicky mluvícího Čecha na úrovni C1/B2, a to samozřejmě ve prospěch anglického rodilého mluvčího.