Kurs by měl poskytnout základní představu o vývoji a současném stavu
koncepcí strojového a poloautomatického překladu z hlediska lingvistického, uživatelského a částečně i programátorského.
Na základě ukázek experimentálních systémů si zájemci
budou moci vytvořit a otestovat vlastní jednoduchý systém nebo modifikovat systém již fungující.
Část kursu bude věnována vícejazyčným paralelním textům, zejména možnostem jejich využití, včetně praktické ukázky práce s poloautomatickým systémem založeným na překladové paměti (translation memory).
Předpoklady:
Osnova:
-
Úvod: využití strojového překladu, vymezení vzhledem k ostatním lingvistickým
oborům a aplikacím, základní typologie systémů, vývoj od konce 40.let
-
Teoretická lingvistika a strojový překlad: uplatnění formálních metod a
lingvistických teorií, symbolické a stochastické metody
-
Počítačové aspekty: hardware, programovací jazyky a formalismy, elektronické
slovníky a lexikální databáze, textové korpusy, vstup a výstup
-
Různé koncepce strojového překladu a jejich porovnani: symbolické, example-based,
stochastické; přímá metoda, transfer, interlingva; dávkový a interaktivní
režim; univerzální a specializované systémy
-
Lingvistické problémy a jejich řešení: víceznačnost, souznačnost v jednom
jazyce a v překladu, anafora, dosah kvantifikátorů
-
Způsoby budování a využívání souborů paralelních textů, poloautomatické systémy využívající překladovou paměť
-
Praktické využití a kritéria pro hodnocení systémů: hledání efektivního
způsobu spolupráce člověka a systému, hodnocení kvality překladu a ekonomické
výhodnosti
-
Ukázky experimentálních a dostupných komerčních systémů