Kurs by měl poskytnout základní představu o vývoji a současném stavu koncepcí strojového a poloautomatického překladu z hlediska lingvistického, uživatelského a částečně i programátorského. Na základě ukázek experimentálních systémů si zájemci budou moci vytvořit a otestovat vlastní jednoduchý systém nebo modifikovat systém již fungující. Část kursu bude věnována vícejazyčným paralelním textům, zejména možnostem jejich využití, včetně praktické ukázky práce s poloautomatickým systémem založeným na překladové paměti (translation memory).

Předpoklady:

Osnova:

  1. Úvod: využití strojového překladu, vymezení vzhledem k ostatním lingvistickým oborům a aplikacím, základní typologie systémů, vývoj od konce 40.let
  2. Teoretická lingvistika a strojový překlad: uplatnění formálních metod a lingvistických teorií, symbolické a stochastické metody
  3. Počítačové aspekty: hardware, programovací jazyky a formalismy, elektronické slovníky a lexikální databáze, textové korpusy, vstup a výstup
  4. Různé koncepce strojového překladu a jejich porovnani: symbolické, example-based, stochastické; přímá metoda, transfer, interlingva; dávkový a interaktivní režim; univerzální a specializované systémy
  5. Lingvistické problémy a jejich řešení: víceznačnost, souznačnost v jednom jazyce a v překladu, anafora, dosah kvantifikátorů
  6. Způsoby budování a využívání souborů paralelních textů, poloautomatické systémy využívající překladovou paměť
  7. Praktické využití a kritéria pro hodnocení systémů: hledání efektivního způsobu spolupráce člověka a systému, hodnocení kvality překladu a ekonomické výhodnosti
  8. Ukázky experimentálních a dostupných komerčních systémů