ABSTRAKT

Úvodní, prakticky orientovaný kurs pro zájemce o problematiku zpracování a využívání paralelních textů na počítači, včetně jejich uplatnění při (polo)automatickém překladu. Během semestru bude mít každý účastník možnost vytvořit svůj vlastní paralelní korpus v přiměřeném rozsahu.

Předpoklady:

Osnova:

  1. Úvod: korpusy a korpusová lingvistika, paralelní korpusy a jejich využití
  2. Technické aspekty: formát dat, programové nástroje, hardware
  3. Ukázky: existující projekty a zdroje dat
  4. Výběr a získávání textů: vyváženost korpusu, technické a právní problémy
  5. Příprava textů: opravy a úpravy, konverze
  6. Zarovnávání (alignment): automatické nástroje, kontrola a opravy
  7. Hledání v paralelním korpusu: nástroje a práce s nimi
  8. Další způsoby využití paralelních korpusů: komputační lexikografie, hledání v cizojazyčných textech, strojový nebo počítačem podporovaný překlad, ...
  9. Konzultace k individuálním projektů, jejich prezentace