To see this in a different language:
Paralelní korpusy
0/2 0/0 Z (Kv)
Ing. Alexandr Rosen, Ph.D. ,
Ústav teoretické a komputační lingvistiky
FF UK,
Celetná 13, Praha 1, tel. 221619752, e-mail:
KDY A KDE:
Kdy: pondělí 18:00
Kde: Celetná 13, 1. patro, m. 18
Abstrakt, předpoklady a osnova
SEMINÁRNÍ PRÁCE: vytvoření menšího paralelního korpusu pro
jazyky podle vlastní volby
Základní literatura:
- slajdy z kursu pro obrazovku a pro
tisk (8 slajdů na stránku)
-
Harold Somers: Building Parallel Corpora and Language Engineering
Doplňující literatura:
- Základní poučení o zpracování textu v systémech Unix/Linux: UnixTools4Corpora.pdf, Unix4Poets.pdf
-
Jean Véronis (ed.) (2000):
Parallel Text Processing: Alignment and Use of Translation Corpora,
Kluwer Academic Publishers, Dordrecht/Boston/London
-
Oliver Streiter,Michael Carl, Johann Haller (Editors): Hybrid Approaches
to
Machine Translation (IAI Working Paper No. 35) -
jak spojit paralelní texty, překladové paměti a systémy
strojového překladu, najdete zde
-
Harold Somers (2003a): Machine Translation. Latest Developments. In: R. Mitkov (ed.): The Oxford Handbook of Computational Linguistics. Oxford University Press. 2003. pp. 512-528.
-
Harold Somers (2003b): An overview of Example-based Machine Translation.In: Michael Carl and Andy Way (eds): Recent advances in Example-Based Machine Translation, Dordrecht: Kluwer, 2003. pp. 3-57.
-
Doug Arnold (2002): Machine Translation: an Introductory Guide.
RŮZNÉ ODKAZY
Paralelní korpusy a nástroje přístupné z webového rozhraní
- OPUS - an open
source parallel corpus
- rozsáhlý korpus s mnoha
jazyky včetně češtiny, převážně počítačová literatura
- Korpus CARMEL
- 36 cestopisů z 19. až počátku 20. století, 10
mil. slov, anglicky,
španělsky, francouzsky, italsky, slovní druhy,
lemmata, sémantická desambiguace, identifikace tématu
- The IJS-ELAN
corpus
- slovinsko-anglický, morfosyntaktické značkování
- COMPARA - Portuguese-English Parallel Translation Corpus
- Hunglish: Hungarian-English parallel corpus
- Přístup k právu
Evropské unie
- vyhledaný dokument lze zobrazit dvoujazyčně
- TransSearch
- Text Aligner On Line
- English, French, Spanish, German
Další projekty
- INTERCORP - projekt paralelních korpusů FF UK
- The JRC-Acquis Multilingual Parallel Corpus
- PDT 1.0 - Czech-English Corpus
- KACENKA - česko-anglický korpus
- Multext-East Home Page
- Multext
- Languages in Contrast - University of Oslo
- Contragram home page
- English-French aligned texts
- The English-Norwegian Parallel Corpus
- PLUG Project
- The Uplug Home Page
- Linguateca
- Geometric Mapping and Alignment (GMA) Software
Nástroje
- ParaConc
- paralelní korpusový manažer pro PC
- Alinea
- další paralelní korpusový manažer pro PC
- Hunalign
- zarovnávací program
- segmentace a Hunalign online
- řekněte si vyučujícímu o login a heslo
- Moore
- další zarovnávací program, výstup jen 1:1
Další odkazy
- TransRef
- special focus on CAT (Computer
Assisted Translation) tools
- Online corpora
- Olivier Kraif - Page personnelle - Home page
- Parallel text processing: bibliography
- neaktualizováno
- Multilingual websites with parallel texts
- Sentence
Alignment and Word Alignment: Projects, Papers,
Evaluation, etc.
- HLT/NAACL 2003 Workshop on Building and Using Parallel Texts
Firmy (CAT):
- WordFast
- (pro PC i Macintosh)
- Deja Vu
- Trados
- SDLX
- Star (Transit/TermStar)
Alexandr Rosen - výuka
Ústav teoretické
a komputační lingvistiky FF UK - výuka
Alexandr Rosen
2007/01/09