To see this in a different language:
Paralelní korpusy

 0/2 0/0 Z (Kv)
Ing. Alexandr Rosen, Ph.D. ,
Ústav teoretické a komputační lingvistiky FF UK,
Celetná 13, Praha 1, tel. 221619752, e-mail:


KDY A KDE:
Kdy: pondělí 18:00
Kde: Celetná 13, 1. patro, m. 18

Abstrakt, předpoklady a osnova

SEMINÁRNÍ PRÁCE: vytvoření menšího paralelního korpusu pro jazyky podle vlastní volby


Základní literatura:

slajdy z kursu pro obrazovku a pro tisk (8 slajdů na stránku)

Harold Somers: Building Parallel Corpora and Language Engineering

Doplňující literatura:

Základní poučení o zpracování textu v systémech Unix/Linux: UnixTools4Corpora.pdf, Unix4Poets.pdf

Jean Véronis (ed.) (2000): Parallel Text Processing: Alignment and Use of Translation Corpora, Kluwer Academic Publishers, Dordrecht/Boston/London

Oliver Streiter,Michael Carl, Johann Haller (Editors): Hybrid Approaches to Machine Translation (IAI Working Paper No. 35) - jak spojit paralelní texty, překladové paměti a systémy strojového překladu, najdete zde

Harold Somers (2003a): Machine Translation. Latest Developments. In: R. Mitkov (ed.): The Oxford Handbook of Computational Linguistics. Oxford University Press. 2003. pp. 512-528.

Harold Somers (2003b): An overview of Example-based Machine Translation.In: Michael Carl and Andy Way (eds): Recent advances in Example-Based Machine Translation, Dordrecht: Kluwer, 2003. pp. 3-57.

Doug Arnold (2002): Machine Translation: an Introductory Guide.

RŮZNÉ ODKAZY

Paralelní korpusy a nástroje přístupné z webového rozhraní

OPUS - an open source parallel corpus
rozsáhlý korpus s mnoha jazyky včetně češtiny, převážně počítačová literatura
Korpus CARMEL
36 cestopisů z 19. až počátku 20. století, 10 mil. slov, anglicky, španělsky, francouzsky, italsky, slovní druhy, lemmata, sémantická desambiguace, identifikace tématu
The IJS-ELAN corpus
slovinsko-anglický, morfosyntaktické značkování
COMPARA - Portuguese-English Parallel Translation Corpus
Hunglish: Hungarian-English parallel corpus
Přístup k právu Evropské unie
vyhledaný dokument lze zobrazit dvoujazyčně
TransSearch
Text Aligner On Line
English, French, Spanish, German

Další projekty

INTERCORP - projekt paralelních korpusů FF UK
The JRC-Acquis Multilingual Parallel Corpus
PDT 1.0 - Czech-English Corpus
KACENKA - česko-anglický korpus
Multext-East Home Page
Multext
Languages in Contrast - University of Oslo
Contragram home page
English-French aligned texts
The English-Norwegian Parallel Corpus
PLUG Project
The Uplug Home Page
Linguateca
Geometric Mapping and Alignment (GMA) Software

Nástroje

ParaConc
paralelní korpusový manažer pro PC
Alinea
další paralelní korpusový manažer pro PC
Hunalign
zarovnávací program
segmentace a Hunalign online
řekněte si vyučujícímu o login a heslo
Moore
další zarovnávací program, výstup jen 1:1

Další odkazy

TransRef
special focus on CAT (Computer Assisted Translation) tools
Online corpora
Olivier Kraif - Page personnelle - Home page
Parallel text processing: bibliography
neaktualizováno
Multilingual websites with parallel texts
Sentence Alignment and Word Alignment: Projects, Papers, Evaluation, etc.
HLT/NAACL 2003 Workshop on Building and Using Parallel Texts

Firmy (CAT):

WordFast
(pro PC i Macintosh)
Deja Vu
Trados
SDLX
Star (Transit/TermStar)

 


Alexandr Rosen - výuka
Ústav teoretické a komputační lingvistiky FF UK - výuka


Alexandr Rosen

2007/01/09