Využití překladových pamětí
 01  Úvod – charakteristika základních souborů


1. Bitext a tabulka v DOC (RTF)
1.1. Bitext obsahuje texty ve dvou jazycích. Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.
Jde nejčastěji o TXT soubor, který může mít národní kódování pro
a) DOS, Unix (Linux), Mac
b) ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1250)
Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).
c) UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16
d) Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.
e) Unicode Big Endian pro zobrazení východoasijského písma (CJK = čínština, japonština a korejština)
1.2. Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI
2. Glosář a obdobné soubory
Slovník – obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady. Bývá tříděn abecedně podle hesel.
Překladový slovník – obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi
Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)
Glosář – slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí
3. Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu
Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word. Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru. Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.
4. Překladová paměť
4.1. Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru. Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM. Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů. Je to např. TXT, ESL, DBF, MDB, TBW, SQL. CAT s nimi pracuje jako s databázovým souborem. Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.
4.2. Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

Copyright Ing. Milan Čondák 17.09.2009