|
| 1. Bitext a tabulka v DOC (RTF) |
|
| 1.1. Bitext obsahuje texty ve dvou jazycích. Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné. |
|
| Jde nejčastěji o TXT soubor, který může mít národní kódování pro |
| a) DOS, Unix (Linux), Mac |
| b) ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1250) |
| Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce). |
| c) UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16 |
| d) Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd. |
| e) Unicode Big Endian pro zobrazení východoasijského písma (CJK = čínština, japonština a korejština) |
|
| 1.2. Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI |
|
|
| 2. Glosář a obdobné soubory |
|
|
| Slovník – obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady. Bývá tříděn abecedně podle hesel. |
| Překladový slovník – obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi |
| Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole) |
| Glosář – slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí |
|
| 3. Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu |
|
| Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word. Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru. Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody. |
|
| 4. Překladová paměť |
|
| 4.1. Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru. Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM. Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů. Je to např. TXT, ESL, DBF, MDB, TBW, SQL. CAT s nimi pracuje jako s databázovým souborem. Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit. |
| 4.2. Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode. |