Využití překladových pamětí
 09  FR




Soubor ke stažení: cs_fr


Obsah

 

A.

A.

Úvod - charakteristika základních souborů

Introduction - caractéristiques des ensembles de base

B.

B.

Podrobnější charakteristika

 

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Utilisation de la mémoire de traduction (TM = mémoire de traduction)

D.Odkazy a ukázky

 

A.

A.

Úvod - charakteristika základních souborů

Introduction - caractéristiques des ensembles de base

1.

1er

Bitext a tabulka v DOC (RTF)

Bitexte une table dans la DOC (RTF)

1.1.

1.1.

Bitext obsahuje texty ve dvou jazycích.

Bitexte contient des textes en deux langues.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

Fichier ne contient pas les codes linguistiques, et codées de sorte que les gens lisent les deux langues.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

Il est généralement un fichier TXT qui peuvent être de codage national pour

a) DOS, Unix (Linux), Mac

a) DOS, Unix (Linux), Mac

b) ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1250)

b) ANSI (Windows), les sites des langues nationales et de leurs équivalents pour HTM (Tchèque Win-1250)

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

Les tableaux de la DOC (RTF) le document contenant les codes langue des champs qui contiennent du texte (les langues source et cible).

c) UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

c) UTF-8 est utilisé le plus souvent, parce que les deux langues sont lisibles par un humain, il est utilisé pour les fichiers de mapping (UTF-7 n'est pas utilisé dans l'industrie de la traduction) et les fichiers sont plus petits que dans l'UTF-16

d) Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

d) Unicode (UTF-16) utilise MS Word et des programmes (CAT), où elle travaille pour afficher des fichiers texte, il mai être un des programmes de conversion locale ou base de données web,, etc

e) Unicode Big Endian pro zobrazení východoasijského písma (CJK = čínština, japonština a korejština)

e) Unicode Big Endian pour afficher les polices d'Asie orientale (CJC = Chinois, japonais, et coréen)

1.2.

1,2

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

Les tableaux de la DOC (RTF) documents contiennent des codes de la langue et les textes sont stockés dans la norme ANSI

2.

2.

Glosář a obdobné soubory

 

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

Dictionnaire - contient mot de passe + discours + formes du mot + + exemples de l'utilisation des traductions.

Bývá tříděn abecedně podle hesel.

Is alfabetik kayıtlara göre sıralanmış.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

Dictionnaire de traduction - contient une expression qui se compose d'un à cinq mots et leur traduction et est stocké dans une base de données

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

Glossaire - contient des mots d'une à cinq mots et leur traduction et est stocké dans un fichier texte ou XLS (maximum de deux champs)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

Glossaire - un glossaire + champs supplémentaires pour les observations et les données eventuáleně mai comme des attributs des mémoires de traduction

3.

3.

Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

Document segmenté Trados (DOC ou RTF), non nettoyés papier plié en MS Word

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

Survient généralement dans le cours de traduction dans les outils de TAO, qui utilisent un éditeur de texte MS Word.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

Parfois, c'est l'exportation des applications qui sont utilisés pour traduire autre type de fichier.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

Le document contient une unité de traduction, à savoir une paire de phrases, où la première phrase est dans la langue source et la deuxième phrase dans la langue cible, les marques de séparation et le nombre, qui exprime le pourcentage de conformité.

4.

4.

Překladová paměť

 

4.1.

4.1.

Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

Chacun des outils de TAO utiliser leurs propres (natif) type de fichier.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

Traduction anglais mémoire de mémoire de traduction et a appelé le TM abréviation.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

Types de fichiers Bien que les données contenues dans la mémoire de traduction sont similaires, autre format, la structure des données,.

Je to např.

Comme par exemple

TXT, ESL, DBF, MDB, TBW, SQL.

TXT, ESL, DBF, MDB, TBW, SQL.

CAT s nimi pracuje jako s databázovým souborem.

CAT fonctionne avec un fichier base de données.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

Les données utilisateur ne peut outils de mémoire de traduction natif CAT à modifier, si les données se voit dans d'autres outils et instruments qui lui permettront d'enregistrer le fichier modifié.

4.2.

4.2.

Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

Translation Memory Exchange (TMX) est un fichier texte avec TMX, qui est encodé en format UTF-8 ou Unicode.

B.

B.

Podrobnější charakteristika

 

1.

1.

Bitext

Bitext

Bitext je možno vytvořit

Bitexte pouvez créer

a) konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

a) la conversion de deux colonnes d'une feuille de fichier xls ou toute autre feuille de tableur

b) přiřazením segmentů souborů ( přiřadit je anglicky "align" a přiřazení "alignment"

b) l'attribution de fichiers de segment (l'attribuer à l'anglais "align" et d'assigner "alignement"

c) konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

c) la conversion d'une table ou d'autres types de fichiers, qui a perdu les attributs et l'heure

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

Exemple de conversion: MS Exel peut déposer "Enregistrer sous" pour sélectionner le format approprié, en format MS Word de conversion est effectuée via le menu Tableau, puis continue comme dans MS Exel

2.

2.

Glosář

Glossaire

Elektronické překladové slovníky umožňují přidávání a export terminologie.

Dictionnaires de traduction électroniques permettent d'ajouter et de la terminologie à l'exportation.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

Le dictionnaire mai ajouté une paire de signification individuelle et les notes de tri.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

Les auteurs de dictionnaires pour crypter le contenu de sa base de données et n'exporte pas de données.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

Les dictionnaires commerciaux peuvent être exportés que par la terminologie ajouté.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

Exemple: le traducteur PC peut être ajouté à la définition dans le dictionnaire que juste une paire de champ Code.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

Il est possible d'ajouter des couples de sens différents ou des dossiers entiers, puis supprimez les mêmes termes.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

La terminologie propre à l'exportation peuvent être archivés et importés par une version plus récente du logiciel.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

Résumé: Glossaire des outils de TAO peuvent être utilisés dans la conversion des autres outils de TAO et les compilateurs.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

Par des outils de TAO peuvent se connecter à la terminologie du compilateur ou d'autres sources publiquement disponibles.

3.

3.

Segmentovaný dokument Trados

Trados document segmenté

Dokument obsahuje neviditelná, viditelná a skrytá data.

Document contient des données invisibles, visibles et cachés.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

Invisible données peuvent être vérifiées pour enregistrer le fichier en tant que HTM et HTM pour afficher le fichier comme un fichier texte (source fichier HTM).

Viditelná data obsahují přeložený text.

Visible de données contient le texte traduit.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

Les données cachées contient le texte source, les marques de séparation et de données auxiliaires telles que la conformité au pourcentage avec une mémoire de traduction, qui a été utilisé dans la traduction.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

Ce format est standard et l'utilise, sauf que Trados Wordfast Classic, AnyMem.

Načítá jej a exportuje do něj MetaTexis.

Le lit et l'exporte en MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Exportation dans Wordfast Anywhere et autres outils de TAO et des outils de conversion.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

Soi-disant. Document Cleanup (nettoyage), le document est nettoyé à partir du texte source et toutes les étiquettes auxiliaires et le contenu du document de mai être étendu aux outils de mémoire de traduction actuelle unité CAT.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

Trados document segmenté mai être utilisé pour mettre à jour la MC, en utilisant une variété d'outils de TAO.

4.

4.

Překladová paměť

Mémoire de traduction

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

Chacun des outils de TAO permet d'importer et d'exporter TMX et permettre ainsi l'échange de données entre utilisateurs de différents outils de TAO.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

TMX est le principal véhicule pour l'échange de TM et peut travailler avec elle ainsi que des outils qui ne fonctionnent pas dans MS Word et ne fonctionnent pas avec Trados document segmenté.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

Instrument spécifique entre les instruments est OmegaT CAT.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

L'outil est écrit en Java et dispose de trois versions (pour les systèmes d'exploitation différents:

Windows, Linux a MacIntosh).

Windows, Linux et Macintosh).

Je to open free software.

Il est ouvert du logiciel libre.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

Travaille seul ou avec Open Office (ODT type de fichier) et que leur mémoire de traduction dans TMX utilise UTF-8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Utilisation de la mémoire de traduction (TM = mémoire de traduction)

1.

1.

CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

Outil de TAO à TM sauve lors de la traduction d'une unité de traduction de tous les attributs de la seconde

2.

2.

CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

CAT outil de comparaison (match) segment source ouverte du document traduit, tous les segments source connectée MT

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

Notez que match "Anglais" - titre de comparaison, la conformité, etc Tchèques souvent perçu comme un conflit que de confrontation - match (match de football).

Zde údaj match = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

Voici les informations en match = 90, signifie que le segment est identique à 90% avec le segment le plus similaire dans la mémoire de traduction.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

Par comparaison, le plus couramment utilisé algorithme de Löwenstein.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

CAT apparaissent généralement l'unité de traduction avec le plus grand consensus, ou de placer automatiquement une traduction dans le segment cible et peut aussi voir les différences entre les segments dans le document source et la mémoire de traduction.

3.

3.

Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

Si des segments (phrases) ne dépassant pas 10 mots sont souvent fournis approvisionnement 100% de TM.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

Longues peines (peut-être 50 à 200 mots) peut être trouvée si le nouveau document contient une citation de documents antérieurs, notamment juridique, mise à jour des manuels, manuels, etc

4.

4.

Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

Konkordační recherche - terminologie recherche manuelle des peines imposées dans les paires de langues

5.

5.

Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

Manuel de la terminologie de reconstitution dans les dictionnaires et glossaires de terminologie ou de réparation stockées.

6.

6.

Dolování terminologie z vět uložených v jazykových párech.

Extraction de la terminologie des condamnations prononcées dans les paires de langues.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

Logiciel statistique spécial évalue l'occurrence des mots et phrases de la paire de langues et d'estimer comment elles doivent être des mots ou des phrases traduites.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

Une telle technologie est incluse dans le logiciel gratuit Google Translate, les données utilisées pour mettre en œuvre une traduction automatique (TA = traduction automatique).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

Il ya également payé les services Web, que le client TM vydolují traduction, ce qui rend difficile la comparaison de technologies de traduction de segments entiers.

E.Odkazy a ukázky

E. Liens et échantillons

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

Le www.condak.net fournir des informations sur les outils de TAO et d'information sur le bureau www.condak.cz PC Translator ou d'autres compilateurs.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

Le site Web sera http://www.condak.net/osu/cs/00.html présentations de cet atelier.

V Ostravě 17.9.2009

A Ostrava 17.9.2009

Ing.

Ing.

Milan Čondák

Milan Condak

Využití překladových pamětí

Utilisez MT


Copyright Ing. Milan Čondák 17.09.2009