![]() |
![]() |
![]() |
![]() |
![]() |
| Využití překladových pamětí |
| 05 | DE | |
|---|---|---|
| Soubor ke stažení: | cs_de |
|
Obsah |
Inhalt |
|
A.Úvod - charakteristika základních souborů |
|
|
B.Podrobnější charakteristika |
B. Ausführliche Spezifikationen |
|
C.Využití překladových pamětí (Translation Memory = TM) |
C. Einsatz von Translation-Memory (TM = Translation Memory) |
|
D.Odkazy a ukázky |
|
|
A. |
|
|
Úvod - charakteristika základních souborů |
|
|
1.Bitext a tabulka v DOC (RTF) |
|
|
1.1. |
|
|
Bitext obsahuje texty ve dvou jazycích. |
Bitext enthält Texte in zwei Sprachen. |
|
Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné. |
|
|
Jde nejčastěji o TXT soubor, který může mít národní kódování pro |
Es ist normalerweise eine TXT-Datei, die sich aus den nationalen Codierung kann |
|
a)DOS, Unix (Linux), Mac |
a) DOS, Unix (Linux), Mac |
|
b)ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520) |
b) ANSI (Windows), Websites der nationalen Sprachen und deren Äquivalente für HTM (Tschechische Win-1520) |
|
Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce). |
Die Tabellen im DOC (RTF) Dokument mit den Sprachcodes der Felder, die Text enthalten (die Ausgangs-und Zielsprache). |
|
c)UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16 |
c) UTF-8 wird am häufigsten verwendet, da beide Sprachen Menschen lesbar sind, ist es für die Zuordnung von Dateien verwendet (UTF-7 ist nicht in der Übersetzung Industrie) und die Dateien sind kleiner als in UTF-16 |
|
d)Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd. |
d) Unicode (UTF-16) verwendet, MS Word und Programme (CAT), das es funktioniert, um Text-Dateien anzuzeigen, kann ein lokaler oder Web-Datenbank, die Umwandlung Programmen werden usw. |
|
e)Unicode Big Endian pro zobrazení východoevropského písma (CJK = čínština, japonština a korejština) |
e) Unicode Big Endian Osten Schriften anzeigen (CJK = Chinesisch, Japanisch und Koreanisch) |
|
1.2. |
1,2 |
|
Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI |
Die Tabellen im DOC (RTF) Dokumente enthalten Sprachcodes und Texte sind in ANSI gespeichert |
|
2.Glosář a obdobné soubory |
|
|
Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady. |
|
|
Bývá tříděn abecedně podle hesel. |
|
|
Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi |
Übersetzung Wörterbuch - enthält ein Ausdruck, der von eins bis fünf Wörter und ihre Übersetzung besteht und in einer Datenbank gespeichert |
|
Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole) |
Glossar - enthält Woerter ein bis fünf Wörter und ihre Übersetzung und befindet sich in einem Text-oder XLS-Datei gespeichert (maximal zwei Felder) |
|
Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí |
Glossar - ein Glossar + zusätzliche Felder an die Bemerkungen und eventuáleně Daten können Attribute von Translation Memories |
|
3.Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu |
|
|
Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word. |
|
|
Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru. |
Manchmal ist es Anwendungen, die Ausfuhr verwendet werden, um andere Dateitypen zu übersetzen. |
|
Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody. |
Das Dokument enthält eine Übersetzung Einheit, dh ein paar Sätze, wo der erste Satz in der Ausgangssprache ist und der zweite Satz in der Zielsprache, Trennungs-, Zeichen und Nummern, die den Prozentsatz der Übereinstimmung zum Ausdruck bringt. |
|
4.Překladová paměť |
|
|
4.1.Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru. |
|
|
Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM. |
|
|
Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů. |
Obwohl die Daten in das Translation Memory enthalten sind ähnlich, anderes Format, Datenstruktur, Dateitypen. |
|
Je to např. |
|
|
TXT, ESL. |
TXT, ESL. |
|
DBF, MDB, TBW, SQL. |
DBF, MDB, TBW, SQL. |
|
CAT s nimi pracuje jako s databázovým souborem. |
CAT arbeitet mit so einer Datenbank-Datei. |
|
Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit. |
Die Benutzerdaten können keine "native" Translation-Memory-CAT-Tools zur Bearbeitung, wenn die Daten in anderen Tools und Instrumente zu sehen ist, damit sie auf die geänderte Datei zu speichern. |
|
4.2.Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode. |
4.2.Translation Memory Exchange (TMX) ist eine Textdatei mit TMX, die entweder in UTF-8 ist oder Unicode. |
|
B. |
B. |
|
Podrobnější charakteristika |
Ausführliche Spezifikationen |
|
1.Bitext |
1.Bitext |
|
Bitext je možno vytvořit |
|
|
a)konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru |
a) Umwandlung von zwei Säulen aus einem Arbeitsblatt xls-Datei oder einem anderen Blatt Tabellenkalkulation |
|
b)přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment" |
b) Daten-Management-Segment Zuordnung (weisen Sie es auf Englisch "align" und ordnen "alignment" |
|
c)konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka |
c) die Umwandlung aus einer Tabelle oder einer anderen Datei-Typen, die Attribute und Zeit verloren Stempel |
|
Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu |
Conversion Beispiel: MS Exel kann Datei "Speichern unter" in das entsprechende Format wählen, in MS Word-Konvertierung über das Menü "Tabelle" durchgeführt wird, und dann weiter wie in MS Exel |
|
2.Glosář |
|
|
Elektronické překladové slovníky umožňují přidávání a export terminologie. |
Elektronische Wörterbücher Übersetzung ermöglichen das Hinzufügen und Export von Terminologie. |
|
Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky. |
Das Wörterbuch kann hinzugefügt werden, ein Paar individuelle Bedeutung und stellt fest, sortieren. |
|
Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat. |
Die Autoren von Wörterbüchern, um die Inhalte der Datenbank zu verschlüsseln und nicht exportieren. |
|
Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii. |
Die kommerzielle Wörterbücher können nur durch den zusätzlichen Terminologie exportiert werden. |
|
Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru. |
Beispiel: Der PC Translator können das Wörterbuch Sinne als nur ein paar Code-Feld hinzugefügt werden. |
|
Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat. |
Es ist möglich, andere Bedeutung Paare oder ganze Dateien hinzufügen und löschen Sie anschließend den gleichen Bedingungen. |
|
Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru. |
Export eigene Terminologie können archiviert werden und auf eine neuere Version der Software importiert werden. |
|
Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích. |
Zusammenfassung: Glossar der CAT-Tools können bei der Umwandlung von anderen CAT-Tools und Compiler verwendet werden. |
|
Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů. |
Mit dem CAT-Tools kann eine Verbindung der Terminologie der Compiler oder anderen öffentlich zugänglichen Quellen. |
|
3.Segmentovaný dokument Trados |
|
|
Dokument obsahuje neviditelná, viditelná a skrytá data. |
Dokument enthaelt unsichtbaren, sichtbaren und verborgenen Daten. |
|
Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor). |
Nicht sichtbar Daten können überprüft werden, um die Datei als HTM und HTM, um die Datei als Text-Datei (Quelle HTM-Datei) zu sehen. |
|
Viditelná data obsahují přeložený text. |
Sichtbare Daten enthält den übersetzten Text. |
|
Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu. |
Versteckte Daten enthält der Quelltext, Abscheider, Muster und zusätzliche Daten wie der Anteil der Einhaltung ein Translation Memory, das in der Übersetzung verwendet wurde. |
|
Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem. |
Dieses Format ist Standard und nutzt es sei denn Trados Wordfast Classic, AnyMem. |
|
Načítá jej a exportuje do něj MetaTexis. |
Liest und exportiert sie in MetaTexis. |
|
Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje. |
Export in Wordfast Anywhere und anderen CAT-Tools und Konvertierungs-Tools. |
|
Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje. |
Sogenannte. Dokument Cleanup (Clean-up), wird das Dokument aus dem Quelltext und alle Hilfs-Etiketten und Inhalt des Dokuments zu reinigen kann die aktuelle Übersetzung Speichereinheit CAT-Tools erweitert werden. |
|
Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje. |
Segmentierte Trados-Dokument verwendet werden, um die TM-Update mit einer Vielzahl von CAT-Tools. |
|
4.Překladová paměť |
|
|
Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů. |
Jeder CAT-Tools kann die Einfuhr und Ausfuhr TMX und erlauben so den Austausch von Daten zwischen Benutzern verschiedener CAT-Tools. |
|
TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu. |
TMX ist das wichtigste Instrument für den Austausch von TM und kann mit ihr arbeiten sowie Werkzeuge, die nicht funktionieren in MS Word und nicht mit Trados segmentierte Dokument zu arbeiten. |
|
Specifickým nástrojem mezi CAT nástroji je OmegaT. |
Spezifische Instrument unter Instrumenten OmegaT CAT. |
|
Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy: |
Das Tool ist in Java geschrieben und hat drei Versionen (für verschiedene Betriebssysteme: |
|
Windows, Linux a MacIntosh). |
Windows, Linux und Macintosh). |
|
Je to open free software. |
Es ist offener, freier Software. |
|
Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8. |
Arbeitet allein oder mit Open Office (ODT-Datei-Typ) und deren Translation Memory im TMX verwendet UTF-8. |
|
C. |
C. |
|
Využití překladových pamětí (Translation Memory = TM) |
Einsatz von Translation Memory (TM = Translation Memory) |
|
1.CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou |
1.CAT Werkzeug in TM spart bei der Übersetzung eine Übersetzung Einheit mit allen Attributen des zweiten |
|
2.CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí |
2.CAT Tool vergleicht die (Spiel) Open-Source-Segment des übersetzten Dokuments, alle Quell-Segmente verbunden TMs |
|
Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match). |
Beachten Sie, dass Englisch "match" - Vergleich, Compliance, etc. Tschechen oft als ein Konflikt nur auf Konfrontation wahrgenommen - match (Fußballspiel). |
|
Zde údaj mach = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti. |
Hier werden Informationen mach = 90, bedeutet, dass das Segment zu 90% identisch ist mit den meisten ähnlichen Segment im Translation Memory. |
|
Pro porovnávání se nejčastěji používá Löwensteinův algoritmus. |
Zum Vergleich, die am häufigsten verwendeten Löwenstein Algorithmus. |
|
CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti. |
CAT erscheinen meist Übersetzung Einheit mit der höchsten Konsens, oder automatisch eine Übersetzung in die Ziel-Bereich und können auch die Unterschiede zwischen den Segmenten im Quelldokument und Translation Memory. |
|
3.Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM. |
3.Wenn Segmente (Sätze) nicht mehr als 10 Worte sind oft für 100% Versorgung mit TM. |
|
Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod. |
Lange Sätze (vielleicht 50 bis 200 Wörter) gefunden werden kann, wenn das neue Dokument ein Zitat aus früheren Dokumenten, insbesondere rechtlicher, Aktualisierung enthält Handbücher, Bedienungsanleitungen, etc. |
|
4.Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech |
4.Konkordanze Suche - manuelle Suche Terminologie der Sätze in der Sprache Paar verhängt |
|
5.Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie. |
5.Manualle Nachschub Terminologie in Wörterbüchern und Glossaren oder Reparatur gespeichert Terminologie. |
|
6.Dolování terminologie z vět uložených v jazykových párech. |
6.Data mining Terminologie der Sätze in der Sprache Paaren eingeführt. |
|
Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy. |
Spezielle statistische Software wertet das Auftreten von Wörtern und Sätzen in der Sprachrichtung und abzuschätzen, wie sie Wörter oder Sätze übersetzt werden soll. |
|
Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT). |
Diese Technologie wird als das kostenlose Google Translate, die Daten verwendet, um eine maschinelle Übersetzung (MT = Machine Translation) Umsetzung enthalten. |
|
Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů. |
Es gibt auch Web-Services zu zahlen, die die Kunden TM vydolují Übersetzung, macht die Übersetzung Technologie Vergleich der ganze Segmente. |
|
E.Odkazy a ukázky |
E. Links und Proben |
|
Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích. |
Die www.condak.net Informationen über CAT-Tools und Informationen über www.condak.cz PC Translator - oder andere Desktop Übersetzer. |
|
Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu. |
Die Website wird http://www.condak.net/osu/cs/00.html Präsentationen dieses Workshops. |
|
V Ostravě 17.9.2009 |
In Ostrava 17.9.2009 |
|
Ing. |
Ing. |
|
Milan Čondák |
Milan Condak |
|
Využití překladových pamětí |
Verwendung der TMs |