Využití překladových pamětí
 16  RU




Soubor ke stažení: cs_ru


Obsah

 

A.Úvod - charakteristika základních souborů

А. Введение - основные характеристики файлов

B.Podrobnější charakteristika

 

C.Využití překladových pamětí (Translation Memory = TM)

C. Использование Translation Memory (TM = Translation Memory)

D.Odkazy a ukázky

 

A.

 

Úvod - charakteristika základních souborů

Введение - характеристика основных множеств

1.Bitext a tabulka v DOC (RTF)

1.Bitext таблицы в DOC (RTF)

1.1.

1.1.

Bitext obsahuje texty ve dvou jazycích.

Bitext содержит тексты на двух Языки.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

Файл не содержит формулировок кодами, и кодируются так, чтобы люди читали как Языки.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

Как правило, TXT файлов, которые могут быть национальные кодирующих

a)DOS, Unix (Linux), Mac

a) DOS, Unix (Linux), Mac

b)ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520)

б) ANSI (Windows), сайты национальных Языки и их эквиваленты на HTM (чешский Win-1520)

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

Таблицы в DOC (RTF) Документ, содержащий языковых кодов полей, которые содержат текст (исходный язык и язык).

c)UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

с) UTF-8 используется наиболее часто, потому что человек читаемым как Языки, она используется для отображения файлов (UTF-7 не используется в переводе промышленности) и файлы меньше, чем в UTF-16

d)Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

 

e)Unicode Big Endian pro zobrazení východoevropského písma (CJK = čínština, japonština a korejština)

е) Unicode Big Endian Восток для просмотра шрифтов (CJK = китайском, японском, корейском и)

1.2.

1.2.

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

Таблицы в DOC (RTF) документы, содержащие коды языка и текстов хранятся в ANSI

2.Glosář a obdobné soubory

 

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

Словарь - содержит пароль + + слово речи формы + + примеров использования переводов.

Bývá tříděn abecedně podle hesel.

Отсортирован по алфавиту записи.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

Переводы словарь - содержит выражение, которое включает от одной до пяти слов и их переводов и хранится в базе данных

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

Глоссарий - содержит слова от одного до пяти слов и их переводов и хранится в текстовом файле или XLS (максимум два поля)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

Глоссарий - Глоссарий + дополнительные поля для замечаний и eventuáleně данные, которые могут быть признаками памяти переводов

3.Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

 

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

Часто возникает в процессе перевода в инструменты CAT, которые используют в текстовом редакторе MS Word.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

Иногда экспортных заявок, которые используются для перевода другой тип файла.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

Документ содержит перевода единиц, то есть пару фраз, где первое предложение на языке оригинала, а второе предложение в целевом языке, разделение знаков и цифр, которая выражается в процентах за соблюдением.

4.Překladová paměť

4.Překladová памяти

4.1.Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

4.1.Jednotlivé CAT Tools использовать свой собственный (родной) тип файла.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

Английский памяти памяти переводов Перевод и называется аббревиатурой TM.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

Хотя данные, содержащиеся в памяти переводов схожи, различного формата, структуры данных, типы файлов.

Je to např.

В качестве примера

TXT, ESL.

TXT, ESL.

DBF, MDB, TBW, SQL.

DBF, MDB, TBW, SQL.

CAT s nimi pracuje jako s databázovým souborem.

КПП работает как файл базы данных.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

Данные не могут родном Translation Memory CAT инструментов для редактирования, если данные видели в других механизмов и инструментов, чтобы позволить ему сохранить измененный файл.

4.2.Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

4.2.Translation обмена с памятью (TMX) представляет собой текстовый файл с ТМХ, который кодируется либо в UTF-8 или Unicode.

B.

B.

Podrobnější charakteristika

 

1.Bitext

1.Bitext

Bitext je možno vytvořit

Bitext может создать

a)konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

а) преобразование двух столбцов на листе XLS файлов или любой другой таблицы листа

b)přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment"

б) управление данными сегмента уступке (назначить его на английский "Выровнять" и назначить "Выравнивание"

c)konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

C) преобразования из таблицы или другие типы файлов, которые потеряли атрибуты и штамп времени

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

Конверсия Пример: MS Exel может подать на "Сохранить как", чтобы выбрать соответствующий формат, в превращении MS Word осуществляется через меню Таблица, а затем продолжает, как в MS Exel

2.Glosář

 

Elektronické překladové slovníky umožňují přidávání a export terminologie.

Электронные словари для перевода позволяет добавлять и экспорт терминологии.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

Словари могут быть добавлены отдельные пары смысла и сортировка заметок.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

Авторы словарей для шифрования содержимого своей базе данных и не экспортирует данные.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

Коммерческие словари можно экспортировать только добавила терминологии.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

Пример: PC Translator можно добавить в словарь смысл, чем просто пару код поля.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

Можно добавить различные пары смысл или все файлы, а затем удалить тех же условиях.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

Экспорт собственную терминологию, можно архивировать и импортирован в новой версии программного обеспечения.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

Резюме: Глоссарий инструментов CAT могут быть использованы при преобразовании других инструментов КПП и компиляторы.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

По CAT Tools можно подключить к терминологии компилятором или из других общедоступных источников.

3.Segmentovaný dokument Trados

3.Segmentovaný Trados документ

Dokument obsahuje neviditelná, viditelná a skrytá data.

Документ содержит невидимые, видимые и скрытые данные.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

Невидимый данные могут быть проверены, чтобы сохранить файл с расширением HTM и HTM, чтобы просмотреть файл в виде текстового файла (источник HTM файла).

Viditelná data obsahují přeložený text.

Видимое данные содержатся в переведенном тексте.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

Скрытые данные содержит исходный текст, сепаратор знаки и вспомогательные данные, такие как процент выполнения Translation Memory, которая была использована при переводе.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

Этот формат является стандартным и использует его, кроме как TRADOS Wordfast Classic, AnyMem.

Načítá jej a exportuje do něj MetaTexis.

Читает его и экспортирует ее в MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Экспорт в Wordfast Везде и другие инструменты пыток и преобразование инструмента.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

Так называемые. Документ очистки (очистка), документ будет очищен от исходного текста и всех вспомогательных этикетках и содержание этого документа может быть продлен до текущей памяти перевода единиц CAT Tools.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

Сегментированный Trados документ может быть использован для обновления Т.М., используя различные инструменты КПП.

4.Překladová paměť

 

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

Каждый CAT Tools можно импортировать и экспортировать ТМХ и тем самым позволяют производить обмен данными между пользователями различных инструментов КПП.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

ТМХ является основным инструментом для обмена ТМ "и могут работать с ним, а также средства, которые не работают в MS Word и не работают с Trados сегментированный документов.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

Конкретные инструментом среди инструментов OmegaT КПП.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

Инструмент написан на Java и имеет три версии (для разных операционных систем:

Windows, Linux a MacIntosh).

Windows, Linux и Macintosh).

Je to open free software.

Оно открыто свободное программное обеспечение.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

Работа в одиночку или с Open Office (ОДТ тип файла), а их память переводов в ТМХ использует UTF-8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Использование Translation Memory (TM = Translation Memory)

1.CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

1.CAT инструмент в ТМ сохраняется при переводе единиц перевода со всеми атрибутами второго

2.CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

2.CAT инструментом сравнения (матч) сегмент открытых источников переведенных документов, все исходные сегменты связаны накопителей

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

Обратите внимание, что английский "Матч" - сравнение, соблюдения т.д. Чехи часто воспринимается как конфликт только конфронтационной - матч (футбол).

Zde údaj mach = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

Здесь информация match = 90, означает, что сегмент идентичны на 90% с самыми аналогичного сегмента в памяти переводов.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

Для сравнения, наиболее часто используемые Löwensteina алгоритма.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

CAT обычно появляются единиц перевода с высоким консенсус, или автоматически место перевод на целевой сегмент, а также может увидеть различия между сегментами в исходном документе и памяти переводов.

3.Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

3.Если сегменты (предложения) не более 10 слов, которые часто предоставляют 100% поставку TM.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

Длительные сроки (возможно, от 50 до 200 слов) можно найти, если новый документ содержит цитату из предыдущих документах, в частности, правовых, обновление учебных пособий, руководств, т.д.

4.Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

4.Konkordační поиска - ручной поиск терминология приговоров, вынесенных в языковых пар

5.Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

5.Ruční терминологии в пополнении словарей и глоссариев или ремонта хранится терминологии.

6.Dolování terminologie z vět uložených v jazykových párech.

6.Dolování терминологии приговоров, вынесенных в языковых пар.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

Специальное программное обеспечение статистической оценивает вхождения слов и фраз в языковую пару и оценить, насколько они должны быть слова или словосочетания переводятся.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

Такая технология включена в качестве свободного Google Translate, данные, использованные для осуществления машинного перевода (MT = Machine Translation).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

Есть также обратил веб-услуг, которая ТМ клиента vydolují перевода, что делает технологию перевода сравнения целого сегмента.

E.Odkazy a ukázky

Е. Связи и образцы

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

Www.condak.net предоставить информацию об инструментах КПП и w нформация о www.condak.cz Переводчик настольного ПК или других компиляторов.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

Сайт будет http://www.condak.net/osu/cs/00.html презентации этого семинара.

V Ostravě 17.9.2009

В Остраве 17.9.2009

Ing.

Ing.

Milan Čondák

Милан Condak

Využití překladových pamětí

Использования накопителей


Copyright Ing. Milan Čondák 17.09.2009