Využití překladových pamětí
 15  PL




Soubor ke stažení: cs_pl


Obsah

Treść

A.Úvod - charakteristika základních souborů

A. Wstęp - podstawowe cechy plików

B.Podrobnější charakteristika

B. Szczegółowe specyfikacje

C.Využití překladových pamětí (Translation Memory = TM)

C. Zastosowanie pamięci tłumaczeniowej (TM = Translation Memory)

D.Odkazy a ukázky

D. Odniesienia i próbki

A.

A.

Úvod - charakteristika základních souborů

Wstęp - charakterystyka podstawowych zestawów

1.Bitext a tabulka v DOC (RTF)

1.Bitext i tabeli DOC (RTF)

1.1.

1,1

Bitext obsahuje texty ve dvou jazycích.

Bitext zawiera teksty w dwóch językach.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

Plik nie zawiera kody języka, a kodowane tak, że ludzie czytają w obu językach.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

Jest to zwykle plik TXT, które mogą być krajowych kodujący

a)DOS, Unix (Linux), Mac

a) DOS, Unix (Linux), Mac

b)ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520)

b) ANSI (Windows), strony z języków narodowych i ich ekwiwalenty na HTM (Czechy Win-1520)

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

Tabele w formacie DOC (RTF) dokument zawierający kod języka pola zawierające tekst (język źródłowy i docelowy).

c)UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

c) UTF-8 jest używane najczęściej, ponieważ oba języki są czytelne dla człowieka, jest używany przez pliki mapowania (UTF-7 nie jest stosowany w przemyśle tłumaczenia) oraz pliki są mniejsze niż w UTF-16

d)Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

d) Unicode (UTF-16) używa MS Word i programy (CAT), które działa do wyświetlania plików tekstowych, może to być lokalne lub internetowej bazy danych, programy wymiany, itp.

e)Unicode Big Endian pro zobrazení východoevropského písma (CJK = čínština, japonština a korejština)

e) Unicode Big Endian Wschód, aby wyświetlić czcionek (CJK = chiński, japoński, koreański i)

1.2.

1.2.

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

Tabele w formacie DOC (RTF) dokumenty zawierają kody językowe i teksty są przechowywane w ANSI

2.Glosář a obdobné soubory

2.Glosariusz i podobne pliki

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

Słownik - zawiera hasła + mowy + formy wyrazu + + przykłady wykorzystania tłumaczenia.

Bývá tříděn abecedně podle hesel.

Jest sortowana alfabetycznie według wpisów.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

Tłumaczenie stron - zawiera wyrażenie, które składa się z jednego do pięciu słów i ich tłumaczenia i są przechowywane w bazie danych

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

Słownik - zawiera słowa od jednego do pięciu słów i ich tłumaczenia i jest przechowywany w pliku tekstowym lub XLS (maksymalnie dwa pola)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

Słownik - słownik + dodatkowe pola do obserwacji i danych eventuáleně, które mogą być atrybuty pamięci tłumaczeniowych

3.Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

Trados 3.Segmentovaný dokumentów (DOC lub RTF), nieoczyszczonych papier owinięty w MS Word

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

Często pojawia się w trakcie tłumaczenia w narzędzia CAT, których należy użyć edytora tekstu MS Word.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

Czasami eksportu aplikacji, które są używane do tłumaczenia innych typów plików.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

Dokument zawiera jednostkę, czyli parę zdań, w którym pierwsze zdanie w języku źródłowym i drugie zdanie w języku docelowym, znaki separacji i numery, które wyraża procent zgodności.

4.Překladová paměť

4.Pamięc tłumaczeniowa

4.1.Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

4.1.Jednotlivé narzędzi CAT używają własnych (native) typ pliku.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

Angielski Baza tłumaczeń pisemnych i pamięci o nazwie TM skrót.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

Mimo że dane zawarte w pamięci tłumaczenia są podobne, inny format, struktura danych, typów plików.

Je to např.

Jako przykład

TXT, ESL.

TXT, ESL.

DBF, MDB, TBW, SQL.

DBF, MDB, TBW, SQL.

CAT s nimi pracuje jako s databázovým souborem.

CAT działa w postaci pliku bazy danych.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

Dane użytkownika nie mogą native tłumaczenie narzędzi CAT pamięci edytować, jeśli dane są u innych narzędzi i instrumentów w celu umożliwienia mu zapisać zmodyfikowany plik.

4.2.Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

4.2.Translation Memory Exchange (TMX) jest plik tekstowy z TMX, która jest zakodowana w każdym UTF-8 lub Unicode.

B.

B.

Podrobnější charakteristika

Szczegółowe specyfikacje

1.Bitext

1.Bitext

Bitext je možno vytvořit

Bitext mogą tworzyć

a)konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

a) konwersji dwóch kolumn z arkusza xls plik lub innego arkusza kalkulacyjnego

b)přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment"

b) zarządzanie Dane przypisanie segmentu (przypisać je do angielskiego "align" i przypisać "wyrównanie"

c)konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

c) konwersja z tabeli lub inne typy plików, które straciły cechy i znacznikiem czasu

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

Przykład konwersji: MS Exel może złożyć "Zapisz jako", aby wybrać odpowiedni format, w programie MS Word konwersji odbywa się poprzez menu Tabela, a następnie biegnie jak MS Exel

2.Glosář

2.Glosariusz

Elektronické překladové slovníky umožňují přidávání a export terminologie.

Słowniki elektroniczne tłumaczenie pozwala na dodawanie i eksport terminologii.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

Słownika można dodać parę indywidualne znaczenie i zauważa, sortowanie.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

Autorzy słowników do szyfrowania zawartości tej bazy danych i nie eksportować dane.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

Komercyjnych słowników mogą być wywożone tylko dodał terminologii.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

Przykład: PC Translator można dodać do słownika znaczenie niż tylko parę pole kodu.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

Możliwe jest dodawać różne pary znaczenia lub całe pliki, a następnie usunąć tych samych warunkach.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

Eksport własną terminologię mogą być archiwizowane i przywożonych do nowszej wersji oprogramowania.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

Podsumowanie: Słownik narzędzi CAT może być stosowany w przekształcaniu innych narzędzi CAT i kompilatory.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

Narzędziami CAT można połączyć terminologii kompilator lub innych źródeł publicznie dostępnych.

3.Segmentovaný dokument Trados

3.Segmentowany Trados dokument

Dokument obsahuje neviditelná, viditelná a skrytá data.

Dokument zawiera niewidzialne, widoczne i ukryte dane.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

Invisible dane mogą być sprawdzone, aby zapisać plik HTM i HTM, aby wyświetlić plik jako plik tekstowy (źródło htm).

Viditelná data obsahují přeložený text.

Widoczne zawiera przetłumaczony tekst.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

Ukryte dane zawiera tekst źródłowy, znaki separatora oraz dodatkowych danych, takich jak procent zgodności z pamięci tłumaczeniowej, który był używany w tłumaczeniu.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

Ten format jest standardowy i korzysta z niego, z wyjątkiem Trados Wordfast Classic, AnyMem.

Načítá jej a exportuje do něj MetaTexis.

Czyta go i eksportu do programu MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Eksport do Wordfast Anywhere i innych narzędzi CAT i narzędzi do konwersji.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

Tzw. Dokument Czyszczenie (sprzątanie), dokument jest czyszczone z tekstu źródłowego i wszystkie etykiety pomocniczych i zawartość dokumentu może być przedłużony do obecnych narzędzi do tłumaczenia CAT pamięci urządzenia.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

Segmenty Trados dokumentu nie może być wykorzystywana do aktualizacji TM, przy wykorzystaniu różnorodnych narzędzi CAT.

4.Překladová paměť

4.Pamięc tłumaczeniowa

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

Każdy narzędzi CAT potrafi importować i eksportować TMX i tym samym umożliwić wymianę danych między użytkownikami różnych narzędzi CAT.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

TMX jest głównym narzędziem wymiany TM i może z nim pracować, a także narzędzia, które nie działają w programie MS Word i nie współpracuje z Trados segmentacji dokumentu.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

Specjalnym instrumentem wśród CAT instrumentów jest OmegaT.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

Narzędzie to jest napisane w języku Java i ma trzy wersje (dla różnych systemów operacyjnych:

Windows, Linux a MacIntosh).

Windows, Linux i Macintosh).

Je to open free software.

Jest otwarta wolnego oprogramowania.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

Pracuje samodzielnie lub z Open Office (typ pliku ODT), jak i pamięć o nich tłumaczenie na TMX używa UTF-8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Korzystanie z pamięci tłumaczeniowych (TM = Translation Memory)

1.CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

1.CAT narzędzie do TM zapisuje podczas tłumaczenia jednostkę ze wszystkich atrybutów sekund

2.CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

2.CAT narzędzie porównuje (match) otwarty segment źródłowy przetłumaczonych dokumentów, wszystkich segmentach źródłowych związanych TM

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

Należy pamiętać, że angielski "match" - porównanie zgodności, itp. Czesi często postrzegana jako konflikt tylko konfrontacyjne - mecz (mecz piłki nożnej).

Zde údaj mach = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

Oto informacje match = 90 oznacza, że segment jest identyczna w 90% z najbardziej podobnych segmentów w pamięci tłumaczeń.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

Dla porównania, najczęściej używane algorytm Löwensteina.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

CAT pojawiają się zwykle w jednostkę o największym konsensusu, albo automatycznie miejsce tłumaczenia segmentu docelowego, a także może zobaczyć różnice między segmentami w dokumencie źródłowym i pamięci tłumaczeń.

3.Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

3.Jeżeli segmenty (zdania) nie ?? więcej niż 10 słów się często 100% dostaw TM.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

Długie zdania (chyba od 50 do 200 słów) można znaleźć, jeśli nowy dokument zawiera cytat z wcześniejszych dokumentach, w szczególności prawnego, aktualizacji podręczniki, instrukcje obsługi, itp.

4.Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

4.Konkordační wyszukiwania - podręcznik terminologii wyszukiwania kar nałożonych w par językowych

5.Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

5.Ruční terminologii uzupełnianie w słownikach i glosariusze lub naprawy przechowywane terminologii.

6.Dolování terminologie z vět uložených v jazykových párech.

6.Dolování terminologii kar nałożonych w par językowych.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

Specjalne oprogramowanie statystycznych ocenia wystąpienia słów i zwrotów w parze językowej i oszacować, jak powinny być one słowa lub wyrażenia przetłumaczone.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

Taka technologia jest ujęte jako wolna Google Translate, dane wykorzystane do wykonania tłumaczenia maszynowego (MT = tłumaczenia maszynowego).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

Istnieją również zwrócić usług sieci Web, która klienta TM tłumaczenia vydolují, co sprawia, że porównanie technologii tłumaczenia całe segmenty.

E.Odkazy a ukázky

E. Linki i próbek

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

Www.condak.net dostarczenie informacji na temat narzędzi CAT i informacje o www.condak.cz Tłumacz pulpit komputera lub innych kompilatorów.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

Strona internetowa będzie http://www.condak.net/osu/cs/00.html prezentacje z tego warsztatu.

V Ostravě 17.9.2009

W Ostrawie 17.9.2009

Ing.

Inż.

Milan Čondák

Milan Condak

Využití překladových pamětí

Używać baz


Copyright Ing. Milan Čondák 17.09.2009