Využití překladových pamětí
 11  IT




Soubor ke stažení: cs_it


AObsah

Contenuto

A.Úvod - charakteristika základních souborů

A. Introduzione - le caratteristiche di base dei file

B.Podrobnější charakteristika

B. Specifiche dettagliate

C.Využití překladových pamětí (Translation Memory = TM)

C. L'uso di memorie di traduzione (TM = Translation Memory)

D.Odkazy a ukázky

 

A.

 

Úvod - charakteristika základních souborů

Introduzione - caratteristiche del set di base

1.Bitext a tabulka v DOC (RTF)

1.Bitext una tabella nel DOC (RTF)

1.1.

 

Bitext obsahuje texty ve dvou jazycích.

Bitext contiene testi nelle due lingue.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

File non contiene i codici di lingua, e codificati in modo che la gente legge entrambe le lingue.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

Di solito è un file TXT che può essere di codifica nazionale per

a)DOS, Unix (Linux), Mac

a) DOS, Unix (Linux), Mac

b)ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520)

b) ANSI (Windows), i siti delle lingue nazionali e dei loro equivalenti per HTM (Czech Win-1520)

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

Le tabelle in formato DOC (RTF) documento contenente i codici lingua dei campi che contengono il testo (la lingua di origine e di destinazione).

c)UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

c) UTF-8 è usato più spesso, perché entrambe le lingue sono leggibile, è utilizzato per i file di mapping (UTF-7 non viene utilizzato nel settore delle traduzioni) e le file sono più piccoli rispetto a UTF-16

d)Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

d) Unicode (UTF-16) utilizza MS Word e programmi (CAT), che lavora per visualizzare file di testo, può essere uno dei programmi locali o database web, conversione, ecc

e)Unicode Big Endian pro zobrazení východoevropského písma (CJK = čínština, japonština a korejština)

e) Unicode Big Endian Oriente per visualizzare i caratteri (CJK = cinese, giapponese e coreano)

1.2.

1.2.

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

Le tabelle in formato DOC (RTF), documenti che contengono i codici di lingua e dei testi sono archiviati in ANSI

2.Glosář a obdobné soubory

2.Glosář e simili file

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

Dizionario - contiene la password + discorso + forme della parola + + esempi di uso di traduzioni.

Bývá tříděn abecedně podle hesel.

È in ordine alfabetico in base alle iscrizioni.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

Dizionario di traduzione - contiene un'espressione che consiste di un massimo di cinque parole e la loro traduzione e sono memorizzate in un database

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

Glossario - contiene le parole da uno a cinque parole e la loro traduzione, è memorizzato in un file di testo o XLS (massimo di due campi)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

Glossario - un glossario + altri campi di osservazioni e dati eventuáleně come possono essere gli attributi delle memorie di traduzione

3.Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

3. Segmentovaný Trados documento (DOC o RTF), non ripuliti carta piegato in MS Word

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

Comunemente si pone nel corso di traduzione in strumenti CAT, che utilizza un editor di testo MS Word.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

A volte di esportazione le applicazioni che vengono utilizzati per convertire il tipo di file.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

Il documento contiene una unità di traduzione, vale a dire un paio di frasi, in cui la prima frase è nella lingua di partenza e la seconda frase nella lingua di destinazione, i marchi di separazione e numeri, che esprime la percentuale di conformità.

4.Překladová paměť

4.Překladová Memory

4.1.Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

4.1.Jednotlivé strumenti CAT uso proprio (nativa), tipo di file.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

English Translation Memory memoria di traduzione e ha chiamato la sigla TM.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

Tipi di file Sebbene i dati contenuti nella memoria di traduzione sono simili, diverso formato, struttura dei dati,.

Je to např.

 

TXT, ESL.

TXT, ESL.

DBF, MDB, TBW, SQL.

DBF, MDB, TBW, SQL.

CAT s nimi pracuje jako s databázovým souborem.

CAT funziona con un file di database.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

I dati degli utenti non può nativo di memoria di traduzione strumenti CAT per modificare, se i dati sono visto in altri strumenti e gli strumenti per poter salvare il file modificato.

4.2.Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

Memoria 4.2.Translation Exchange (TMX) è un file di testo con TMX, che è codificato in UTF-8 o Unicode.

B.

B.

Podrobnější charakteristika

Specifiche dettagliate

1.Bitext

1.Bitext

Bitext je možno vytvořit

Bitext possono creare

a)konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

a) la conversione di due colonne da un file xls foglio di lavoro o di qualsiasi altro foglio di foglio di calcolo

b)přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment"

b) l'assegnazione del segmento di gestione dei dati (assegnarlo a Inglese "align" e assegnare "allineamento"

c)konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

c) la conversione da una tabella o di altri tipi di file, che ha perso gli attributi e ora

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

Esempio di conversione: MS Exel può file "Salva con nome" per selezionare il formato appropriato, in MS Word di conversione viene effettuata tramite il menu Tabella e poi continua, come in MS Exel

2.Glosář

2.Glosář

Elektronické překladové slovníky umožňují přidávání a export terminologie.

Dizionari di traduzione elettronica permette di aggiungere e la terminologia di esportazione.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

Il dizionario può essere aggiunto un paio di significato individuale e le note di ordinamento.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

Gli autori di dizionari per crittografare il contenuto del proprio database e non esportare i dati.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

I dizionari commerciali possono essere esportati solo con la terminologia aggiunto.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

Esempio: il traduttore PC può essere aggiunto al dizionario il significato di un semplice paio di campo codice.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

E 'possibile aggiungere coppie significato diverso o interi file e quindi eliminare gli stessi termini.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

Export terminologia propria possono essere archiviati e importati in una versione più recente del software.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

Sintesi: Glossario degli strumenti CAT possono essere utilizzati nella conversione di altri strumenti CAT e compilatori.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

Da strumenti CAT possibile collegare la terminologia del compilatore o altre fonti disponibili pubblicamente.

3.Segmentovaný dokument Trados

3.Segmentovaný Trados documento

Dokument obsahuje neviditelná, viditelná a skrytá data.

Documento contiene dati invisibili, visibili e nascosti.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

Invisible dati possono essere controllati per salvare il file HTM e HTM per vedere il file come file di testo (file di origine HTM).

Viditelná data obsahují přeložený text.

Dati visibili contiene il testo tradotto.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

Dati nascosti contiene il testo di origine, marchi di separazione e dati accessori, quali il rispetto percentuale con una memoria di traduzione, che è stata utilizzata in una traduzione.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

Questo formato è standard e lo utilizza ad eccezione di quanto Trados Wordfast Classic, AnyMem.

Načítá jej a exportuje do něj MetaTexis.

La legge e le esportazioni a MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Export in Wordfast Anywhere e altri strumenti CAT e gli strumenti di conversione.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

I cosiddetti. Documento Cleanup (clean-up), il documento viene pulita dal testo di partenza e di tutte le etichette ausiliari e il contenuto del documento può essere esteso alle attuali unità di memoria di traduzione strumenti CAT.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

Trados documento segmentato può essere utilizzato per aggiornare il TM, utilizzando una varietà di strumenti CAT.

4.Překladová paměť

4.Překladová Memoria

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

Ogni strumenti CAT possibile importare ed esportare TMX e permettere così lo scambio di dati tra utenti di diversi strumenti CAT.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

TMX è il principale veicolo per lo scambio di TM e può lavorare con essa così come gli strumenti che non funzionano in MS Word e non funzionano con documento Trados segmentato.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

Specifico strumento tra gli strumenti è OmegaT CAT.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

Lo strumento è scritto in Java e dispone di tre versioni (per diversi sistemi operativi:

Windows, Linux a MacIntosh).

Windows, Linux e Macintosh).

Je to open free software.

E 'aperto il software libero.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

Lavora da solo o con Open Office (tipo di file ODT) e la loro memoria di traduzione in TMX usa UTF-8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Utilizzare la memoria di traduzione (TM = Translation Memory)

1.CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

1.CAT strumento in TM consente di risparmiare quando si traduce una unità di traduzione con tutti gli attributi del secondo

2.CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

2.CAT strumento confronta il match () segmento open source del documento tradotto, tutti i segmenti sorgente collegata TM

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

Si noti che l'inglese "match" - il confronto, il rispetto, ecc cechi spesso percepita come un conflitto solo conflittuale - partita (partita di calcio).

Zde údaj mach = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

Qui le informazioni Mach = 90, significa che il segmento è identico al 90% con il segmento più simile nella memoria di traduzione.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

Per confronto, l'algoritmo Löwenstein più comunemente utilizzati.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

CAT di solito appaiono unità di traduzione con il consenso più alto, o automaticamente luogo una traduzione nel segmento di destinazione e possono anche vedere le differenze tra i vari segmenti nel documento di origine e la memoria di traduzione.

3.Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

3.Qualora segmenti (frasi) non superiore a 10 parole sono spesso forniti di fornitura 100% di TM.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

Pene di lunga durata (forse 50 e 200 parole) può essere trovato se il nuovo documento contiene una citazione da precedenti documenti, in particolare del diritto, aggiornamento manuali, manuali, ecc

4.Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

4.Konkordační di ricerca - la terminologia di ricerca manuale della pena inflitta in coppie di lingue

5.Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

Terminologia ricostituzione 5.Ruční nei dizionari e glossari o riparare la terminologia memorizzati.

6.Dolování terminologie z vět uložených v jazykových párech.

6.Dolování terminologia della pena inflitta in coppie di lingue.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

Speciale software statistico valuta la presenza di parole e frasi nella coppia di lingue e di stima come devono essere le parole o le frasi tradotte.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

Tale tecnologia è incluso come il programma gratuito Google Translate, i dati utilizzati per l'attuazione di una traduzione automatica (MT = Machine Translation).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

Ci sono anche pagati Web dei servizi, che TM del cliente traduzione vydolují, che mette a confronto la tecnologia di traduzione di interi segmenti.

E.Odkazy a ukázky

E. Links e campioni

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

Il www.condak.net fornire informazioni sugli strumenti CAT e informazioni su desktop Translator www.condak.cz PC o altri compilatori.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

Il sito web sarà http://www.condak.net/osu/cs/00.html presentazioni da questo seminario.

V Ostravě 17.9.2009

Ostrava 17.9.2009

Ing.

Ing.

Milan Čondák

Milan Condak

Využití překladových pamětí

L'uso delle TM


Copyright Ing. Milan Čondák 17.09.2009