![]() |
![]() |
![]() |
![]() |
![]() |
| Využití překladových pamětí |
| 11 | IT | |
|---|---|---|
| Soubor ke stažení: | cs_it |
|
AObsah |
Contenuto |
|
A.Úvod - charakteristika základních souborů |
A. Introduzione - le caratteristiche di base dei file |
|
B.Podrobnější charakteristika |
B. Specifiche dettagliate |
|
C.Využití překladových pamětí (Translation Memory = TM) |
C. L'uso di memorie di traduzione (TM = Translation Memory) |
|
D.Odkazy a ukázky |
|
|
A. |
|
|
Úvod - charakteristika základních souborů |
Introduzione - caratteristiche del set di base |
|
1.Bitext a tabulka v DOC (RTF) |
1.Bitext una tabella nel DOC (RTF) |
|
1.1. |
|
|
Bitext obsahuje texty ve dvou jazycích. |
Bitext contiene testi nelle due lingue. |
|
Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné. |
File non contiene i codici di lingua, e codificati in modo che la gente legge entrambe le lingue. |
|
Jde nejčastěji o TXT soubor, který může mít národní kódování pro |
Di solito è un file TXT che può essere di codifica nazionale per |
|
a)DOS, Unix (Linux), Mac |
a) DOS, Unix (Linux), Mac |
|
b)ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520) |
b) ANSI (Windows), i siti delle lingue nazionali e dei loro equivalenti per HTM (Czech Win-1520) |
|
Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce). |
Le tabelle in formato DOC (RTF) documento contenente i codici lingua dei campi che contengono il testo (la lingua di origine e di destinazione). |
|
c)UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16 |
c) UTF-8 è usato più spesso, perché entrambe le lingue sono leggibile, è utilizzato per i file di mapping (UTF-7 non viene utilizzato nel settore delle traduzioni) e le file sono più piccoli rispetto a UTF-16 |
|
d)Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd. |
d) Unicode (UTF-16) utilizza MS Word e programmi (CAT), che lavora per visualizzare file di testo, può essere uno dei programmi locali o database web, conversione, ecc |
|
e)Unicode Big Endian pro zobrazení východoevropského písma (CJK = čínština, japonština a korejština) |
e) Unicode Big Endian Oriente per visualizzare i caratteri (CJK = cinese, giapponese e coreano) |
|
1.2. |
1.2. |
|
Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI |
Le tabelle in formato DOC (RTF), documenti che contengono i codici di lingua e dei testi sono archiviati in ANSI |
|
2.Glosář a obdobné soubory |
2.Glosář e simili file |
|
Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady. |
Dizionario - contiene la password + discorso + forme della parola + + esempi di uso di traduzioni. |
|
Bývá tříděn abecedně podle hesel. |
È in ordine alfabetico in base alle iscrizioni. |
|
Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi |
Dizionario di traduzione - contiene un'espressione che consiste di un massimo di cinque parole e la loro traduzione e sono memorizzate in un database |
|
Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole) |
Glossario - contiene le parole da uno a cinque parole e la loro traduzione, è memorizzato in un file di testo o XLS (massimo di due campi) |
|
Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí |
Glossario - un glossario + altri campi di osservazioni e dati eventuáleně come possono essere gli attributi delle memorie di traduzione |
|
3.Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu |
3. Segmentovaný Trados documento (DOC o RTF), non ripuliti carta piegato in MS Word |
|
Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word. |
Comunemente si pone nel corso di traduzione in strumenti CAT, che utilizza un editor di testo MS Word. |
|
Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru. |
A volte di esportazione le applicazioni che vengono utilizzati per convertire il tipo di file. |
|
Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody. |
Il documento contiene una unità di traduzione, vale a dire un paio di frasi, in cui la prima frase è nella lingua di partenza e la seconda frase nella lingua di destinazione, i marchi di separazione e numeri, che esprime la percentuale di conformità. |
|
4.Překladová paměť |
4.Překladová Memory |
|
4.1.Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru. |
4.1.Jednotlivé strumenti CAT uso proprio (nativa), tipo di file. |
|
Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM. |
English Translation Memory memoria di traduzione e ha chiamato la sigla TM. |
|
Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů. |
Tipi di file Sebbene i dati contenuti nella memoria di traduzione sono simili, diverso formato, struttura dei dati,. |
|
Je to např. |
|
|
TXT, ESL. |
TXT, ESL. |
|
DBF, MDB, TBW, SQL. |
DBF, MDB, TBW, SQL. |
|
CAT s nimi pracuje jako s databázovým souborem. |
CAT funziona con un file di database. |
|
Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit. |
I dati degli utenti non può nativo di memoria di traduzione strumenti CAT per modificare, se i dati sono visto in altri strumenti e gli strumenti per poter salvare il file modificato. |
|
4.2.Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode. |
Memoria 4.2.Translation Exchange (TMX) è un file di testo con TMX, che è codificato in UTF-8 o Unicode. |
|
B. |
B. |
|
Podrobnější charakteristika |
Specifiche dettagliate |
|
1.Bitext |
1.Bitext |
|
Bitext je možno vytvořit |
Bitext possono creare |
|
a)konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru |
a) la conversione di due colonne da un file xls foglio di lavoro o di qualsiasi altro foglio di foglio di calcolo |
|
b)přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment" |
b) l'assegnazione del segmento di gestione dei dati (assegnarlo a Inglese "align" e assegnare "allineamento" |
|
c)konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka |
c) la conversione da una tabella o di altri tipi di file, che ha perso gli attributi e ora |
|
Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu |
Esempio di conversione: MS Exel può file "Salva con nome" per selezionare il formato appropriato, in MS Word di conversione viene effettuata tramite il menu Tabella e poi continua, come in MS Exel |
|
2.Glosář |
2.Glosář |
|
Elektronické překladové slovníky umožňují přidávání a export terminologie. |
Dizionari di traduzione elettronica permette di aggiungere e la terminologia di esportazione. |
|
Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky. |
Il dizionario può essere aggiunto un paio di significato individuale e le note di ordinamento. |
|
Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat. |
Gli autori di dizionari per crittografare il contenuto del proprio database e non esportare i dati. |
|
Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii. |
I dizionari commerciali possono essere esportati solo con la terminologia aggiunto. |
|
Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru. |
Esempio: il traduttore PC può essere aggiunto al dizionario il significato di un semplice paio di campo codice. |
|
Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat. |
E 'possibile aggiungere coppie significato diverso o interi file e quindi eliminare gli stessi termini. |
|
Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru. |
Export terminologia propria possono essere archiviati e importati in una versione più recente del software. |
|
Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích. |
Sintesi: Glossario degli strumenti CAT possono essere utilizzati nella conversione di altri strumenti CAT e compilatori. |
|
Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů. |
Da strumenti CAT possibile collegare la terminologia del compilatore o altre fonti disponibili pubblicamente. |
|
3.Segmentovaný dokument Trados |
3.Segmentovaný Trados documento |
|
Dokument obsahuje neviditelná, viditelná a skrytá data. |
Documento contiene dati invisibili, visibili e nascosti. |
|
Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor). |
Invisible dati possono essere controllati per salvare il file HTM e HTM per vedere il file come file di testo (file di origine HTM). |
|
Viditelná data obsahují přeložený text. |
Dati visibili contiene il testo tradotto. |
|
Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu. |
Dati nascosti contiene il testo di origine, marchi di separazione e dati accessori, quali il rispetto percentuale con una memoria di traduzione, che è stata utilizzata in una traduzione. |
|
Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem. |
Questo formato è standard e lo utilizza ad eccezione di quanto Trados Wordfast Classic, AnyMem. |
|
Načítá jej a exportuje do něj MetaTexis. |
La legge e le esportazioni a MetaTexis. |
|
Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje. |
Export in Wordfast Anywhere e altri strumenti CAT e gli strumenti di conversione. |
|
Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje. |
I cosiddetti. Documento Cleanup (clean-up), il documento viene pulita dal testo di partenza e di tutte le etichette ausiliari e il contenuto del documento può essere esteso alle attuali unità di memoria di traduzione strumenti CAT. |
|
Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje. |
Trados documento segmentato può essere utilizzato per aggiornare il TM, utilizzando una varietà di strumenti CAT. |
|
4.Překladová paměť |
4.Překladová Memoria |
|
Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů. |
Ogni strumenti CAT possibile importare ed esportare TMX e permettere così lo scambio di dati tra utenti di diversi strumenti CAT. |
|
TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu. |
TMX è il principale veicolo per lo scambio di TM e può lavorare con essa così come gli strumenti che non funzionano in MS Word e non funzionano con documento Trados segmentato. |
|
Specifickým nástrojem mezi CAT nástroji je OmegaT. |
Specifico strumento tra gli strumenti è OmegaT CAT. |
|
Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy: |
Lo strumento è scritto in Java e dispone di tre versioni (per diversi sistemi operativi: |
|
Windows, Linux a MacIntosh). |
Windows, Linux e Macintosh). |
|
Je to open free software. |
E 'aperto il software libero. |
|
Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8. |
Lavora da solo o con Open Office (tipo di file ODT) e la loro memoria di traduzione in TMX usa UTF-8. |
|
C. |
C. |
|
Využití překladových pamětí (Translation Memory = TM) |
Utilizzare la memoria di traduzione (TM = Translation Memory) |
|
1.CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou |
1.CAT strumento in TM consente di risparmiare quando si traduce una unità di traduzione con tutti gli attributi del secondo |
|
2.CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí |
2.CAT strumento confronta il match () segmento open source del documento tradotto, tutti i segmenti sorgente collegata TM |
|
Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match). |
Si noti che l'inglese "match" - il confronto, il rispetto, ecc cechi spesso percepita come un conflitto solo conflittuale - partita (partita di calcio). |
|
Zde údaj mach = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti. |
Qui le informazioni Mach = 90, significa che il segmento è identico al 90% con il segmento più simile nella memoria di traduzione. |
|
Pro porovnávání se nejčastěji používá Löwensteinův algoritmus. |
Per confronto, l'algoritmo Löwenstein più comunemente utilizzati. |
|
CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti. |
CAT di solito appaiono unità di traduzione con il consenso più alto, o automaticamente luogo una traduzione nel segmento di destinazione e possono anche vedere le differenze tra i vari segmenti nel documento di origine e la memoria di traduzione. |
|
3.Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM. |
3.Qualora segmenti (frasi) non superiore a 10 parole sono spesso forniti di fornitura 100% di TM. |
|
Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod. |
Pene di lunga durata (forse 50 e 200 parole) può essere trovato se il nuovo documento contiene una citazione da precedenti documenti, in particolare del diritto, aggiornamento manuali, manuali, ecc |
|
4.Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech |
4.Konkordační di ricerca - la terminologia di ricerca manuale della pena inflitta in coppie di lingue |
|
5.Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie. |
Terminologia ricostituzione 5.Ruční nei dizionari e glossari o riparare la terminologia memorizzati. |
|
6.Dolování terminologie z vět uložených v jazykových párech. |
6.Dolování terminologia della pena inflitta in coppie di lingue. |
|
Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy. |
Speciale software statistico valuta la presenza di parole e frasi nella coppia di lingue e di stima come devono essere le parole o le frasi tradotte. |
|
Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT). |
Tale tecnologia è incluso come il programma gratuito Google Translate, i dati utilizzati per l'attuazione di una traduzione automatica (MT = Machine Translation). |
|
Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů. |
Ci sono anche pagati Web dei servizi, che TM del cliente traduzione vydolují, che mette a confronto la tecnologia di traduzione di interi segmenti. |
|
E.Odkazy a ukázky |
E. Links e campioni |
|
Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích. |
Il www.condak.net fornire informazioni sugli strumenti CAT e informazioni su desktop Translator www.condak.cz PC o altri compilatori. |
|
Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu. |
Il sito web sarà http://www.condak.net/osu/cs/00.html presentazioni da questo seminario. |
|
V Ostravě 17.9.2009 |
Ostrava 17.9.2009 |
|
Ing. |
Ing. |
|
Milan Čondák |
Milan Condak |
|
Využití překladových pamětí |
L'uso delle TM |