Využití překladových pamětí
 04  AR




Soubor ke stažení: cs_ar


Obsah

 

A.

أ.

Úvod - charakteristika základních souborů

-- مقدمة من مجموعات الخصائص الأساسية

B.

B.

Podrobnější charakteristika

مواصفات تفصيلية

C.

C.

Využití překladových pamětí (Translation Memory = TM)

باستخدام ذاكرة الترجمة ([تم = ذاكرة الترجمة)

D.Odkazy a ukázky

دال المراجع وعينات

A.

أ.

Úvod - charakteristika základních souborů

-- مقدمة من مجموعات الخصائص الأساسية

1.

1.

Bitext a tabulka v DOC (RTF)

Bitext طاولة في دوك (رتف)

1.1.

1.1.

Bitext obsahuje texty ve dvou jazycích.

Bitext يحتوي على نصوص في لغتين.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

الملف لا يحتوي على رموز اللغة ، وترميز بحيث يقرأ الناس كل لغات.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

فمن عادة ملف TXT التي يمكن من الترميز وطنية ل

a) DOS, Unix (Linux), Mac

أ) دوس ، يونيكس (لينكس) ، ماك

b) ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520)

ب) مقاييس (ويندوز) ، ومواقع لغات وطنية ومعادلاتها لهتم (وين التشيكية - 1250)

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

الجداول في دوك (رتف) وثيقة تحتوي على الرموز اللغوية من الحقول التي تحتوي على نص (المصدر واللغة المستهدفة).

c) UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

ج) حسابات الأمانة الأحادية - 8 يستخدم في معظم الأحيان ، لأن كلا من لغات هي حقوق للقراءة ، وهو يستخدم لتعيين ملفات (حسابات الأمانة الأحادية - 7 لا يستخدم في صناعة الترجمة) ، والملفات هي أصغر مما كانت عليه في حسابات الأمانة الأحادية - 16

d) Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

د) يونيكود (حسابات الأمانة الأحادية - 16) تستخدم مايكروسوفت وورد والبرامج (لجنة مناهضة التعذيب) ، والذي كان يعمل لعرض الملفات النصية ، فإنه قد تكون محلية أو قاعدة بيانات على شبكة الإنترنت ، برامج التحويل ، وما إلى ذلك.

e) Unicode Big Endian pro zobrazení východoasijského písma (CJK = čínština, japonština a korejština)

ه) يونيكود الكبير Endian لعرض الخطوط شرق آسيا (CJK = الصينية ، اليابانية ، والكورية)

1.2.

1.2.

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

الجداول في دوك (رتف) وثائق تحتوي على الرموز اللغوية والنصوص المخزنة في مقاييس

2.

2.

Glosář a obdobné soubory

معجم المصطلحات وملفات مشابهة

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

القاموس -- يحتوي على كلمة السر + + + + أشكال الكلمة أمثلة على استخدام الترجمات.

Bývá tříděn abecedně podle hesel.

يتم فرز أبجديا طبقا لنشرة.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

قاموس الترجمة -- يحتوي على التعبير الذي يتكون من واحد إلى خمس كلمات والترجمة ويتم تخزينها في قاعدة بيانات

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

مسرد -- يحتوي على كلمات من سنة إلى خمس كلمات والترجمة ويتم تخزينها في ملف نصي أو إكسلس] (الحد الأقصى من حقلين)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

مسرد -- معجما + حقول إضافية إلى الملاحظات والبيانات eventuáleně كما قد يكون من سمات ذاكرات الترجمة

3.

3.

Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

مجزأة الوثيقة Trados (شعبة أو رتف) ، لم يتم تنظيفها ورقة مطوية في مايكروسوفت وورد

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

عادة ما تطرح في سياق الترجمة في اتفاقية مناهضة التعذيب والأدوات ، والتي استخدم محرر نص مايكروسوفت وورد.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

أحيانا يكون التصدير التطبيقات التي تستخدم لترجمة نوع ملف آخر.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

يحتوي المستند على وحدة الترجمة ، أي زوج من الأحكام ، حيث الجملة الأولى هي في اللغة المصدر والجملة الثانية في اللغة المستهدفة وعلامات الانفصال والأرقام ، والذي يعبر عن النسبة المئوية للامتثال.

4.

4.

Překladová paměť

ذاكرة الترجمة

4.1.

4.1.

Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

لجنة مناهضة التعذيب استخدام كل الأدوات الخاصة بهم (اللغة الأم) نوع الملف.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

الترجمة الانكليزية الذاكرة ذاكرة الترجمة ، ودعا التأمل التجاوزي الاختصار.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

على الرغم من أن البيانات الواردة في ذاكرة الترجمة متشابهة ، شكل مختلف ، هياكل البيانات ، وأنواع الملفات.

Je to např.

كمثال

TXT, ESL, DBF, MDB, TBW, SQL.

نص ، إسل ، DBF ، MDB ، TBW ، مزود.

CAT s nimi pracuje jako s databázovým souborem.

كما تعمل مع لجنة مناهضة التعذيب ملف قاعدة بيانات.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

البيانات لا يمكن للمستخدم الأصلي أدوات ذاكرة الترجمة لجنة مناهضة التعذيب في تحريره ، إذا كانت البيانات الأخيرة في الصكوك وغيرها من الأدوات التي تمكنها من حفظ الملف تعديل.

4.2.

4.2.

Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

ذاكرة الترجمة بورصة TMX) هو ملف نصي مع TMX ، والتي يتم ترميز في أي حسابات الأمانة الأحادية - 8 أو يونيكود.

B.

B.

Podrobnější charakteristika

مواصفات تفصيلية

1.Bitext

1.Bitext

Bitext je možno vytvořit

Bitext يمكن أن تخلق

a) konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

أ) التحويل من عمودين من إكسلس] ورقة عمل أو أي ملف آخر ورقة البيانات

b) přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment"

ب) لإدارة البيانات على الجزء الاحالة (إسناد ذلك إلى الانكليزية "توفيق" وتعيين "المواءمة"

c) konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

ج) تحويل من جدول أو أنواع أخرى من الملفات التي فقدت وسمات الطابع الزمني

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

تحويل مثال : مرض التصلب العصبي المتعدد إكسل يمكن ملف "حفظ باسم" لاختيار الشكل المناسب ، في كلمة السيدة التحويل تتم عن طريق القائمة جدول ومن ثم لا يزال كما هو الحال في مرض التصلب العصبي المتعدد إكسل

2.Glosář

 

Elektronické překladové slovníky umožňují přidávání a export terminologie.

القواميس الإلكترونية تتيح الفرصة لإضافة الترجمة والمصطلحات للتصدير.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

القاموس يمكن أن تضاف زوج من معنى الفردية ويلاحظ الفرز.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

والكتاب من قواميس لتشفير محتويات قاعدة البيانات الخاصة به وليس تصدير البيانات.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

ويمكن القواميس التجارية لن تصدر إلا من المصطلحات المضافة.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

على سبيل المثال : المترجم الكمبيوتر يمكن أن تضاف إلى قاموس المعنى من مجرد زوج من رمز الحقل.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

فمن الممكن أن تضيف معنى مختلف الأزواج أو الملفات كلها ومن ثم حذف الشروط نفسها.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

يمكن تصدير المصطلحات الخاصة يمكن أرشفة والمستوردة إلى نسخة أحدث من البرنامج.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

يمكن موجز : معجم لجنة مناهضة التعذيب أن تكون الأدوات المستخدمة في التحويل من الأدوات لجنة مناهضة التعذيب وغيرها من المجمعين.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

لجنة مناهضة التعذيب أدوات يمكن الاتصال المصطلحات للمترجم أو غيرها من المصادر المتاحة علنا.

3.

3.

Segmentovaný dokument Trados

Trados الوثيقة مقطع

Dokument obsahuje neviditelná, viditelná a skrytá data.

تتضمن هذه الوثيقة غير مرئية ، مرئية ومخفية البيانات.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

يمكن أن البيانات يتم التحقق الخفية لحفظ الملف على النحو هتم وهتم لعرض الملف كملف نصي (مصدر هتم الملف).

Viditelná data obsahují přeložený text.

بيانات مرئي يحتوي على النص المترجم.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

البيانات المخفية يحتوي على النص المصدر ، وعلامات فاصل وبيانات فرعية مثل نسبة الامتثال مع ذاكرة الترجمة ، والذي تم استخدامه في مجال الترجمة.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

هذا الشكل هو المعيار ويستخدم فإنه باستثناء ما Trados Wordfast كلاسيك ، AnyMem.

Načítá jej a exportuje do něj MetaTexis.

يقرأها والصادرات إلى MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Wordfast تصدير إلى أي مكان وأدوات لجنة مناهضة التعذيب وغيرها من أدوات التحويل.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

يسمى. الوثيقة تنظيف (تنظيف) ، وثيقة يتم تنظيف من النص المصدر وجميع التسميات المساعدين ومحتويات الوثيقة يمكن أن تمتد إلى أدوات ذاكرة الترجمة الحالية وحدة لجنة مناهضة التعذيب.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

قد Trados مقطع ثيقة يمكن استخدامها لتحديث التأمل التجاوزي ، وذلك باستخدام مجموعة متنوعة من الأدوات لجنة مناهضة التعذيب.

4.

4.

Překladová paměť

ذاكرة الترجمة

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

كل الأدوات يمكن أن اتفاقية مناهضة التعذيب TMX الاستيراد والتصدير وبالتالي السماح لتبادل البيانات بين المستخدمين من الأدوات لجنة مناهضة التعذيب المختلفة.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

TMX هو الوسيلة الرئيسية لتبادل ™ ويمكن العمل معها ، وكذلك الأدوات التي لا تعمل في مايكروسوفت وورد ولا تعمل مع Trados الوثيقة مجزأة.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

أداة معينة بين الصكوك هو OmegaT اتفاقية مناهضة التعذيب.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

أداة مكتوب بلغة جافا ولها ثلاثة إصدارات (لأنظمة تشغيل مختلفة :

Windows, Linux a MacIntosh).

النوافذ ، لينكس وماكنتوش).

Je to open free software.

فهو مفتوح البرمجيات الحرة.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

تعمل وحدها أو مع فتح مكتب (ODT نوع الملف) وحيث أن ذاكرة الترجمة في TMX يستخدم حسابات الأمانة الأحادية - 8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

باستخدام ذاكرة الترجمة ([تم = ذاكرة الترجمة)

1.

1.

CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

لجنة مناهضة التعذيب أداة لحفظ الخرائط المواضيعيه عند ترجمة وحدة الترجمة مع جميع سمات الثانية

2.

2.

CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

لجنة مناهضة التعذيب أداة المقارنة (المباراة) مفتوحة المصدر الجزء من الوثيقة مترجمة ، جميع شرائح مصدر متصل التقنيات التربوية

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

لجنة مناهضة التعذيب أداة المقارنة (المباراة) مفتوحة المصدر الجزء من الوثيقة مترجمة ، جميع شرائح مصدر متصل التقنيات التربوية

Zde údaj match = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

هنا المعلومات = 90 مباراة ، ما يعني أن شريحة مماثلة إلى 90 ٪ مع أكثر شرائح مماثلة في ذاكرة الترجمة.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

للمقارنة ، والأكثر شيوعا Löwenstein الخوارزمية.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

لجنة مناهضة التعذيب عادة ما تظهر وحدة الترجمة مع الاجماع أعلى ، أو تلقائيا مكان بترجمة إلى الجزء المستهدف ، ويمكن أيضا أن نرى الاختلافات بين شرائح مصدر في وثيقة وذاكرة الترجمة.

3.

3.

Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

إذا شرائح (الجمل) لا يزيد على 10 عبارة غالبا ما قدمت 100 ٪ من إمدادات ™.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

يمكن الجمل طويلة (ربما من 50 إلى 200 كلمة) يمكن العثور عليها اذا كانت الوثيقة الجديدة تحتوي على الاقتباس من وثائق سابقة ، لا سيما القانونية واستكمال الأدلة ، كتيبات ، الخ.

4.

4.

Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

البحث concordance -- دليل مصطلحات البحث في العقوبات المفروضة على أزواج اللغات

5.

5.

Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

دليل المصطلحات التجديد في القواميس والمعاجم أو إصلاح تخزين المصطلحات.

6.

6.

Dolování terminologie z vět uložených v jazykových párech.

التعدين المصطلحات الأحكام الصادرة في أزواج اللغات.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

خاصة بتقييم البرامج الإحصائية وقوع الكلمات والعبارات في هذا الزوج اللغوي وتقدير الكيفية التي ينبغي أن تترجم الكلمات أو العبارات.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

وهذه التكنولوجيا وذلك باعتبارها الحرة مترجم جوجل ، والبيانات المستخدمة لتنفيذ الترجمة الآلية (طن متري = الترجمة الآلية).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

دفعت هناك أيضا خدمات الويب ، والتي الزبون الخرائط المواضيعيه vydolují الترجمة ، مما يجعل الترجمة التكنولوجيا مقارنة قطاعات بأكملها.

E.Odkazy a ukázky

E. وصلات وعينات

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

وwww.condak.net تقديم معلومات عن لجنة مناهضة التعذيب أدوات ومعلومات عن www.condak.cz مترجم أجهزة الكمبيوتر المكتبية أو غيرها من المجمعين.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

هذا الموقع سوف http://www.condak.net/osu/cs/00.html العروض من ورشة العمل هذه.

V Ostravě 17.9.2009

في اوسترافا 17.9.2009

Ing.

جي.

Milan Čondák

ميلانو Condak

Využití překladových pamětí

استخدام التقنيات التربوية


Copyright Ing. Milan Čondák 17.09.2009