Sloučení a kontrola TXT souborů
 01  Import dat do projektu






databáze Czeng09  

V předchozí ukázce jste viděli APSIC Xbench verze 2.8 při konverzi TXT exportu Tradosu do TMX.

Xbench byl použit i pro konverzi souboru Acquis 3.0. Vytvořený soubor acq3_cs_en.txt o velikosti 634.577.280 bytů obsahuje 885.287 překladových jednotek, viz počet v záhlaví %TU=00885287.

Tentokrát bych mohl vytvořit TM devětkrát větší. Raději vytvořím 7 tématicky oddělených TM. Jako zdroj použiji 100 bitextových EN-CS souborů. Data jsou v balících po deseti souborech. Každý soubor má kolem 80.000 překladových jednotek.

Sto souborů jsem otevřel a upravil v MS Exelu 2007. Nyní je sloučím do 10 souborů a ukáži několik typů chyb:

  • částečně se lišící segmenty
  • zcela se lišící segmenty
  • český text ve zdrojovém segmentu
  • oba texty ve zdrojovém segmentu, cílový segment je prázdný
  • cílové české texty bez diakritiky
  • v cílovém segmentu je místo českého textu textu anglicky, slovensky apod.




Budou načítány TXT soubory

a export bude opět do TXT souboru.
 

Copyright  14.06.2010 Ing. Milan Čondák  www.condak.cz