|
databáze Czeng09
| |
V předchozí ukázce jste viděli APSIC Xbench verze 2.8 při
konverzi TXT exportu Tradosu do TMX.
Xbench byl použit i pro konverzi souboru Acquis 3.0. Vytvořený soubor acq3_cs_en.txt
o velikosti 634.577.280 bytů obsahuje 885.287 překladových jednotek, viz počet v záhlaví %TU=00885287.
Tentokrát bych mohl vytvořit TM devětkrát větší. Raději vytvořím 7 tématicky oddělených TM.
Jako zdroj použiji 100 bitextových EN-CS souborů. Data jsou v balících po deseti souborech.
Každý soubor má kolem 80.000 překladových jednotek.
Sto souborů jsem otevřel a upravil v MS Exelu 2007. Nyní je sloučím do 10 souborů a ukáži několik typů chyb:
- částečně se lišící segmenty
- zcela se lišící segmenty
- český text ve zdrojovém segmentu
- oba texty ve zdrojovém segmentu, cílový segment je prázdný
- cílové české texty bez diakritiky
- v cílovém segmentu je místo českého textu textu anglicky, slovensky apod.
|