Přiřazovač vět - LF Aligner
 04  Přiřazení webových souborů




Typy souborů

 

jsou uvedeny na straně 01. Nejvíce problémů je se zdrojem "w" = webové stránky. Základní informace najdete v aktuálním souboru README, zde pasáž z verze 2.53.




Příklad 2 článků o Vojtěchovi Náprstkovi

  • 4750 je anglicky (pouze výtah)
  • 4749 je česky
  • Články mají různou délku, kolem vlastního textu je menu v češtině.

     

    http://www.cesky-dialog.net/clanek.php?idcl=4750&aidci=    

    http://www.cesky-dialog.net/clanek.php?idcl=4749&aidci=    




    Více prezentací   Testoval jsem všechny vyjmenované zdroje souborů a několik různých URL. Přidám ještě samostatné prezentace.



    Příklad zdrojů:

    Wikisource

      http://en.wikisource.org/wiki/Wikisource:What_is_Wikisource%3F

    http://cs.wikisource.org/wiki/Wikizdroje:Co_jsou_Wikizdroje

    http://de.wikisource.org/wiki/Wikisource:%C3%9Cber_Wikisource

    http://fr.wikisource.org/wiki/Wikisource:%C3%80_propos

    http://fi.wikisource.org/wiki/Wikiaineisto:Mik%C3%A4_on_Wikiaineisto%3F



    Soubory mají různé názvy.

    Nestahovat pomocí LF Aligneru.

      Pokud mají soubory na webu samostatné složky pro každý jazyk, ale soubory mají různé názvy (například odpovídají jazyku, ve kterém je text), je vhodné soubory stáhnout a případně shodně přejmovat; extrahovat text zvlášť pro každý jazyk do jednoho TXT; potom udělat přiřazení. Korektura přiřazení byla provedeno pomocí PlusTools. TMX byla vytvořena následně po vytvoření TM Wordfastu.



    Copyright Ing. Milan Čondák 28.06.2011