Jeronýmovy dny 2011
 10  Lexterm




Lexikální extrahovač   Extrahovat text pouze ze zdrojového textu je možno celou řadou nástrojů, například i pomocí PlusTools, AntConc.

Lexterm umožňuje extrahovat terminologii i z bitextu, tj. dvojjazyčného souboru.




Soubor stop-eng.txt obsahuje anglická "zastavovací slova", tj. úvodní a koncová slova extrahované fráze, které chceme z fráze vyloučit.

stop-cze.txt a jiné si můžeme sami vytvořit

 



Informace o programu  



Frekvence výskytu a extrahovaný víceslovní výraz

(na obrázku je pouze výsledek extrakce ze zdrojového textu)

 



 

Tři ukázky

Extrakce polsko-české terminologie

a její využití v jazykových nástrojích.



Copyright Ing. Milan Čondák 10.08.2011