Jeronýmovy dny 2011
 10  Lexterm
Lexikální extrahovač   Extrahovat text pouze ze zdrojového textu je možno celou řadou nástrojů, například i pomocí PlusTools, AntConc.

Lexterm umožňuje extrahovat terminologii i z bitextu, tj. dvojjazyčného souboru.
Soubor stop-eng.txt obsahuje anglická "zastavovací slova", tj. úvodní a koncová slova extrahované fráze, které chceme z fráze vyloučit.

stop-cze.txt a jiné si můžeme sami vytvořit

 Informace o programu  Frekvence výskytu a extrahovaný víceslovní výraz

(na obrázku je pouze výsledek extrakce ze zdrojového textu)

  

Tři ukázky

Extrakce polsko-české terminologie

a její využití v jazykových nástrojích.Copyright Ing. Milan Čondák 10.08.2011