Česky   

   Doplňování terminologie do referenčního slovníku
 01  [Preklady] prevod glosaru do Lingea Lexiconu




Dobry den,
napadlo me, ze ruzne glosare z internetu (napriklad nedavno zminovany glosar ze stranek www.unmz.cz) by snad slo prevest do uzivatelskeho slovniku, ktery lze vytvorit v Lingea Lexiconu 2002.
Nejsem ale dostatecne technicky zdatny, tak prosim zkusenejsi kolegy o pomoc. Chtelo by to totiz vytvorit nejake makro, kterym by slo glosare z Excelu prevest na strukuru hesel v uzivatelskem slovnku (viz nize).

Uzivatelske slovniky jsou v souborech encz-usr.udr (AJ-CJ) a czen-usr.udr (CJ-AJ), ktere lze otevrit a upravovat v beznem textovem editoru.
Hesla v uzivatelskem slovniku maji nasledujici strukturu:

#heslo
preklad
(%poznamka)

Posledni radek je nepovinny, ale je vhodne ho pouzit napriklad pro informace o zdroji.
V pripade zminovaneho glosare z www.unmz.cz by heslo mohlo vypadat napr. takto:

#absence of spark
absence jiskry
(%zdroj: UNMZ)

Pak by v Lexiconu stacilo zadat "absence of spark" a naslo by se "absence jiskry" s poznamkou o zdroji.

V pripade zmineneho glosare vsak moje schopnosti konci u toho, ze jsem dokazal odstranit duplicitni radky (glosar se tak smrskl asi na polovinu).
Nyni by bylo potreba nejake makro, ktere by glosar upravilo nasledovne podle formatu vlastnich slovniku pro Lexicon:

1. pred heslo z prvniho sloupce by pridalo znak # (bez mezery) 2. heslo z druheho sloupce by dalo na druhy radek 3. na treti radek by pridalo poznamku (%zdroj: UNMZ) - tato poznamka by sla menit podle konkretniho glosare 4. za tyto tri radky by vlozilo prazdny radek 5. vytvorilo by dalsi heslo podle stejneho postupu

Vysledny obsah textoveho souboru by se pak zkopiroval do prislusneho souboru vlastniho slovniku encz-usr.udr nebo czen-usr.udr (bohuzel Lexicon ve vlastnich slovnicich nevyhledava fulltextove, takze by se musely vytvorit dve verze - jedna by se zkopirovala do AJ/CJ strany a druha do CJ-AJ strany, ale to uz by nebyl problem, stacilo by na zacatku prohodit sloupce glosare).


Tohle vsechno je je jen moje teorie, nevim napriklad, jestli Lexicon nema omezeni poctu hesel ve vlastnim slovniku.
Kdyz si ale predstavim, kolik podobnych glosaru by tak clovek mohl mit pohodlne pristupnych pres jedno slovnikove rozhrani, zni mi to dost prinosne.
Myslite, ze se mezi vami najde nekdo, kdo by to zvladl udelat?
Podrobnosti muzeme probrat i mimo diskusni skupinu a o vysledek se pak podelit s ostantimi.

Diky za jakekoli podnety,
Martin B.



Milan:

Dne 8. dubna 2007 jsem přidal stránky 8a a 8b a odkaz na Doplňování terminologie do překladového slovníku
 
  • Ondrej: Zdravim,
    spichnul jsem to jako takovou rychlovku pred spanim, ale v Lexiconu zda se vsechno funguje (az na vyrazne zpomaleny start).
    EN-CZ slovnik:
    http://download.yousendit.com/BF24B45E62C3B300

    (link vydrzi 7 dni, takze to klidne kdokoliv hodte nekam k sobe na server).
    Ondrej
  •  
  • Milan: A. Vicejazycny XLS jsem zpracoval 4x pro Wordfast:
    1. ulozil jako vicejazycny TXT v kodovani Unicode (aby byla dobře zobrazovana francouzstina)
    2. vytvoril glosar EN-CS ve stredoevropskem kodovani
    3. vytvoril glosar DE-CS ve stredoevropskem kodovani
    4. vytvoril glosar FR-CS v kodovani Unicode

    B. Referencni slovniky slouzi pouze k nahlizeni (text se da rucne oznacit a prenest do prekladaneho dokumentu), aktivne neprekladaji text.

    Do slovniku Lingea a dalsich referencnich slovniku terminologii nepridavam.

    Terminologii pridavam pouze do prekladovych slovniku, které spolupracuji s prekladacem (PC Translator, Systran, PARS aj.) a systém je indexuje pro rychle prohledavani a vyuziti.

    C. LINGEA:
    Nezkousel jsem pouzit soubor jako uzivatelsky slovnik s Lingeou.
    Soubor "Term_AN_fin.xls" obsahuje krome jednoslovnych a viceslovnych vyrazu a frazi (do 5 slov) také skoro cele vety. Ondrejuv soubor jem otevrel Exelem. Zdrojovy sloupec obsahuje maximalne 5-6 anglickych slov, zbytky textu jsou v dalsich sloupcich. Chyba je na strane autora zdrojoveho souboru.

    Odjizdim na hory, mozna vecer udelam malou prezentaci.

    Milan
  •  
  • Martin B.: Diky!
    Bohuzel, to zpomaleni Lexiconu pri startu je dost neprijemne, takze se to neda vyuzit pro pridavani vice glosaru (pokud by melo zpomaleni rust umerne velikosti vlastniho slovniku). Ale za pokus to stalo:-)
    Presto, muzete se podelit i o zpusob prevodu/makro, abychom si podobne glosare mohli vytvaret sami?

    Zrejme napisu do Lingei, zda by do nove verze (uz je na spadnuti) nepridali funkci importu dat, aby si clovek mohl sam importovat ruzne glosare primo v Lexiconu a zaroven to nemelo vliv na rychlost (spusteni) aplikace. Myslim, ze by to byla docela bomba!

    Jeste jednou diky,
    Martin
  •  
  • Jiny Martin: Promin, Martine, ze do toho stouram, ac uzivatel konkurencniho Milenia.
    Ale mne osobne prijde jednodussi uchovavat si glosare v nejakem systemu slozek, roztridene dle zakaznika, oboru, atd., a v pripade potreby vyuzit nejakou vyhledavaci utilitku, at uz Google Desktop, Wingrep, QuickSearch nebo neco jineho (Xbench). Ma to tu vyhodu, ze si vzdy vyberu relevantni glosare, ze pokud potrebuju normalni slovnik, nemusim natahovat spoustu balastu, a ze pokud se nektery glosar ukaze mizernou vetesi, muzu ho snadno smazat a ne rucne promazavat databazi.
    Jiny Martin

Copyright Ing. Milan Čondák 01.04.2007