602SQL-Úplná dokumentace Index  

Fulltextové konvertory

Fulltextové konvertory jsou externí programy či utility, které provádějí rozklad binárních dokumentů (např. DOC či XLS) na jednotlivá slova, která se následně indexují. Textové formáty (včetně HTML) konvertory nepotřebují.

Fulltextové konvertory se volí a nastavují příkazem Fulltextové konvertory, který je přístupný z Řídicího panelu, složky Lokální nastavení.

602SQL nabízí pro Windows i Linux dva typy konvertorů:

Externí utility

Externí utility není třeba více konfigurovat - po vybrání utility z nabídky pro jednotlivé formáty se vše ostatní děje automaticky. Tyto utility nejsou naším dílem a není pravděpodobné, že bychom je jakkoliv opravovali v případě nižší funkčnosti.

OpenOffice.org

Uživatelé vlastnící instalaci balíku OpenOffice.org verze 1.1 nebo 2.x mohou využít výkonnější a spolehlivější variantu konvertorů. Pro všechny formáty zvolí z nabídky volbu OpenOffice.org a poté zvolí jednu ze dvou možností:

  1. (lokální) OpenOffice.org běží "normálně", tj. spouští se každým požadavkem na zaindexování
  2. OpenOffice.org běží v režimu klient-server

Konfigurace při použití OpenOffice.org "normálně"

Uživatel zadá cestu k spouštěči OpenOfice.org, programu soffice.exe (pro Windows, obvykle c:\Program Files\OpenOffice.org 2.x\program\soffice.exe ) resp. soffice (Linux, zde se instalace výrazně liší v jednotlivých distribucích a verzích).

Dalším krokem je instalace OOo makra nazvaného ftx602.xba, které provádí extrakci slov. Je třeba provést následující kroky:

  1. Ukončit OOo i Quickstarter, pokud běží.
  2. Zkopírovat soubor ftx602.xba do adresáře OOO_HOME/share/basic/Tools, kde OOO_HOME je adresář, kam bylo OOo nainstalováno (tj. např. C:\Program Files\OpenOffice.org1.1.4\share\basic\Tools )
  3. Upravit obsah souboru OOO_HOME/share/basic/Tools/script.xlb v nějakém ASCII editoru tak, že se do XML tagu <library:library> ... </library:library> přidá nový XML tag <library:element library:name="ftx602"/>

Na Linuxu je toto nutno provádět jako root (resp. jako uživatel, který může modifikovat obsah adresáře OOO_HOME/share/basic/Tools.

Soubor ftx602.xba se nalézá na Windows v adresáři, kam bylo nainstalováno 602SQL, na Linuxu je v adresáři /usr/share/602sqlXX, kde XX je číslo verze.

Konfigurace při použití OpenOffice.org v režimu klient-server

V tomto případě je nutno zadat hostname a port, na kterém je spuštěn OpenOffice.org server, a podadresář program lokální instalace OOo (protože konvertor potřebuje ke svému běhu dll knihovny z OOo).

OOo musí být spuštěn jako server, např. takto:

soffice.exe "-accept=socket,host=localhost,port=8100;urp;"
kde localhost je IP adresa, na které má být server spuštěn, a 8100 je číslo portu (příklad), na kterém má server poslouchat. V Linuxu to je stejné, pouze se spustí binární soubor soffice.

Interně se používá konvertor ftx/ooo11cvt/ooo11cvt[.exe]. Ten se připojí k hostname a portu zadanému v konfiguraci, provede konverzi, odpojí se a skončí.

Konvertor funguje s OOo 1.1, nebo novější (stejný konvertor funguje i v OOo 2.0.0, resp. 2.0.1).

Interní uložení informací o konvetorech

Informace u fulltextových konvertorech je ve Windows uložena v registru v klíči HKEY_LOCAL_MACHINE\SOFTWARE\Software602\602SQL\Fulltext Helpers, na Linuxu v souboru /etc/602sql.