Elektronický lexikón slovenského jazyka

Heslové slová Vyhľadávanie v plných textoch Vysvetlivky   (c)  

Vysvetlivky

Úvod
Zásady spracovania slovníka
Schéma stavby hesla
Zoznam skratiek
Vyhľadávanie v plných textoch

Vyhľadávanie v plných textoch - fulltextové vyhľadávanie

Vyhľadávanie v plných textoch (fulltextové vyhľadávanie) je založené na lingvistickom vyhľadávacom systéme Morfix, ktorý na zlepšenie vyhľadávania využíva jazykové moduky ako lematizátor, slovník synomým a modul Fuzzy.

Vyhľadávať môžete jednotlivé slová, slovné spojenia a výrazy. Maximálna dĺžka slova je 63 znakov. Maximálna dĺžka slovného spojenia je 1 023 znakov. Pri vyhľadávaní sa nájdu všetky výskyty bez ohľadu na to, či hľadané slová obsahujú malé alebo veľké písmená.
 

Vyhľadávanie viacslovných výrazov

Vyhľadávací systém Morfix je schopný vyhľadávať aj frázy a viacslovné požiadavky s rôznym vzťahom jednotlivých slov v požiadavke. Spôsob interpretovania jednotlivých slov v požiadavke určuje roletové menu pod požiadavkou na vyhľadávanie.

Všetky požadované slová
Nájde len tie heslá, v ktorých sa nachádzajú všetky zadané slová (logický operátor AND). Jednotlivé hľadané slová môžu byť ľubovoľne rozptýlené po strane. Ak chcete nájsť slová, ktoré sú blízko pri sebe, použite voľby „všetky slová so zadanou vzdialenosťou“.

Ľubovoľné z požadovaných slov
Nájde všetky heslá, v ktorých sa nachádza ktorékoľvek zo zadaných slov (logický operátor OR).

Prvé slovo, ale nie ostatné
Nájde všetky heslá, v ktorých sa nachádza prvé slovo ale nenachádza ktorékoľvek z ďalších slov  (logický operátor NOT).

Presné slovné spojenie
Nájde všetky heslá, v ktorých sa nachádza presná fráza (logický operátor NEXT).

Všetky slová so zadanou vzdialenosťou
Nájde len tie heslá, v ktorých sa nachádzajú všetky zadané slová, pričom vzdialenosť týchto slov v texte nie je väčšia ako určuje hodnota v poli „max“ (logický operátor NEAR). Vzájomné poradie hľadaných slov v texte nie je podstatné. Parameter„ max“ môže nadobúdať hodnoty z intervalu 1 až 15.

Zložený výraz
Pomocou logických operátorov, ktoré sú definované v popise predchádzajúcich volieb,  je možné formulovať aj zložité požiadavky (výrazy), pričom je možné použiť ľubovoľnú kombináciu operátorov, ako aj určiť spôsob (postupnosť) ich vyhodnocovania.
Medzi jednotlivé hľadané slová alebo frázy požiadavky na vyhľadávanie je potrebné vždy napísať požadovaný operátor (niektorý z operátorov „AND“, „OR“, „NOT“ a „NEAR“). Operátor „NEXT“ (fráza) sa definuje vložením dvojitých úvodzoviek () na začiatok a koniec frázy.
Operátory sú vyhodnocované postupne zľava doprava. Tento spôsob vyhodnocovania je možné zmeniť použitím okrúhlych zátvoriek. Je možné vytvárať aj výrazy s vnorenými zátvorkami až do 4. úrovne vnorenia.

PRÍKLADY:

Hľadaný výraz Výsledok
deti AND otec OR matka všetky heslá, v ktorých sa zároveň nachádzajú slová deti a otec, alebo sa v nich nachádza slovo matka
deti AND (otec OR matka) budú nájdené všetky heslá, na ktorých sa zároveň nachádza slovo deti a zároveň aspoň jedno zo slov otec alebo matka
deti OR ((otec AND matka) NOT vnúča) všetky heslá, v ktorých sa nachádza slovo deti, alebo heslá v ktorých sa súčasne nachádzajú slová otec a matka a slovo vnúča sa v hesle nevyskytuje
"starý otec" AND "stará mama" všetky heslá, v ktorých sa zároveň nachádzajú spojenia (frázy) starý otec a stará mama


Lingvistické možnosti

Ďalšia skupina volieb určuje jazykovo závislé nastavenia. V prípade, že nie je žiadna z volieb nastavená, bude sa vyhľadávať s pomocou lematizátora slovenského jazyka. Slová v požiadavke na vyhľadávanie je možné zadať v akomkoľvek tvare (ohybe) a nájdené budú všetku gramatické tvary týchto slov.
 

VYHĽADAŤ LEN PRESNÝ TVAR SLOVA
Vyhľadané len tie výskyty, v ktorých existujú slová presne v tvare zadanom v požiadavke na vyhľadávanie. Pri tomto vyhľadávaní je vylúčený lematizátor.

SYNONYMÁ
Vyhľadané budú nielen všetky výskyty hľadaných slov, ale aj všetky výskyty ich synoným, t.j. slov s rovnakým alebo podobným významom. Voľba je účinná iba v prípade, ak nie je nastavená voľba „Vyhľadať len presný tvar slova“.

TEXTOVÉ NEPRESNOSTI
Táto voľba umožňuje nájsť slová, ktoré majú chybu v diakritike – mäkčene a dĺžne, resp. sa slová vyhľadajú bez ohľadu na diakritiku písmen, alebo majú chybu v jednom písmene – chybné písmeno, jedno písmeno chýba alebo je navyše.

UPOZORNENIE: Pri použití tejto voľby nie je možné využívať možnosti lingvistického vyhľadávania za pomoci lematizátora a slovníka synoným.
 

Zástupné znaky

Zástupnými znakmi môžeme nahradiť jeden alebo viac znakov v hľadanom slove.

 ?  – nahrádza práve jeden znak
 *  – nahrádza viac znakov (žiaden alebo viac)

Tieto znaky sa najčastejšie používajú v prípade, že neviete, ako sa hľadané slovo presne píše alebo chcete nájsť všetky tvary slova, ktoré je cudzie alebo ho lematizátor nevie identifikovať, napr. mená alebo názvy.

PRÍKLAD:
Londýn* nájde Londýn, Londýne, Londýnom, Londýnu, Londýnčan,...

UPOZORNENIE: Použitím zástupných znakov v slove sa rušia všetky ostatné lingvistické voľby pre toto slovo. Zástupné znaky nesmú byť použité ako prvý znak v hľadanom slove.
 

Slová vylúčené z vyhľadávania

Je to zoznam slov, ktoré neboli počas indexovania zaradené do indexového súboru, a teda ich nie je možné ani vyhľadávať. Takýmito slovami sú napr. spojky, predložky, častice, zámená, ... alebo slová, ktoré sa príliš často vyskytujú v texte a ich vyhľadávanie nemá význam. Z vyhľadávania sú automaticky vylúčené aj všetky jednoznakové slová.

UPOZORNENIE: Pri vyhľadávaní presných slovných spojení (fráz), v ktorých sa nachádza slovo, ktoré je vylúčené z vyhľadávania, je nutné v požiadavke na vyhľadávanie zadať aj toto slovo. V prípade, že sa nachádza na začiatku alebo na konci, bude toto slovo ignorované a požiadavka sa vyhodnotí tak, ako keby nebolo zadané. Vo výrazoch sú takéto slová ignorované úplne.