Vyhledávací systémy v Česku? Bída!

Na Interval.cz nejdou v této chvíli přidávat komentáře, tak to učiním alespoň zde. David Bureš napsal hezký článek Artefakty informační architektury – vyhledávací systémy. Opravdu pěkně shrnuje vyhledávání jako jednu z možností navigace.

Existují dvě běžné varianty vyhledávacích systémů. Jednodušší varianta poskytuje uživateli primitivní rozhraní pro zadání dotazu. Může použít běžný jazyk nebo speciální vyhledávací výrazy, jakou jsou booleovské operátory (AND, OR, NOT), popřípadě nástroj pro vytvoření dotazu. … Výsledky jsou pak zobrazeny v ideálním případě setříděné podle relevantnosti.

Složitější varianta je čím dál běžnější. V systému jsou vytvořeny záznamy obsahující metadata reprezentující dokumenty. Jak metadata, tak dokumenty mohou být uloženy v databázi nebo CMS. Dotazy jsou porovnávány s indexy vytvořenými nad těmito metadaty. Výsledky pak bývají mnohem přesnější.

Druhý způsob je „prý“ běžnější. Nevím kde, ale na českých serverech to nebude. Např. samotný Interval.cz nemá řádně propracovaný ani první způsob. Na dotaz „systémy vyhledávací“ nenajde žádnou položku. Na jiných serverech je situace obdobná.

Jako autor jednoho takového webu to velmi dobře chápu. Oříšek také nemá dobře propracované vyhledávání. Před časem jsem se snažil něco připraveného v krabici najít, ale byl jsem neúspěšný. Open-Source redakčních systémů je nepočitatelno, ale kvalitní vyhledávání… Dobře naprogramovat a řádně propracovat jen první popisovaný způsob vyhledávání je nesmírně složité a troufám si říci, že něco takového na českém webu najdeme jen těžko. Natož druhý způsob, jehož možnosti a pravidla David popisuje v článku. Něco takového ideálního se pomalu rovná napsání jednoduchého CMS.

Webmasteři webů ví, že fulltextové vyhledávání je nutnost. Ví, že dát uživatelům možnost napsat něco do bílého okénka je nezbytnost, ale dál se o to příliš nestarají. To je, bohužel, realita.

Jinak článek se mi líbil a mnoho z něj uplatním při realizaci jednoho projektu.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *