V prvním díle jsme si představili knihovnu Lucene a vysvětlili jsme si, jakou nabízí „out-of-the-box“ podporu fulltextového vyhledávání pro češtinu. Ve druhém díle budeme pokračovat a ukážeme si hunspell token filter. Praktickou část opět demonstrujeme s použitím Elasticsearch.
Archiv pro štítek: Lucene
Dobré fulltextové vyhledávání pro češtinu nemusí nutně znamenat investici do proprietárních knihoven a slovníků. Nevěříte? Zkusím vás přesvědčit! Ukážeme si, jak nakonfigurovat Elasticsearch pro fulltextové vyhledávání v českých textech.
Sphinx Search je fulltextový vyhledávač pro databáze. Je to zajímavá alternativa k javovým řešením, o kterých se, na rozdíl od Sphinxu, mluví mnohem víc. Jelikož s ním mám dobré zkušenosti a používám ho několik let, už od jeho beta verze, rád bych se s vámi podělil o své zkušenosti formou seriálu.
V minulej časti sme sa naučili, ako pomocou Lucene rýchlo a jednoducho vyhľadávať v CouchDB. Dnes sa pozrieme okrem iného na to, ako sa vysporiadať s použitím diakritiky pri vyhľadávaní v našej databáze.