V prvním díle jsme si představili knihovnu Lucene a vysvětlili jsme si, jakou nabízí „out-of-the-box“ podporu fulltextového vyhledávání pro češtinu. Ve druhém díle budeme pokračovat a ukážeme si hunspell token filter. Praktickou část opět demonstrujeme s použitím Elasticsearch.
Archiv autora: Lukáš Vlček
Lukáš Vlček
Lukáš Vlček pracuje v pro společnost Red Hat. V poslední době používá především Elasticsearch a (z nouze i) JavaScript (a díky Closure Tools se to dá vydržet), ve skutečnosti se ale považuje za Java vývojáře. Tajemstvím ovšem zůstává, že Lukáš je především ilustrátor, který za poslední roky nic kloudného nevytvořil a sní o tom, že jednou bude hrát v pořádném big bandu na pozoun.
Dobré fulltextové vyhledávání pro češtinu nemusí nutně znamenat investici do proprietárních knihoven a slovníků. Nevěříte? Zkusím vás přesvědčit! Ukážeme si, jak nakonfigurovat Elasticsearch pro fulltextové vyhledávání v českých textech.