Полнотекстовый поиск в 2018 году Базы данных и системы хранения
В прошлом: QA, QA team lead, php dev, dev team lead.
Сейчас: CTO ivinco.com, CEO manticoresearch.com.
Много лет делал консалтинг по Sphinx, 10 лет поддерживает систему полнотекстового поиска из десятков серверов и терабайтов данных.
Тезисы
* Полнотекстовый поиск - что это такое: общие принципы и подходы.
* Обзор главных имеющихся решений: Lucene/Solr/ElasticSearch, Sphinx/Manticore.
* Морфология.
* Индексация.
* Хранение исходных данных, подсветка сниппетов.
* Производительность.
* Отказоустойчивость.
* Масштабируемость.
* Аналитика.
* Percolate Queries как иной подход к анализу интенсивных потоков данных.
