Участник:Rain/Заметки
Материал из Linux Wiki
Перейти к навигацииПерейти к поиску
Индексаторы
- htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц
- DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает
- Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc)
- MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству