Участник:Rain/Заметки

Материал из Linux Wiki
Перейти к навигацииПерейти к поиску
Версия для печати больше не поддерживается и может содержать ошибки обработки. Обновите закладки браузера и используйте вместо этого функцию печати браузера по умолчанию.

Индексаторы

  • htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц
  • DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает
  • Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc)
  • MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству