Участник:Rain/Заметки: различия между версиями

Материал из Linux Wiki
Перейти к навигацииПерейти к поиску
(Новая страница: «* [http://www.linux.org.ru/forum/linux-hardware/6748566?lastmod=1316444347702#comment-6759509 Создание виртуальной многоканальной к...»)
 
(+индексаторы)
Строка 1: Строка 1:
* [http://www.linux.org.ru/forum/linux-hardware/6748566?lastmod=1316444347702#comment-6759509 Создание виртуальной многоканальной карты из нескольких простых]
* [http://www.linux.org.ru/forum/linux-hardware/6748566?lastmod=1316444347702#comment-6759509 Создание виртуальной многоканальной карты из нескольких простых]
== Индексаторы ==
* htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц
* DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает
* Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc)
* MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству

Версия 12:37, 3 ноября 2011

Индексаторы

  • htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц
  • DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает
  • Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc)
  • MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству