Участник:Rain/Заметки: различия между версиями
Материал из Linux Wiki
Перейти к навигацииПерейти к поиску
Rain (обсуждение | вклад) (Новая страница: «* [http://www.linux.org.ru/forum/linux-hardware/6748566?lastmod=1316444347702#comment-6759509 Создание виртуальной многоканальной к...») |
Rain (обсуждение | вклад) (+индексаторы) |
||
Строка 1: | Строка 1: | ||
* [http://www.linux.org.ru/forum/linux-hardware/6748566?lastmod=1316444347702#comment-6759509 Создание виртуальной многоканальной карты из нескольких простых] | * [http://www.linux.org.ru/forum/linux-hardware/6748566?lastmod=1316444347702#comment-6759509 Создание виртуальной многоканальной карты из нескольких простых] | ||
== Индексаторы == | |||
* htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц | |||
* DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает | |||
* Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc) | |||
* MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству |
Версия 12:37, 3 ноября 2011
Индексаторы
- htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц
- DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает
- Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc)
- MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству