Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[44.195.47.227] |
|
Сообщ.
#1
,
|
|
|
Приветствую!
Исходные данные В базу данных занесено некоторое количество текстовых документов. Документы занесены в BLOB'ы в виде результата сжатия содержимого очередного документа по алгоритму LZMA или PPMd/PPMz. Нужно вновь записываемые документы проиндексировать так, чтобы обеспечить полнотекстный поиск. Вопрос В каком виде строить индекс? Примеры Чет пока не могу настроится на мысль |
Сообщ.
#2
,
|
|
|
А тупо в лоб - построить суффиксное дерево для каждого документа, и искать уже в нём - не катит?
|
Сообщ.
#3
,
|
|
|
Сообщ.
#4
,
|
|
|
OpenGL, MBo, спасибо - буду разбираться.
|
Сообщ.
#5
,
|
|
|
Сообщ.
#6
,
|
|
|
А если захотите делать свой поисковик то вот вам теория:
Прикреплённый файл__________.zip (1,66 Мбайт, скачиваний: 274)
Добавлено P.S Обратите внимание на материалы Яндекса, они так же в архиве. |
Сообщ.
#7
,
|
|
|
Pavia, пасип! Как раз сейчас читаю про "Стемминг" и "Лемматизацию"
|