11. Выявление неинформативных документов (СПАМ).
Технологии автоматического определения спам-документов:
выявление спама на основе текстовых, ссылочных и других
данных.
Технологии эффективного хранения информации.
Средства сжатия скачанных веб-документов, работающие
лучше стандартных средств.
!
Технологии построения высокопроизводительных индексов.
Средства упаковки индексов для решения задач уменьшения
объема и ускорения считывания информации из индекса.
Направления исследований