Архив за Январь, 2012

Проблемы формирования инвертированного индекса

Концепция инвертированного индекса лежит в основе любой системы информационного поиска. Основные этапы его построения следующие: Первое, сбор документов, для индексации. Второе, разбиение текста на лексемы. Третье, первичная лингвистическая обработка лексем. Четвертое, индексация собранных документов по каждому термину. Рассмотрим каждый из названных этапов и назовем основные проблемы, возникающие при реализации каждого шага.

Булева модель поиска

Информационный поиск (Information retrieval) сегодня – это быстро развивающаяся область знаний, которой занимаются не только отдельные специалисты, но и широко используют миллионы людей, при помощи поисковых систем. Термин информационный поиск имеет множество значений, однако наиболее отражает суть термина следующее определение: Информационный поиск – это процесс поиска в большой коллекции некоего неструктурированного материала, удовлетворяющего информационные потребности. […]