Основы технологий текстового поиска

Автор: Пользователь скрыл имя, 29 Ноября 2011 в 15:00, контрольная работа

Описание работы

Обмен информацией в обществе осуществляется главным образом в текстовой форме. Поэтому не случайно, что весьма значительную долю информационных ресурсов современных информационных систем составляет текстовая информация. Разработкам эффективных технологий хранения, обработки и поиска текстовой информации стало уделяться большое внимание уже на ранних стадиях развития информационных систем.

Содержание

Введение
1. Основные понятия
2. Принципы текстового поиска
3. Средства лингвистической поддержки
4. Модели поиска
Список литературы

Работа содержит 1 файл

Копия инф сист !!!!!!!!!!!!!!!!.doc

— 89.00 Кб (Скачать)
gn="justify">    Иногда  используется более жесткий критерий релевантности — вхождение в  текст документа всех названных в запросе слов и словосочетаний и т.д.

    Булевские модели поиска. В системах текстового поиска широко используются булевские  модели поиска. Пользователь может  формулировать запрос в виде булевского выражения с использованием операторов И, ИЛИ, НЕТ. Термы булевского выражения могут быть различными в разных вариациях булевских моделей поиска. В булевском расширении модели поиска по классификаторам термами выражения могут быть условия принадлежности документа данному классу классификатора. В булевской модели поиска с использованием Дублинского ядра термом может быть равенство, описывающее тот факт, что некоторый элемент метаданных для рассматриваемого документа имеет заданное в запросе значение.

    Критерием релевантности данного документа запросу в булевских моделях поиска является истинность булевского выражения, заданного в запросе.

    Векторные модели поиска. Использование таких моделей требует значительно больших вычислительных ресурсов .

    В векторных моделях предполагается, что документы и запросы представляются векторами. В простейшем случае координаты вектора соответствуют термам текста — словам или словосочетаниям, принадлежащим словарю системы, который представляет общеязыковую лексику или лексику предметной области. Каждому терму из такого словаря сопоставляется свое измерение в векторном пространстве. Размерность векторов, представляющих документы и пользовательские запросы, в точности равна количеству измерений в этом пространстве.

    Координате  вектора присваивается единичное  значение в том случае, когда соответствующий ей терм встречается в данном документе или, соответственно, в пользовательском запросе.

    Для оценки степени релевантности документа  запросу (меры их близости) в векторных  моделях поиска используются какие-либо векторные функции, аргументами которых выступают представляющие их векторы.

    Для повышения управляемости векторных  моделей поиска часто усложняют  эти модели. Вводятся веса термов, характеризующие  их значимость. Значения этих весов  используются в качестве координат вектора документа, если его текст включает соответствующие термы. Таким образом, вхождения различных термов в текст документа оказывают различное влияние на значение функции близости документа и запроса.

    Различия  между конкретными векторными моделями поиска сводятся именно к различным способам назначения весов термов и выбора мер близости. Векторные модели позволяют ранжировать результирующее множество документов запроса. 
 

    Список  литературы: 

    1.     Экономическая информатика: Введение  в экономический анализ информационных систем: Учебник. – М.: ИНФРА-М, 2005. 

    2.     Экономическая информатика: учебник  / под ред. В.П. Косарева. 3-е изд.  перераб и доп. – М.: Финансы  и статистика, 2006. 

    3 Сычев А.В. Информационно-поисковые системы. http://company.yandex.ru/class/courses/sychev.xml 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

РОССИЙСКИЙ  ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ 
 
 
 
 
 
 
 

Контрольная работа 

             По дисциплине:  Информационные  системы 

             На тему:  Основы технологий текстового поиска. 
 

  
 
 
 
 
 
 
 
 
 

                                                          Выполнила:   

                                                          Проверил:  ______________________ 
 

                                                                                                                           

                                                                                               
 
 
 
 

Информация о работе Основы технологий текстового поиска