Автор: Пользователь скрыл имя, 26 Февраля 2011 в 12:29, реферат
Документальные информационные системы (ДИС). Поисковых характер документальных информационных систем. Семантически-навигационные ДИС. Системы ДИС на основе индексирования. Классификация системе индексирования. Схеме ДИС на основе индексирования. Поисковый образ запроса и поисковый образ документа. Релевантность.
Тезаурус (от греч. «хранилище», «сокровищница») в узком смысле представляет собой специальный словарь-справочник, в котором перечислены ключевые слова – дескрипторы определенной предметной области, указаны их синонимы, установлены способы устранения синонимии, омонимии, полисемии.
Главная
идея информационно-поисковых
Различают базовые и рабочие тезаурусы. Базовые тезаурусы включают основной набор лексики предметной области. Рабочие тезаурусы строятся на основе базовых тезаурусов и дополняются в процессе индексирования документов новыми терминами.
Критерии оценки ДИС
Основными показателями эффективности функционирования ДИС является полнота и точность информационного поиска.
Полнота информационного поиска R является отношение числа найденных релевантных документов A к общему числу релевантных документов С, имеющихся в системе:
Точность информационного поиска Р определяется отношением числа найденных релевантных документов А к общему числу документов L выданных на запрос пользователя:
Наличие среди отобранных на запрос пользователя не релевантных документов называется информационным шумом системы.
Коэффициент информационного шума К определяется отношением числа выданных нерелевантных документов (L-A), выданных в ответе пользователю к общему числу документов L к общему числу документов L выданных на запрос пользователя.
Полнотекстовые информационные системы.
Процессы компьютеризации деятельности предприятий привели к накоплению большого объема неструктурированной текстовой информации. Возникла потребность в программном обеспечении, реализующем эффективный поток информации.
Потребовались
средства, которые бы в максимальной
степени освобождали
В результате появились полнотекстовые информационные системы.
Они строятся на основе ИПЯ дескрипторного типа. Информационно-технологическая структура полнотекстовых ИС включает:
1) хранилище документов;
2) глобальный словарь системы;
3)
инвертированный индекс
4) интерфейс ввода документов в систему;
5) механизм индексирования;
6)
интерфейс запросов
7) механизм поиска документов;
8) механизм извлечения найденных документов.
Хранилище документов может быть организовано как единая локально сосредоточенная информационная структура в виде специального файла с текстами документов.
Глобальный словарь системы может быть статическим и динамическим.
Статические словари
Динамические словари определяются набором словоформ, имеющихся в документах хранилища. Изначально такой словарь пуст, нос каждым новым документом в него помещаются новые словоформы.
Примером полнотекстовых информационно-поисковых систем являются автоматизированные информационные системы по законодательству.
Автоматизированная информационная система по законодательству (АИСЗ) – это программный комплекс, включающий в себя массив правовой информации и инструменты для работы с ним. Эти инструменты позволяют производить поиск документов, формировать подборки документов, печатать документы.
АИСЗ являются частью следующих типов информационных систем.
1.
Справочно-информационные
2.
Глобальные информационные
3.
Системы информационной
4.
Системы автоматизации
В 1992 году образовалась система «Гарант-Сервис». Занимает второе место в России по количеству пользователей, «Консультант Плюс» - 1-ое место и на 3-ем месте информационно-поисковая система «Кодекс».