Документальная информационная система

Автор: Пользователь скрыл имя, 26 Февраля 2011 в 12:29, реферат

Описание работы

Документальные информационные системы (ДИС). Поисковых характер документальных информационных систем. Семантически-навигационные ДИС. Системы ДИС на основе индексирования. Классификация системе индексирования. Схеме ДИС на основе индексирования. Поисковый образ запроса и поисковый образ документа. Релевантность.

Работа содержит 1 файл

Документальные информационные системы.doc

— 63.00 Кб (Скачать)

     Тезаурус (от греч. «хранилище», «сокровищница») в узком смысле представляет собой специальный словарь-справочник, в котором перечислены ключевые слова – дескрипторы определенной предметной области, указаны их синонимы, установлены способы устранения синонимии, омонимии, полисемии.

     Главная идея информационно-поисковых тезаурусов заключается в повышении эффективности индексирования документов в рамках дескрипторного подхода, т.е. на основе ИПТ ПОД (поисковый образ документа) представлен набором дескрипторов.

     Различают базовые и рабочие тезаурусы. Базовые тезаурусы включают основной набор лексики предметной области. Рабочие тезаурусы строятся на основе базовых тезаурусов и дополняются в процессе индексирования документов новыми терминами.

      Критерии оценки  ДИС 

     Основными показателями эффективности функционирования ДИС является полнота и точность информационного поиска.

     Полнота информационного  поиска R является отношение числа найденных релевантных документов A к общему числу релевантных документов С, имеющихся в системе:

                                                   

     Точность  информационного  поиска Р определяется отношением числа  найденных релевантных  документов А к  общему числу документов L выданных на запрос пользователя:

       

     Наличие среди отобранных на запрос пользователя не релевантных документов называется информационным шумом системы.

     Коэффициент информационного шума К определяется отношением числа выданных нерелевантных  документов (L-A), выданных в ответе пользователю к общему числу документов L к общему числу документов L выданных на запрос пользователя.

                                                  

     Полнотекстовые  информационные системы.

     Процессы  компьютеризации деятельности предприятий  привели к накоплению большого объема неструктурированной текстовой информации. Возникла потребность в программном обеспечении, реализующем эффективный поток информации.

     Потребовались средства, которые бы в максимальной степени освобождали пользователя от необходимости сложной предварительной структуризации предметной области и затратных процедур индексирования при накоплении текстовых данных, но в то же время создавали бы эффективный и интуитивно понятный поисковый инструментарий.

     В результате появились полнотекстовые информационные системы.

     Они строятся на основе ИПЯ дескрипторного типа. Информационно-технологическая структура полнотекстовых ИС включает:

     1) хранилище документов;

     2) глобальный словарь системы;

     3) инвертированный индекс документов;

     4) интерфейс ввода документов в  систему;

     5) механизм индексирования;

     6) интерфейс запросов пользователя;

     7) механизм поиска документов;

     8) механизм извлечения найденных  документов.

     Хранилище документов может быть организовано как единая локально сосредоточенная  информационная структура в виде специального файла с текстами документов.

     Глобальный  словарь системы может быть статическим  и динамическим.

       Статические словари определяются  заранее и не зависят от  содержания документов, вошедших  в хранилище. 

     Динамические  словари определяются набором словоформ, имеющихся в документах хранилища. Изначально такой словарь пуст, нос каждым новым документом в него помещаются новые словоформы.

     Примером  полнотекстовых информационно-поисковых  систем являются автоматизированные информационные системы по законодательству.

     Автоматизированная  информационная система по законодательству (АИСЗ) – это программный комплекс, включающий в себя массив правовой информации и инструменты для  работы с ним. Эти инструменты  позволяют производить поиск  документов, формировать подборки документов, печатать документы.

     АИСЗ  являются частью следующих типов  информационных систем.

     1. Справочно-информационные системы  общего назначения, ориентированные  на доступ пользователей к  нормативно-правовым актам: системы  «Консультант Плюс», «Гарант», «Кодекс».

     2. Глобальные информационные службы, предоставляющие доступ удаленным  пользователям к библиографической,  полнотекстовой или другой информации. Крупнейшей в мире коммерческой  службой обеспечивающей доступ  к юридической информации, является  система LEXIS (США).

     3. Системы информационной поддержки  деятельности правотворческих органов.  Спецификой таких систем является  необходимость хранения и поиска  многих версий и редакций нормативно-правовых  документов.

     4. Системы автоматизации делопроизводства  судов, милиции и других правоохранительных органов.

В 1992 году образовалась система «Гарант-Сервис». Занимает второе место в России по количеству пользователей, «Консультант Плюс» - 1-ое место и на 3-ем месте информационно-поисковая система «Кодекс».   

Информация о работе Документальная информационная система