Автор: Пользователь скрыл имя, 06 Апреля 2012 в 20:38, реферат
Цель документального поиска - нахождение и выдача соответствующих запросу пользователя документов или их описаний.
Традиционно информационно-поисковые системы (ИПС) применяются для тематического поиска научно-технической информации в крупных библиотеках, научно-технических центрах, архивах, патентных библиотеках.
Таким образом, сфера приложения для технологий информационно-поисковых систем представляется достаточно широкой.
Введение ……………………………………………………………………………
Информационно-поисковый тезаурус: определение, цель разработки …….
Структура информационно-поискового тезауруса …………………………..
Использование информационно-поисковых тезаурусов …………………….
Построение информационно-поисковых тезаурусов ………………………...
Сфера применения и перспективы развития информационно-поисковых тезаурусов …………………………………………………………………………..
Заключение …………………………………………………………………………
Список литературы ………………………………………………………………...
Содержание
Введение ……………………………………………………………………………
Заключение …………………………………………………………………………
Список литературы ………………………………………………………………...
Введение
В настоящее время в связи с возрастанием объема документальной информации, необходимой для принятия эффективного управленческого решения, и возможностями, предоставляемыми новыми компьютерными технологиями, автоматизированные информационно-поисковые системы стали широко использоваться в различных сферах экономики.
Организация быстрого и эффективного поиска документальной информации становится все более неразрешимой проблемой.
Цель документального поиска - нахождение и выдача соответствующих запросу пользователя документов или их описаний.
Традиционно
информационно-поисковые
Таким образом, сфера приложения для технологий информационно-поисковых систем представляется достаточно широкой.
При автоматизации
поиска документальной информации важнейшей
является задача формализации содержания
документа и запроса. При этом
поиск происходит по всему тексту
документа или по его поисковому
образу, а в качестве запроса чаще
всего выступают отдельные
1. Информационно-поисковый тезаурус: определение, цель разработки
Тезаурус
– термин, широко используемый в
информатике как составная
Можно выделить
два определения информационно-
1. Информационно-поисковый
тезаурус представляет собой
словарь, отображающий
2. Информационно-поисковый
тезаурус (ИПТ) – контролируемый
словарь терминов предметной
области, создаваемый для
Возможно два способа расположения слов в словарях: по близости их буквенного состава и по смысловой близости.
По первому способу создаются алфавитные словари. По второму способу - тезаурусы. Алфавитные словари служат для раскрытия значения данного слова. Тезаурусы служат для поиска слов для выражения данного понятия. Т.е., если в обычном словаре по слову ищется его смысл, то в тезаурусе по заданному смыслу ищутся слова, которые этот смысл выражают.
Цели разработки ИПТ:
- перевод
языка авторов на
- обеспечение
последовательности в
- обозначение отношений между терминами;
- облегчение информационного поиска.
2. Структура информационно-поискового тезауруса
Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними.
Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя.
Введение содержит общие характеристики тезауруса - область применения, правила использования, число дескрипторов, ключевых слов и другую справочную информацию.
Алфавитный указатель включает алфавитный перечень дескрипторных статей.
Дескрипторная статья может иметь следующую структуру:
- заглавный дескриптор;
- ключевые
слова из класса
- дескрипторы, подчиняющие заглавный;
- дескрипторы, подчиненные заглавному;
- дескрипторы, ассоциированные с заглавным.
Ассоциации могут быть следующих видов: причина - следствие; сырье - продукт; процесс - объект; процесс - субъект; свойство - носитель свойства; функциональное сходство и др.
Систематический
указатель служит для раскрытия,
учета и контроля парадигматических
отношений между дескрипторами.
Для каждого дескриптора ИПЯ
должны быть найдены соответствующие
родовые и видовые дескрипторы.
Причем предварительно необходимо сформулировать
критерии, определяющие число уровней
иерархии. Определение степени
3. Использование информационно-поисковых тезаурусов
Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др.
Информационно-поисковые тезаурусы используются при индексировании документов и запросов.
Различают безтезаурусное индексирование и индексирование с тезаурусным контролем лексики.
При безтезаурусном индексировании поисковый образ документа представляется в виде списка ключевых слов, выбранных непосредственно из текста документа. Такое индексирование требует меньше времени и менее трудоемко. Однако такой режим индексирования обладает рядом недостатков: возможна синонимия; нельзя отразить парадигматические отношения.
При индексировании
с тезаурусным контролем
Таким образом,
информационно-поисковые
- перевода текста с ЕЯ на дескрипторный ИПЯ путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность;
- отображения
парадигматических связей
4. Построение информационно-поисковых тезаурусов
Тезаурусы разрабатываются для отдельных отраслей. Например, существует «Тезаурус по документации», «Дескрипторный словарь по информатике» и т.п. Тезаурус может быть разработан и для обслуживания конкретной информационно-поисковой системы.
Построение тезауруса состоит из нескольких взаимосвязанных этапов.
Первый
этап - формирование словника. Словник
- первоначальные множества ключевых
слов. При этом рассматривается
Второй этап - формирование множества ключевых слов. Из словника формируется множество ключевых слов. Например, такой критерий, как частота встречаемости не может быть абсолютным. Если слово встречается в текстах очень часто, это может означать, что оно выражает чрезмерно широкое понятие, т.е. неинформативно. Если ключевое слово встречается очень редко, это может означать, что оно выражает новое понятие и таким образом является информативным.
Третий этап - формирование классов эквивалентности. Выделение дескрипторов.
Класс эквивалентности - это группа терминов, равнозначных по смыслу в пределах сферы действия данной системы. Одно из слов класса эквивалентности объявляется дескриптором (как правило, наиболее употребляемое).
Критерием включения слов в класс эквивалентности является семантическая значимость этого слова при поиске документов, т.е. если данное слово при поиске документа может быть заменено другим словом, так, что на любой запрос выдача документов будет такой же, как и до замены, то такие два слова объявляются условными эквивалентами и включаются в один класс эквивалентности.
Разработка тезауруса без использования компьютерных технологий - достаточно длительный и трудоемкий процесс.
Большинство автоматизированных методов создания тезауруса основано на автоматическом подсчете частоты слов, содержащихся в документах, считающихся типичными для данной предметной области.
Автоматические
информационно-поисковые
В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают составной частью современных систем подготовки текстов, осуществляя лингвистическую поддержку процесса подготовки и обработки текстов на естественном языке.
Среди наиболее
перспективных направлений
1. Получение
справки по используемому
2. Контекстные
замены по требованию
3. Автоматическая
оценка стиля. Если слова и
словосочетания в тезаурусе
Заключение
В условиях конкурентной борьбы, необходимости постоянного повышения качества работы органа управления и всего предприятия в целом на руководителя обрушивается мощный поток информации, прежде всего документальной, и у него возникают проблемы с ее переработкой. Необходимы специальные методы информационной обработки документов, организации быстрого и эффективного поиска документальной информации. Именно информационно-поисковые тезаурусы служат решению этой проблемы.
Считаю, что в моей работе достаточно подробно и логично изложены способы использования и построения информационно-поискового тезауруса, а также сфера его применения и перспективы развития.
Список литературы
1. Ивасенко А.Г. Информационные технологии в экономике и управлении: учебное пособие / А.Г.Ивасенко, А.Ю.Гридасов, В.А.Павленко.- 2-е изд., стер.- М.: КНОРУС, 2009.- 160с.
2. Информатика для юристов и экономистов / Симонович С.В. и др.- СПб.: Питер, 2009.- 688с.: ил.
3. Информатика: Базовый курс/С.В.Симонович и др.- СПб.: Питер, 2008.- 640с.: ил.
4. Михеева
Е.В. Информационные
5. Организация работы с документами: Учебник / Под ред. проф. В.А.Кудряева.- 2-е изд., перераб. и доп.- М.: ИНФРА-М, 2009.- 592с.- (Серия «Высшее образование»).