Автор: Пользователь скрыл имя, 12 Декабря 2011 в 13:36, реферат
Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к ин-формационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной се-ти. С появлением Интернета проблема поиска становилась более актуальной. Интернет- это единая информационная среда, также это большое количество полезной информации, для поиска которой необходимо затратить много времени.
Введение 3
Исторические предпосылки развития поисковых систем. 4
Информационно-поисковые системы. 6
Классификация ИПС: 7
Документальные (документографические) 8
Фактографическая информационная поисковая система. 9
Основные определения ИПС 10
Заключение. 13
Оглавление
Введение 3
Исторические предпосылки развития поисковых систем. 4
Информационно-поисковые системы. 6
Классификация ИПС: 7
Документальные (документографические) 8
Фактографическая информационная поисковая система. 9
Основные определения ИПС 10
Заключение. 13
Современный этап развития цивилизации характеризуется переходом наиболее развитой части человечества от индустриального общества к информационному. Одним из наиболее ярких явлений этого процесса является возникновение и развитие глобальной информационной компьютерной сети. С появлением Интернета проблема поиска становилась более актуальной. Интернет- это единая информационная среда, также это большое количество полезной информации, для поиска которой необходимо затратить много времени.
Основные
протоколы, используемые в Интернет,
не обеспечены достаточными встроенными
функциями поиска, не говоря уже о миллионах
серверах, находящихся в ней. Протокол
HTTP, используемый в Интернет, хорош лишь
в отношении навигации, которая рассматривается
только как средство просмотра страниц,
но не их поиска. То же самое относится
и к протоколу FTP, который даже более примитивен,
чем HTTP. Из-за быстрого роста информации,
доступной в Сети, навигационные методы
просмотра быстро достигают предела их
функциональных возможностей, не говоря
уже о пределе их эффективности. Не указывая
конкретных цифр, можно сказать, что нужную
информацию уже не представляется возможным
получить сразу, так как в Сети сейчас
находятся миллиарды документов и все
они в распоряжении пользователей Интернет,
к тому же сегодня их количество возрастает.
Количество изменений, которым эта информация
подвергнута, огромно и, самое главное,
они произошли за очень короткий период
времени. Основная проблема заключается
в том, что единой полной функциональной
системы обновления и занесения подобного
объема информации, одновременно доступного
всем пользователям Интернет во всем мире,
никогда не было. Для того, чтобы структурировать
информацию, накопленную в сети Интернет,
и обеспечить ее пользователей удобными
средствами поиска необходимых им данных,
были созданы поисковые системы.
Возникновение сети Internet было связанно необходимостью совместного использования информационных ресурсов, распределенных между различными компьютерными системами. Большинство первых приложений, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост-компьютерами Internet.
Другие приложения, такие как Telnet, создавались для того, чтобы пользователь получил возможность доступа не только к информации, но и к рабочим ресурсам удаленной системы. По мере развития Internet (увеличения пользователей и хост-компьютеров) прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения.
Для удовлетворения таких потребностей сначала были созданы поисковая система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были разработаны сетевые информационные системы WWW и WAIS, предлагающие абсолютно новые методы получения информации. Принципы работы этих систем позволяют легко ориентироваться в огромном количестве информационных ресурсов без необходимости предоставления механизмов работы самой сети Internet. Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных компьютерных систем, а об особых информационных пространствах сети.
Система Archie представляет собой комплекс программных средств, работающих со специальными базами данных. В этих базах данных содержится постоянно пополняющаяся информация о файлах, к которым можно получить доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить поиск файла по шаблону его имени. При этом пользователь получит список файлов с точным указанием места их хранения в сети, а также с информацией о типе, времени создания и размере файлов. Доступ к информационно-поисковой системе Archie может осуществляться различными путями, начиная от запросов по электронной почте и с помощью сервиса Telnet и заканчивая использованием графических Archie-клиентов.
Система Gopher была разработана для упрощения процесса локализации FTP-ресурсов Internet и для более удобного представления сведений о содержании хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной форме (в виде меню) представлять пользователям об имеющихся файлах и их содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и FTP-серверы. Таким образом, пользователь получает возможность “путешествовать” по Internet, не обращая внимания на местонахождение интересующих его ресурсов, и получать доступ к этим ресурсам.
Система Veronica используется для поиска информации в Gopher-пространстве по заголовкам пунктов меню. После ввода ключевого слова, система Veronica выясняет, встречается ли оно в меню на каком-либо Gopher-сервере, и в качестве результатов поиска выдает список заголовков пунктов меню, содержащих ключевое слово. Поскольку система Veronica не является автономной поисковой программой, а тесно связана с системой Gopher, она обладает тем же, что и система Gopher, недостатком: далеко не всегда по заголовку можно сказать, что собой представляет тот или иной информационный ресурс. Достоинства системы заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.
Информационно-поисковая система – это прикладная компьютерная среда для обработки, хранения, сортировки, фильтрации и поиска больших массивов структурированной информации.
Еще одно определение:
ИПС
(информационно-поисковая
система) - это система, обеспечивающая
поиск и отбор необходимых данных в специальной
базе с описаниями источников информации
(индексе) на основе информационно-поискового
языка и соответствующих правил поиска.
Информационно-поисковая система выполняет следующие функции:
Создание
и использование информационно-
1.
Документографические (документальные).
В документографических ИПС все хранимые
документы индексируются специальным
образом, т. е. каждому документу присваивается
индивидуальный код, составляющий поисковый
образ. Поиск идет не по самим документам,
а по их поисковым образам. Именно так
ищут книги в больших библиотеках. Сначала
отыскивают карточку в каталоге, а затем
по номеру, указанному на ней, отыскивается
и сама книга.
2.
Фактографические.
В фактографических ИПС хранятся не документы,
а факты, относящиеся к какой-либо предметной
области. Поиск осуществляется по образцу
факта.
Это системы, в которой объектом сохранения и обработки есть собственно документы. В такой ИПС все хранимые документы индексируются некоторым специальным образом. Каждому документу (статье, отчету, протоколу и т.п.) присваивается индивидуальный код, составляющий поисковый образ документа. Поиск идет не по самим документам, а по их поисковым образам, которые содержат информацию (адрес) о местонахождении документа. Именно так ищут книги по заказам читателя в больших библиотеках (в маленьких библиотеках библиотекарь обычно ищет книги сам). По требованию читателя сначала находят карточку в каталоге, а потом по шифру, указанному на ней, отыскивается и сама книга. Различия документографических ИПС определяются тем, как устроен поисковый образ документа. В простейшем случае это просто его индивидуальное название (например, название, автор, год издания книги). В более сложных случаях нет однозначного соответствия между поисковым образом документа и самим документом. Вполне возможен случай, когда поисковый образ документа соответствует нескольким различным документам и, наоборот, один и тот же документ соответствует не одному, а нескольким поисковым образам.
Это
система, где, объектом или сущностью
есть то, что представляет для проблемной
сферы многосторонний интерес (сотрудник,
договор, изделие и т.п.). Ведомости
об этих сущностях могут находиться
во множестве разных входных и
исходных сообщений.. В отличие от документографических
ИПС в ИПС такого типа хранятся не документы,
а факты, относящиеся к какой-либо предметной
области. Хранимые факты могут быть извлечены
из различных документов. В базе фактов
они связываются между собой системой
разнообразных отношений. Такая сеть в
ИПС носит название тезауруса предметной
области. Запросы, поступающие в фактографические
ИПС, используют тезаурус для поиска ответов
на запросы. Поиск осуществляется методом
поиска по образцу, широко применяющемуся
в базах знаний систем искусственного
интеллекта. ИПС фактографического типа
постепенно приближаются по своей организации
и функционированию к развитым базам данных
и знаний.
Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность. Релевантность - это соответствие результатов поиска сформулированному запросу.
Тезаурус - полный систематизированный набор терминов, слов, данных, семантических понятий в какой-либо области знаний с указанием на их практическое применение.
Основными целями разработки традиционных ИПТ являются следующие:
Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.
В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы, метапоисковые системы.
Каталог - поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми.
Поиск
в каталоге очень удобен и проводится
посредством последовательного уточнения
тем. База данных ссылок (индекс) каталога
обычно имеет ограниченный объем, заполняется
вручную персоналом каталога. Некоторые
каталоги используют автоматическое обновление
индекса.
Результат поиска в каталоге представляется
в виде списка, состоящего из краткого
описания (аннотации) документов с гипертекстовой
ссылкой на первоисточник.