Анализ технологий поиска информации в WWW

Автор: Пользователь скрыл имя, 29 Декабря 2010 в 16:38, курсовая работа

Описание работы

Стремление поисковых систем охватить «Великую Сеть» осталось в прошлом. Информационное пространство World Wide Web растет и обновляется намного быстрее, чем любая поисковая система, заполняет свои указатели новой информацией. Даже поисковые указатели, выполняющие поиск по ключевым словам, сегодня не избавлены от однобокости и ограниченности. В поисковые системы поступают все новые и новые Web-страницы, и поисковые работы не перестают «бороздить просторы Сети», но все больше и больше страниц ускользает от их внимания.

Содержание

Введение ……………………………………………………………………
Глава 1. Теоретические основы поисковых систем интернет
§ 1. Поисковые системы как информационный ресурс……………….

§ 2. Общий вид обобщенной поисковой машины. …………………...
§ 3. Критерии качества поиска. ………………………………………..
§ 4. Анализ языка гипертекстовой разметки. …………………………

Глава 2. Анализ технологий поиска информации в WWW

§ 1. Развитие поисковых систем……………………………………….
§ 2. Основные поисковые системы. ……………………………………

§ 3. Приемы поиска информации. ……………………………………..

§ 4. Технология и результат поиска в WWW. ………………………...

Заключение ………………………………………………………………..

Литература ………………………………………………………………...

Ресурсы Интернет…………………………………………………………

Приложение 1………………………………………………………………

Приложение 2………………………………………………………………

Приложение 3………………………………………………………………

Работа содержит 1 файл

Диплом_2_редак.doc

— 1.27 Мб (Скачать)

Содержание

                                                                        Стр.

Введение ……………………………………………………………………

Глава 1. Теоретические основы поисковых систем интернет

     § 1. Поисковые системы как информационный ресурс……………….

     § 2. Общий вид обобщенной поисковой машины. …………………...

     § 3. Критерии качества поиска. ………………………………………..

     §  4. Анализ языка гипертекстовой разметки. …………………………

Глава 2. Анализ технологий поиска информации в WWW

     § 1. Развитие поисковых систем……………………………………….

      § 2. Основные поисковые системы. ……………………………………

       § 3. Приемы поиска информации. ……………………………………..

       § 4. Технология и результат поиска в WWW. ………………………...

Заключение  ………………………………………………………………..

Литература  ………………………………………………………………...

Ресурсы Интернет…………………………………………………………

Приложение 1………………………………………………………………

Приложение 2………………………………………………………………

Приложение 3………………………………………………………………

3 

7

9

14

19 

24

26

36

47

64

66

68

69

70

71

 
 
 
 
 
 
 
 
 
 

     ВВЕДЕНИЕ

     Поиск информации – задача, которую человечество решает уже многие столетия. По мере объема информационных ресурсов, потенциально доступных одному человеку (например, посетителю библиотеки), были выработаны все более изощренные и совершенные средства и приемы, позволяющие найти необходимый документ. Технология поиска информации совершенствовалась в каталогах и информационных отделах крупных библиотек. В 70-е годы ХХ столетия появились компьютерные базы данных, доступ к которым сначала обеспечивался через модемное подключение, а затем по протоколу telnet через Internet.

     Высокая стоимость поиска информации потребовала создания эффективных приемов поиска. Все найденные за много лет средства и приемы информационного поиска доступны и эффективны при поиске информации в Internet. Общеизвестно, что поиск в Internet осуществляется при посредничестве поисковых систем. Таких систем множество и они различаются широтой охвата, способом представления результатов поиска, формой выдачи запроса и другими характеристиками.  

         Всемирная сеть очень важна и полезна практически для любого. Каждый пользователь Интернета может найти в нем массу разнообразной и интереснейшей информации, а также использовать все богатейшие возможности сети. Ресурсы Интернета давно перестали быть просто игрушкой, превратившись в незаменимый инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему. По оценке экспертов объем информации, передаваемой по каналам Интернет, удваивается каждые полгода. Ежедневно в сети появляются миллионы новых документов, и естественно, что без систем поиска они в подавляющем своем большинстве остались бы не востребованными, вообще не были бы не кем найдены, и все то огромное количество информации оказалось бы никому не нужным. Возникла необходимость создания таких средств, которые позволили бы легко ориентироваться в информационных ресурсах глобальных сетей, быстро и надежно находить нужные сведения. В интернете появились специальные поисковые средства. Еще несколько лет назад бытовало такое мнение: в    Интернете есть все, но найти там ничего невозможно. Однако с появлением и быстрым развитием поисковых каталогов, поисковых машин, и всевозможных поисковых программ ситуация изменилась, и теперь в Сети срочно понадобившуюся информацию иногда можно найти быстрее, чем в книге, лежащей на столе.

          Наиболее популярным и используемым способом поиска в Интернете является использование поисковых систем. Что же такое поисковая система? Поисковая система - портал, осуществляющий поиск, сбор и сортировку информации в сети Интернет. Поисковые системы это инструмент, позволяющий пользователю глобальной сети в кратчайшие сроки найти интересующую его информацию.

     Каждый  пользователь постепенно вырабатывает привычку к достаточно узкому кругу  поисковых систем, которыми он пользуется постоянно. Это позволяет привыкнуть к интерфейсу, упрощает ориентацию в длинных списках, облегчает понимание страниц, попавших в его распоряжение.

     Стремление  поисковых систем охватить «Великую Сеть» осталось в прошлом. Информационное пространство World Wide Web растет и обновляется намного быстрее, чем любая поисковая система, заполняет свои указатели новой информацией. Даже поисковые указатели, выполняющие поиск по ключевым словам, сегодня не избавлены от однобокости и ограниченности. В поисковые системы поступают все новые и новые Web-страницы, и поисковые работы не перестают «бороздить просторы Сети», но все больше и больше страниц ускользает от их внимания.

     Эти проблемы становятся особенно серьезными, если требуется найти четкую и точную информацию по конкретному вопросу.

     На  основании вышесказанного, выделим  ряд трудностей:

- огромные массивы информационных ресурсов;

- разновидность  предоставляемой информации;

- использование  национальных языков;

- проникновение технологий Internet в сферу непрофессионального пользователя.

     Цель  квалификационной работы: «Проанализировать достоинства и недостатки известных русскоязычных поисковых систем».

     Предмет исследования – поисковые системы в среде Internet.

     Объектом  исследования является процесс поиска информации в Internet с использованием поисковых систем.

     Задачи  в квалификационной работе:

  1. Изучить стратегию поиска информации в Сети.
  2. Рассмотреть существующие поисковые системы и различные средства поиска.
  3. Сделать сравнительный анализ русскоязычных поисковых систем.
  4. Предложить схему поиска информации.

     Научная новизна исследования заключается в том, что разработанная схема поиска информации, при использовании обозначенных поисковых систем, позволит сократить время поиска и получить более точную информацию.

     Для сбора и обработки информации по теме исследования использованы следующие  методы:

  1. Изучение литературы.
  2. Обобщение теоретического и практического опыта.
  3. Количественный анализ полученных данных.

     Квалификационная  работа состоит из введения, двух глав, заключения и списка использованной литературы. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     Глава 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПОИСКОВЫХ СИСТЕМ ИНТЕРНЕТА

            § 1. Поисковые системы как информационный ресурс.

            Поиск информации - задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку (например, посетителю библиотеки), были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ.

Все найденные  за много лет средства и приемы поиска информации доступны и эффективны и при поиске информации в Интернет.

       Рассмотрим общую схему: «автор» создает «документ у пользователя» возникает «информационная потребность». Эта информационная потребность часто (как правило) даже не может быть точно выражена словами, и выражается только в оценке просматриваемых документов - подходит, или не подходит. В теории информационного поиска вместо слова «подходит» используют термин «пертинентный документ», а вместо              «не подходит» - «не пертинентный». Слово «пертинентный» происходит от английского «pertinent», что значит «относящийся к делу, подходящий, по сути». Субъективно понимаемая цель информационного поиска - найти все пертинентные и только пертинентные документы (мы хотим найти «только то, что хотим, и ничего больше»).

         Эта цель - идеальна и пока недостижима. Мы часто в состоянии оценить пертинентность документа только в сравнении с другими документами. Для того чтобы было с чем сравнивать, необходимо некоторое количество непертинентных документов. Эти документы называются - «шум». Слишком большой шум затрудняет выделение пертинентных документов, слишком малый - не дает уверенности в том, что найдено достаточное количество пертинентных документов.

Практика  показывает, что когда количество непертинентных документов лежит в  интервале от 10% до 30%, ищущий чувствует  себя комфортно, не теряясь в море шума и считая, что количество найденных  документов - удовлетворительно.

        Когда документов много, используется информационно-поисковая система (ИПС). В этом случае информационная потребность должна быть выражена средствами, которые «понимает» ИПС - должен быть сформулирован запрос.

        Запрос редко может точно выразить информационную потребность. Однако многие ИПС не могут определить, соответствует ли тот или иной документ запросу. Для решения этой задачи был введен синтетический критерий - Степень соответствия документа запросу, который называется релевантностью. Релевантный документ может оказаться непертинентным и наоборот.

         Исторические предпосылки развития поисковых систем

        Обратимся к истории возникновения  сети Internet, которая была создана в связи с возникшей необходимостью совместного использования информационных ресурсов, распределенных между различными компьютерными системами. Большинство первых приложений, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост-компьютерами Internet.

          Другие приложения, такие как Telnet, создавались для того, чтобы пользователь получил возможность доступа не только к информации, но и к рабочим ресурсам удаленной системы. По мере развития Internet (увеличения пользователей и хост-компьютеров) прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения.

           § 2. Общий вид обобщенной поисковой машины.

     Основная  задача Internet – предоставление необходимой информации. Чтобы найти нужную информацию необходимо знать адрес Web-страницы, на которой эта информация находится. Лучше всего искать в Сети необходимую информацию с помощью поисковых систем. Поисковая система представляет собой специализированный Web-узел. Поисковые системы классифицируются по методам поиска:

  1. Поисковые каталоги предназначены для поиска по темам. Обычно они построены по иерархическому принципу, т.е. каждый шаг поиска это выбор подраздела с более конкретной тематикой искомой информации. На нижнем уровне поиска пользователь получает относительно небольшой список на искомую информацию.
  2. Поисковый указатель (индекс) обеспечивает поиск по заданным ключевым словам. В результате поиска формируется набор гиперссылок на Web-страницы, содержащие указанные термины. Обычно поисковые указатели (индексы) выдают огромное количество искомых страниц.

Информация о работе Анализ технологий поиска информации в WWW