Анализ технологий поиска информации в WWW

Автор: Пользователь скрыл имя, 29 Декабря 2010 в 16:38, курсовая работа

Описание работы

Стремление поисковых систем охватить «Великую Сеть» осталось в прошлом. Информационное пространство World Wide Web растет и обновляется намного быстрее, чем любая поисковая система, заполняет свои указатели новой информацией. Даже поисковые указатели, выполняющие поиск по ключевым словам, сегодня не избавлены от однобокости и ограниченности. В поисковые системы поступают все новые и новые Web-страницы, и поисковые работы не перестают «бороздить просторы Сети», но все больше и больше страниц ускользает от их внимания.

Содержание

Введение ……………………………………………………………………
Глава 1. Теоретические основы поисковых систем интернет
§ 1. Поисковые системы как информационный ресурс……………….

§ 2. Общий вид обобщенной поисковой машины. …………………...
§ 3. Критерии качества поиска. ………………………………………..
§ 4. Анализ языка гипертекстовой разметки. …………………………

Глава 2. Анализ технологий поиска информации в WWW

§ 1. Развитие поисковых систем……………………………………….
§ 2. Основные поисковые системы. ……………………………………

§ 3. Приемы поиска информации. ……………………………………..

§ 4. Технология и результат поиска в WWW. ………………………...

Заключение ………………………………………………………………..

Литература ………………………………………………………………...

Ресурсы Интернет…………………………………………………………

Приложение 1………………………………………………………………

Приложение 2………………………………………………………………

Приложение 3………………………………………………………………

Работа содержит 1 файл

Диплом_2_редак.doc

— 1.27 Мб (Скачать)

     Rambler содержит специальный раздел («Расширенный поиск» - http://www.rambler.ru/doc/advanced.shtml), позволяющий задавать более точные настройки параметров запроса (Рис. 4). Например, можно определить, где должно находиться искомое слово (в документах, в их названиях, в заголовках документов), уточнить язык документов, по которым осуществляется поиск, и даже указать системе, искать однокоренные слова или поиск следует ограничить словом в том виде, как оно написано в строке запроса. Если в поисковой системе указано несколько ключевых слов, то можно потребовать, чтобы Rambler возвращал только те документы, где эти слова находятся на минимальном расстоянии друг от друга (режим «Ограничить расстояние между словами»). В дополнение к этому, особая опция позволяет исключать из результатов поиска документы, содержащие определенные слова. Перечисленные возможности часто игнорируются пользователями. Между тем лишние 2-3 минуты, затраченные на уточнение параметров поиска, позволяют сэкономить значительно больше времени на том, что результаты работы поисковой системы будут ближе к тем, что ожидал получить пользователь.

     Воспользуемся функцией расширенного поиска. Укажем следующие опции поиска:

    • поиск по тексту – всего документа;
    • искать слова запроса – все;
    • язык документа – русский;
    • расширение запроса – не расширять;
    • расстояние между словами запроса - ограничить.

     Все эти настойки делаются путем простого расставления соответствующих значков в форме запроса.

Рис. 4. Страница расширенного поиска поисковой системы  Rambler. 

     Результата  поиска: ссылок на ресурсы, содержащие искомые термины, стало больше. Найдено сайтов – 113500, документов – 95628200, из них новых – 11858, на поиск потрачено 2,4 секунды.

     Поисковая система Yandex тоже обладает функцией расширенного поиска (http://www.yandex.ru/advanced.html) (Рис. 5). Этот режим позволяет добиться точной настройки параметров поиска и в целом похож на расширенный поиск на Rambler. Но есть и некоторые отличия. Добавлена возможность поиска по ключевым словам в пределах одного сайта. Можно игнорировать сайт при проведении поисков. Можно осуществлять поиск страниц, на которых есть ссылки на интересующий пользователя сайт. Такой прием позволяет узнать, как часто цитируется в Сети искомый ресурс.

     Данные  для поиска:

    • расположение относительно друг друга – подряд;
    • расположение на странице – где угодно;
    • употреблены в тексте – точно так как в запросе;

    найденные страницы должны обладать следующими свойствами:

    • язык – русский;
    • дата – любая ;
    • формат – любой.

Рис. 5. Страница расширенного поиска поисковой системы  Yandex.

     Результат получили через 2,7 секунд, найдено 3429 сайтов, 11068775 страниц. Этот результат тоже отличается от результата простого поиска, только документов стало меньше, а для поиска потребовалось немного больше времени.

     В поисковой системе Апорт расширенный  поиск сделать не смогли.

     В итоге поисковая система Rambler по скорости получения результата немного впереди поисковой системы Yandex, и результат поиска у Rambler намного выше, чем у Yandex.

     Рассмотрим  примеры применения логических команд для поисковых систем, которые сравниваем.

     Выполним  поиск, с применением логической связки And (“и”), для системы Rambler, получим:

    • Введем в поле ввода запрос поисковые And системы.
    • Нажмем кнопку Найти!

     Результат получен через 2,3 секунды, найдено 113524 сайта, 956288 документов, новых 11858,. Найдены документы, в которых присутствуют оба эти слова.

  • Введем в поле ввода запрос поисковые Or системы.
  • Нажмем кнопку Найти!

     Используя логическую связку Or (“или”) будут найдены все документы, в которых встречается любое из перечисленных слов.

       На поиск потрачено 2,1 секунды, 117309 сайтов, 10174034 документов, новых 16917.

     Выполним  аналогичный поиск для поисковой системы Yandex:

  • Введем в поле ввода запрос поисковые & системы.
  • Нажмем кнопку Найти!

    Поиск выполнен за 2,6 секунды, найдено 3636 сайтов, 11448598 страниц.

  • Введем в поле ввода запрос поисковые | системы.
  • Нажмем кнопку Найти!

     Для получения результата потребовалось 4,0 секунды, получили 3693 сайта, 11823482 страницы.

     У поисковой системы Апорт для использования языка запросов есть справочный раздел (http://www.aport.ru/help.htm) ( Рис. 6 ).

     Выполним  поиск с помощью логических операторов для поисковой системы Апорт:

Рис. 6. Страница справочного раздела поисковой  системы Апорт. 

     
  • Введем  в поле ввода запрос поисковые & системы.
  • Нажмем кнопку Апорт!.

    Найдено 4093 сайта, 17805 документов, за 4,8 секунды.

  • Введем в поле ввода запрос поисковые Or системы.
  • Нажмем кнопку Апорт!

     Через 3,4 секунды получен результат, 3967 сайтов, 17490 документов.

По времени  получения результата и по количеству найденных документов лучше всех сработала поисковая система  Rambler.

     Сравним результаты поиска с применением команды NEAR. Не все поисковые службы поддерживают поиск с помощью данной команды, хотя это одна из самых удобных команд расширенного поиска.

     Поисковая система Rambler:

  • Введем в поле ввода запрос: $NEAR:поисковые системы
  • Нажмем кнопку Найти!

     Результат через 3 секунды, получено 475 сайтов, 3664 документов.

     Поисковая система Yandex:

  • Введем в поле ввода запрос: поисковые системы/(-24)
  • Нажмем кнопку Найти!

     В итоге на поиск потрачено 2,2 секунды, найдено 3252 сайта, 8298986 страниц.

     Поисковая система Апорт:

  • Введем в поле ввода запрос: СЛ 4 (поисковые,системы).
  • Нажмем кнопку Апорт!.

    Найдено 112 сайтов, 203 документа, за 5,9 секунд.

     Поиск с использованием логических связок быстрее и результативнее выполнила  поисковая система Rambler

     По  итогам проведенного сравнения поисковых систем Rambler, Yandex и Апорт сделали схему (Рис. 7), на которой видно при каких приемах поиска, лучше использовать ту или иную поисковую систему. По схеме можно сделать вывод, что для простого поиска можно использовать и поисковую систему Rambler, и поисковую систему Yandex, а для расширенного поиска лучше подходит поисковая система Rambler. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Заключение

          По итогам сделанной работы можно заключить, что поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас - это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнесаСамой лучшей иностранной поисковой системой является Google, так как для меня основное значение имеет точность и полнота предоставляемых данных. Но можно заключить также что, каждая поисковая система будь, то Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно, какой именно лучше пользоваться было бы не правильно. Поэтому для удобства поиска и полноты информации следует пользоваться несколькими поисковиками, вводя в них нужные запросы. По моему мнению, из многих Российских поисковиков выделяются Яндекс и Рамблер, для них характерно постоянное обновление баз данных что, обеспечивает именно актуальность и точность предоставляемой информации.

         Сеть – это идеальный учитель. Люди, которым требуются знания в какой-либо области, будут всегда, а значит и интернет-поиск никуда не денется.

     В квалификационной работе сделан сравнительный анализ поисковых систем и предложена схема поиска информации в Internet.

     Таким образом, на основе изученной литературы, обобщения теоретического и практического  опыта, количественного анализа  полученных данных, решены следующие задачи:

  1. Изучена стратегия поиска информации в Сети.
  2. Рассмотрены достоинства и недостатки различных поисковых систем и приемы поиска с использованием этих систем.
  3. Сделан сравнительный анализ русскоязычных поисковых систем: Rambler, Yandex и Апорт.
  4. Предложена схема поиска информации, в которой отражены итоги сравнительного анализа, по скорости получения результата и количеству найденных документов, что позволит сократить время поиска информации в Internet.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

ЛИТЕРАТУРА

  1. Белкин П.Ю. Обучение поиску информации в интернете // Информатика и образование. – 2002. - № 5.
  2. Белкин П.Ю. Язык запросов: читаю, перевожу со словарем: Поиск информации в Интернете: некоторые проблемы обучения // Учитель года. – 2002. - № 2.
  3. Борисов М., Визель М. Что такое Интернет?// «Смена», 2003, №7.
  4. Волубуев Р., Паутина в огне: «Литературная газета», 1998, №40.
  5. Все об INTERNET. Руководство и каталог. Эд Крол. Торгово-изд. бюро BHV, Киев.
  6. Глобальная информационная сеть Интернет // Острейковский В.А. Информатика. – М., 2000.
  7. Глухов В., Максимов Н. Порталы научной информации: Организация и использование - М, 2001.
  8. Гончаров М.В. Введение в Интернет: Учеб. пособие в 9 ч. // М.В. Гончаров, Я.Л. Шрайберг. // ГПНТБ России, — 2000 – 2001.
  9. Грошев С.В. Современный самоучитель профессиональной работы на компьютере, 2001.
  10. Золотов С., Протоколы INTERNET.-СПб.: BHV – Санкт-Петербург, 1998.
  11. Интернет на пороге третьего тысячелетия. «Техника молодежи», 1999, №10.
  12. Информатика. Базовый курс. Учебник для ВУЗов. – СПб., 2001.
  13. Курочкин В.М. Язык компьютера – М:Мир, 1998.
  14. Литвинова Н. Возьмемся за руки, друзья, чтоб не пропасть нам в Интернете // Б-ка. - 2003. - № 12.
  15. Михеева Е.В. Информационные технологии в профессиональной деятельности: Учебное пособие для сред. проф. образования – М.: Издательский центр «Академия», 2006.
  16. Олифер В.Г., Олифер Н.А. Компьютерные сети. Принципы, технологии, протоколы. – Издательство «Питер», 2003.
  17. Острейковский В.А. Информатика: Учебник для ВУЗов – М.: Высшая школа, 2001.
  18. Путеводитель по глобальной компьютерной сети Internet., изд. «Артос», Москва, 2000.
  19. Рафаева А.В. О содержании практикума «Поиск информации в сети Интернет» // Методист. – 2004. - № 3.
  20. Розина И.Н. Поиск информации в интернет на основе автоматизированных информационно-поисковых систем // Пед. информатика. – 2001. - № 2.
  21. Симонович С.В. и др. ИНТЕРНЕТ: Лаборатория мастера: Практическое руководство по эффективным приемам работы в Интернете / С.В. Симонович, Г.А. Евсеев, В.И. Мураховский – М.: АСТ – ПРЕСС КНИГА: Инфорком – Пресс. 2002.
  22. Ставрова О.Б. Поиск информации в сети интернет // Шк. и пр-во. – 2002. - № 6.
  23. Сюнтюренко О. В Электронные информационные ресурсы: проблемы создания и использования // Научный сервис в сети Интернет: Тезисы докладов Всерос. Науч. Конф. 20-25 сент. 2002 г., Новороссийск.- Изд-во МГУ — 1999 г.
  24. Фролов А.В., Фролов Г.В., Глобальные сети компьютеров. Практическое введение в Internet – 2001.
  25. Хафкемейер Х. Интернет. Путешествие по всемирной компьютерной сети, 1999.
  26. Шафрин Ю.А., Основы компьютерной технологии. – М.: АБФ. 2003.
  27. Энциклопедия Интернет. – СПб., 2001.
  28. Internet для занятых: из-во Питер – С.-Петербург, 2003.

Информация о работе Анализ технологий поиска информации в WWW