Автор: Пользователь скрыл имя, 29 Декабря 2010 в 16:38, курсовая работа
Стремление поисковых систем охватить «Великую Сеть» осталось в прошлом. Информационное пространство World Wide Web растет и обновляется намного быстрее, чем любая поисковая система, заполняет свои указатели новой информацией. Даже поисковые указатели, выполняющие поиск по ключевым словам, сегодня не избавлены от однобокости и ограниченности. В поисковые системы поступают все новые и новые Web-страницы, и поисковые работы не перестают «бороздить просторы Сети», но все больше и больше страниц ускользает от их внимания.
Введение ……………………………………………………………………
Глава 1. Теоретические основы поисковых систем интернет
§ 1. Поисковые системы как информационный ресурс……………….
§ 2. Общий вид обобщенной поисковой машины. …………………...
§ 3. Критерии качества поиска. ………………………………………..
§ 4. Анализ языка гипертекстовой разметки. …………………………
Глава 2. Анализ технологий поиска информации в WWW
§ 1. Развитие поисковых систем……………………………………….
§ 2. Основные поисковые системы. ……………………………………
§ 3. Приемы поиска информации. ……………………………………..
§ 4. Технология и результат поиска в WWW. ………………………...
Заключение ………………………………………………………………..
Литература ………………………………………………………………...
Ресурсы Интернет…………………………………………………………
Приложение 1………………………………………………………………
Приложение 2………………………………………………………………
Приложение 3………………………………………………………………
§4. Технология и результат поиска в WWW.
За время существования Internet предпринимались различные попытки организации поисковых средств. Многие из этих попыток оказались неудачными, другие привели к созданию удобных средств поиска информации. Наиболее удачные проекты появились в последние пять лет.
Процесс поиска довольно прост: задавая ключевые слова, характерные для искомой информации, находим нужный документ. Вне зависимости от того, какой поисковой системой пользоваться, примерный алгоритм поиска информации следующий:
Во многих поисковых системах поле запроса остаётся на странице во время просмотра результатов, и можно быстро уточнить запрос и организовать новый поиск. В большинстве систем список включает в себя кроме ссылок несколько строк каждого из найденных документов, чтобы было легче выбрать нужный. В некоторых системах списки ссылок отсортированы так, что в начале списка ссылки на документы, наиболее удовлетворяющие запросу.
Рассмотрим и сравним поиск информации во Всемирной паутине с помощью нескольких наиболее распространённых русскоязычных систем поиска: Rambler, Yandex и Апорт.
Перед началом работы с поисковыми системами следует установить связь с поставщиком услуг Internet, после чего перейти на начальную страницу работы с поисковыми системами:
После
ввода адреса, для загрузки начальной
страницы, поисковой системы Rambler,
потребовалось 2,5
секунд.
Рис. 1. Начальная
страница поисковой системы Rambler.
Для загрузки начальной страницы поисковой системы Yandex – 1,6 секунд.
Рис. 2. Начальная
страница поисковой системы
Для загрузки начальной страницы поисковой системы Апорт – 5,7 секунды.
Рис. 3. Начальная
страница поисковой системы Апорт
По результату загрузки начальной страницы, можно сделать вывод: отсутствие рекламы позволяет поисковой системе Yandex загружать начальную страницу за минимальное количество времени.
Начнем сравнительный анализ поисковых систем с приемов простого поиска. Наиболее популярным способом работы с поисковой системой является подача запроса, состоящего из одного слова.
Выполним такой запрос:
Поисковой системе Rambler потребовалось 8,6 секунд, для выдачи итогового, который состоит из 582870 сайтов, 126533548 документов, из которых новых – 172629.
Ввполним такой же запрос для поисковой системы Yandex:
Поисковая система Yandex проделала всю работу за 2,8 секунды, получился список из 39395 сайтов, 145538998 страниц.
Выполним аналогичный запрос с помощью поисковой системы Апорт.
Получим за 5,4 секунды список из лучших 6049 сайтов, 10000 документов.
При подаче запроса из одного слова быстрее и результативнее работает поисковая система Yandex, затем по скорости получения результата - поисковая система Апорт, а по количеству ссылок - поисковая система Rambler.
Выполним простой запрос для поисковой системы Rambler, добавив уточняющее слово, получим: поисковые системы.
Результат виден через 1,8 секунд, найдено 116110 сайтов, 10015381 документ, из которых новых – 11681. Список найденных страниц удобно организован. Вначале расположены ссылки на страницы, наиболее соответствующие критериям поиска. Наиболее полно удовлетворяют запросу документы, в которых искомые слова часто повторяются и стоят недалеко друг от друга. Кроме того, в кратком фрагменте текста найденного документа выделены обнаруженные слова.
Выполним такой же запрос для поисковой системы Yandex. Можно ввести запрос в поле ввода и установить некоторые параметры запроса с помощью флажков, расположенных на данной странице. Введем запрос и выполним поиск информации:
Для выполнения запроса потребовалось 2,3 секунды, найдено 11821654 страницы, сайтов - 3624. На первой странице видно сколько запросов по данным словам было в течении месяца: поисковые – 588066 запросов, системы – 663525 запросов.
Выполним запрос для поисковой системы Апорт. Особенностью данной системы является то, что в запросах можно использовать слова в любой грамматической форме.
За 5,7 секунд получаем список найденных документов – 17490, сайтов – 3967.
При простом запросе состоящем из двух слов быстрее работает поисковая система Rambler, по результативности к ней присоединяется поисковая система Yandex, а поисковая система Апорт отстает по всем параметрам.
Рассмотрим еще один прием простого поиска - контекстный поиск, для этого применяются кавычки “ ”.
Выполним контекстный поиск для Rambler:
В этом случае поисковая система найдет документы, в которых точно есть текст, который заключен в кавычки.
Для выдачи итогового результата поисковой системе потребовалось 8,4 секунды, найдено 117358 сайтов, 10174106 документов, из них новых 17038.
Выполним контекстный поиск для Yandex, аналогично выполненного поиска для Rambler, результат получен через 2,5 секунд, найдено 3636 сайтов, 11415936 страниц.
Итоги контекстного поиска в поисковой системе Апорт получены через 4,7 секунды, имеем 3989 сайтов, 17695 документов.
При контекстном поиске быстрее всех сработала поисковая система Yandex, но результат поиска по количеству найденных документов лучше у поисковой системы Rambler. Поисковая система Апорт по времени поиска имела средний результат, но очень маленькое количество найденных сайтов.
Кратко остановимся на результатах других возможных приемах поиска. Поиск по заголовкам существенно уменьшает количество возвращаемых ссылок, но очень точно выводит на нужный результат. Рассмотрим результаты поиска по заголовкам.
Поисковая система Rambler:
Скорость выполнения данного поиска 2,6 секунды, найдено 398 сайтов, 4845 документов, новых нет.
Поисковая система Yandex:
Скорость выполнения поиска 1,4 секунд, найдено 145 сайтов, 677 страниц.
Поисковая система Апорт:
Результаты получены 3,5 секунд, найдено 1061 сайт, 5134 документа.
Результат поиска по заголовкам такой, по скорости получения результата впереди поисковая система Yandex, по количеству найденных документов – поисковая система Апорт.
Поиск Web – узлов используется достаточно редко. Команды этого поиска часто применяются для сокращения числа ссылок, возвращенных другими методами и ограничения их одним Web – узлом.
Поисковая система Rambler:
Поиск выполнен за 5,1 секунд, найдено 118723 сайта, 2626757 документов, новых 626.
Поисковая система Yandex результат получила через 1,9 секунд, найдено 1351 сайт, 31445 страниц.
Для получения результата поисковой системе Апорт потребовалось 5,2 секунды, найдено 1061 сайт, 5134 документа.
В итоге получили, что поисковая система Yandex по скорости лучше других, но по количеству документов выигрывает поисковая система Rambler.
При проведении простого поиска в сравниваемых поисковых системах по скорости получения результата лидирует поисковая система Yandex, а по количеству найденных документов лидирует поисковая система Rambler (но, Yandex не отстает).
Информация о работе Анализ технологий поиска информации в WWW