Автор: Пользователь скрыл имя, 30 Мая 2012 в 09:49, контрольная работа
Интернет сегодня – это не только огромное количество компьютеров, но и невероятное количество людей, для которых сеть является принципиально новым способом общения, почти не имеющим аналогов в материальном мире. Человек – существо социальное, и общение с себе подобными – одна из первейших его потребностей. До сих пор еще ни одно техническое изобретение (не считая телефона) не производило такого переворота в этом древнем занятии – общении человека с человеком.
Введение………………………………………………………………….3
1. Развитие поисковых систем…………………………………………..5
1.1. Задачи поиска………………………………………………………..8
1.2. Каталог и метапоисковая машина………………………………...11
2. Принцип работы поисковых систем………………………………..15
2.1. Популярные и необычные поисковые системы………………….16
2.2. Характеристики поисковых систем……………………………....18
Заключение……………………………………………………………...21
Список используемой литературы…………………………………….22
Отличие каталогов от поисковых систем заключается в том, что каталоги не посылают никаких роботов, чтобы индексировать вашу страницу или веб-сайт. Наиболее известным каталогом является Yahoo.com. Для регистрации в каталоге вам необходимо найти раздел, в который вы хотите поместить свою страницу, послать краткое описание сайта и список ключевых слов для поиска вашей страницы в каталоге. Затем эта информация просматривается и оценивается людьми, которые решают, стоит ли включать ваш информацию в каталог или нет. Поисковые системы используют для индексирования сайтов так называемых "поисковых роботов", спайдеров (от английского слова "spider", что значит "паук"). Робот - это небольшая программа, которая ходит по ссылкам на сайте и индексирует (собирает и запоминает) встреченную на пути информацию.
Принцип работы поисковых роботов приблизительно следующий: вы предоставляете поисковой системе точный адрес страницы, которую нужно зарегистрировать. Поисковая система проверяет, существует ли по этому адресу страница, и если да, то страничка вносится в "график посещения". Между временем, когда вы зарегистрировали страницу в поисковой системе и временем, когда вашу страничку посетит поисковый робот может пройти от нескольких минут до нескольких недель. Так что не спешите сразу же проверять наличие вашей страницы или сайта в поисковой системе.
Метапоисковая система. Обратите внимание на то, что различные поисковые системы описывают разное количество источников информации в Интернет. Поэтому нельзя ограничиваться поиском только в одной из указанных поисковых системах. Теперь познакомимся с инструментами поиска, которые не формируют собственный индекс, но умеют использовать возможности других поисковых систем. Это метапоисковые системы (поисковые службы) - системы, способные послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.
Преимущества мета поиска. Лучшие стороны многих ведущих поисковых систем. Базы данных традиционных поисковиков. Мета поиск может сделать сайт более заметным для пользователей. Его преимущество - в том, что в рамках одного поиска используются лучшие стороны многих ведущих поисковых систем, таких, к примеру, как Google, Yahoo! и AllTheWeb. Вы не сможете включить ваш сайт в индекс мета поисковых систем: у них просто нет своих баз данных. Вам нужно сперва правильно зарегистрироваться в обычных поисковых системах, а мета поисковики используют их результаты поиска при обработке своих запросов.
До недавнего времени каждая отдельная традиционная поисковая система индексировала несравненно меньший объем данных, чем тот, который учитывался при осуществлении мета поиска. Сейчас, с появлением поисковиков с (глубокой индексацией Web; Google, AllTheWeb и других), ситуация постепенно меняется.
Но все же используя мета поисковые системы вы существенно расширяете зону поиска, так как они опрашивают множество баз данных.
Большинство поисковых систем перешло
на четырехэтапную структуру работы.
Первые три этапа почти для
всех поисковых систем одинаковы. Сначала
поисковая система индексирует (собирает)
информацию и заносит их в базу
данных, потом, с учетом морфологии,
разрезает все слова страниц
на составляющие. Если человек обращается
к поисковому процессору, то в действие
вступает третий и четвертый этапы
работы поисковой системы, она выбирает
из базы абсолютно все документы,
соответствующие данному
Такая выборка, на основе многих параметров, называется ранжированием результатов поиска. Первые механизмы ранжирования документов строились на основе точности вхождения самого текста в поисковый запрос. Но это оказалось неактуальным, потому что степень вхождения поисковой фразы, расположение ее в теле документа или список ключевых слов не давал полного представления о документе.
Самый известный класс формул для вычисления веса документа по отношению к запросу называется TF*IDF. TF*IDF - численная мера соответствия слова и документа; она тем больше, чем относительно чаще (TF - частота термина в документе) слово встретилось в документе и относительно реже (IDF - редкость слова; величина, обратная частоте слова в коллекции) в коллекции. Именно механизмы ранжирования отличают поисковые системы одну от другой. Сейчас каждая поисковая система старается предложить свои механизмы ранжирования документов, чтобы занять лидирующее положение на поисковом рынке. Во многих поисковых системах на результаты поиска влияет около 200-300 факторов, которые тщательно скрываются от конкурентов. Именно они (совместно со скоростью индексации и объемами указателей) и помогли в свое время Гуглу опередить некогда лидирующую АльтаВисту.
Качество результатов поиска мета поисковыми системами напрямую зависит от качества поиска традиционных поисковиков. Но возможности мета поисковиков постоянно расширяются, они становятся более популярными, и, соответственно, будет расти число их пользователей. Согласно исследованию, в октябре 2001 года 23,4 миллиона уникальных посетителей использовали мета поисковые системы при поиске информации в сети.
2. Принцип работы поисковых систем
Поисковая система - веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на серверах, товары в интернет-магазинах, а также информацию в группах новостей.
В большинстве случаев
Основатели и разработчики первых поисковых систем воспользовались методом поиска книг в библиотеках. Они создали тематические каталоги, в категориях которых и располагались нужные сайты. Человек заходил в каталог, выбирал нужную рубрику и получал несколько сайтов по тематике, к ней относящихся. По началу, когда сайтов было не много, все было прекрасно, а потом стало все сложней и сложней отыскать нужный ресурс. Рубрик становилось все больше и больше, вложенность категорий все росла и росла. В конце концов приходилось проделывать путь в множество подкатегорий, а если в какой-то категории «свернуть» не туда, то можно было просто ничего не найти.
Потом постепенно все поисковые системы начали переходить на «поисковые указатели». В отличие от каталогов, поисковые указатели формируют связки «Запрос - ответ», и к «ответам» могли приписываться несколько разных ресурсов. Но впоследствии выяснилось, что это трудно не только для людей, но и для поисковых машин, потому что на любой распространенный запрос «высыпались» сотни тысяч ответов, в которых просто невозможно было разобраться. И именно поэтому возможность выбора поисковиком из этой «горы» информации полезных двадцати-тридцати ссылок и стала определяющей на поисковом рынке.
Как правило, основной частью поисковой системы является поисковая машина (поисковый движок) - комплекс программ, обеспечивающий функциональность поисковой системы. Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, то есть уместность результата), полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами. В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Поисковые системы обычно состоят из трех компонентов:
Всеязычные:
Англоязычные и международные: AskJeeves (механизм Teoma).
Рейтинг российских поисковых систем. Основные поисковые системы:
Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм - так Mail.ru и QIP.ru используют поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
2.2 Характеристики поисковых систем
Для того, чтобы правильно оптимизировать страницы, необходимо знать, что любят поисковые системы. В этом разделе приведены данные о каждой поисковой системе в отдельности, а также в общем виде.
Описания и характеристики русскоязычных поисковых систем: Яндекс, Рамблер, Апорт.
Сейчас в Рунете существует три основные поисковые системы, это:
В этом списке они расположены их по степени популярности, а не по качеству поиска. Но, проблема качества поиска, это уже тема, требующая отдельного раздела. А здесь же, вы сможете найти описания и характеристики русскоязычных поисковых систем.
Ниже приведем сводную таблицу некоторых характеристик.
Особенности поисковых систем. В
работе поисковый процесс представлен
четырьмя стадиями: формулировка (происходит
до начала поиска); действие (начинающийся
поиск); обзор результатов (результат,
который пользователь видит после
поиска); и усовершенствование (после
обзора результатов и перед
Информация о работе Информационно-поисковые технологии и системы