Поисковые системы

Автор: Пользователь скрыл имя, 30 Ноября 2011 в 14:52, реферат

Описание работы

Всемирная сеть очень важна и полезна практически для любого! Каждый пользователь Интернета может найти в нем массу разнообразной и интереснейшей информации, а также использовать все богатейшие возможности сети. Для меня решающими обстоятельствами в выборе темы «Обзор современных поисковых систем в интернете», для своей квалификационной работы, стала во-первых достаточная известность мне этой темы, в силу частого посещения мной всемирной сети, а также актуальность темы на сегодняшний день. Ресурсы Интернета давно перестали быть просто игрушкой, превратившись в незаменимый инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему.

Работа содержит 1 файл

Документ Microsoft Word (3).doc

— 1.80 Мб (Скачать)

     Введение

 

     Всемирная сеть очень важна и полезна  практически для любого! Каждый пользователь Интернета может найти в нем  массу разнообразной и интереснейшей  информации, а также использовать все богатейшие возможности сети. Для меня решающими обстоятельствами в выборе темы «Обзор современных поисковых систем в интернете», для своей квалификационной работы, стала во-первых достаточная известность мне этой темы, в силу частого посещения мной всемирной сети, а также актуальность темы на сегодняшний день. Ресурсы Интернета давно перестали быть просто игрушкой, превратившись в незаменимый инструмент для повседневной работы людей многих профессий. Быстрый рост информации в сети сделали его океаном разнообразнейших данных, важность которых растет пропорционально их объему. По оценке экспертов объем информации, передаваемой по каналам Интернет, удваивается каждые полгода. Ежедневно в сети появляются миллионы новых документов, и естественно, что без систем поиска они в подавляющем своем большинстве остались бы не востребованными, вообще не были бы не кем найдены, и все то огромное количество информации оказалось бы никому не нужным. Возникла необходимость создания таких средств, которые позволили бы легко ориентироваться в информационных ресурсах глобальных сетей, быстро и надежно находить нужные сведения. В интернете появились специальные поисковые средства. Еще несколько лет назад бытовало такое  мнение: в Интернете есть все, но найти там ничего невозможно. Однако с появлением и быстрым развитием  поисковых каталогов, поисковых машин, и всевозможных поисковых программ ситуация изменилась, и теперь в Сети срочно понадобившуюся информацию иногда можно найти быстрее, чем в книге, лежащей на столе.

     Наиболее  популярным и используемым способом поиска в Интернете является использование поисковых систем. Что же такое поисковая система? Поисковая система – портал, осуществляющий поиск, сбор и сортировку информации в сети Интернет. Поисковые системы это инструмент, позволяющий пользователю глобальной сети в кратчайшие сроки найти интересующую его информацию.

     Первоочередная  задача любой поисковой системы  – доставлять людям именно ту информацию, которую они ищут. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     1. Краткая история развития поисковых систем

 

     Одним из первых способов организации доступа  к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет.  
Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время. Причина этого очень проста – даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.

     Первой  полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году.

     В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет.

     В 1997 году Сергей Брин и Лари Пейдж  создали Google самую популярную на сегодняшний момент поисковую систему в мире.

     23 сентября 1997 года была официально  анонсирована поисковая система  Yandex, самая популярная в русскоязычной части Интернет.

     В настоящее время существует 3 основных международных поисковых системы  – Google, Yahoo и MSN Search, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих можно насчитать очень много) использует в том или ином виде результаты 3 перечисленных. Например, поиск AOL (search.aol.com) и Mail.ru используют базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

     2. Рейтинг основных мировых поисковых систем

 

     По  данным сайта http://marketshare.hitslink.com в 2011 году доминирующие место в рейтинге стабильно занимает компания Google.  

     Рисунок 1. Рейтинг основных мировых поисковых  систем

     3.Google

     Рисунок 2. Поисковая система  Google.

 

     Лидер поисковых машин Интернета, Google занимает более 80 % мирового рынка, а значит, шесть из десяти находящихся в сети людей обращаются к его странице в поисках информации в Интернете. Сейчас регистрирует ежедневно около 50 миллионов поисковых запросов и индексирует более 8 миллиардов веб-страниц.

     Была  разработана в 1998 выпускниками Стэндфордского университета Сергеем Брином  и  Лари Пейджем, которые применили для ранжирования документов технологию PageRank, где одним из ключевых моментов является определение "авторитетности" конкретного документа на основе информации о документах, ссылающихся на него. Говоря общими словами, чем больше документов ссылается на данный документ и чем они авторитетнее, тем более авторитетным данный документ становится. Количественное значение авторитетности документа (другими словами, взвешенное количество ссылок или PageRank) относится к так называемым статическим факторам (то есть независящим от конкретного запроса) и учитывается при определении релевантности документа конкретному запросу как весовой коэффициент. Наряду с этим Google применил для определения релевантности документа не только текст самого документа, но и текст ссылок на него. Эта технология позволила ему обеспечить выдачу довольно релевантных результатов на фоне других поисковиков. Довольно быстро Google стал лидировать в различных опросах по такому показателю, как удовлетворенность пользователей результатами поиска.

     Google осуществляет поиск по документам  на более чем 35 языках, в том  числе русском. В настоящее  время многие порталы и специализированные  сайты предоставляют услуги поиска  информации в Интернете на  базе Google, что делает задачу успешного  позиционирования сайтов в Google еще более важной. Google проводит переиндексацию своей поисковой базы примерно раз в четыре недели. Во время этого усовершенствования, неофициально называемого Google dance, происходит обновление базы на основе информации, собранной роботами за время, прошедшее с предыдущего усовершенствования, и перерасчет значений PageRank документов. Также существует определенное количество документов с достаточно большим значением PageRank, информация о которых в поисковой базе обновляется ежедневно, однако значение PageRank пересчитывается только во время Google dance. Нормированное значение PageRank для конкретного документа, загруженного в браузер, можно узнать, скачав и установив Google ToolBar - специальную панель инструментов для работы с этим поисковиком. Не смотря на то, что в поисковике имеется форма для бесплатного добавления страницы в базу, Google предпочитает сам находить новые документы по ссылкам с уже известных и не будет индексировать добавленную через форму страницу, если в его базе не найдется ни одной страницы, ссылающейся на нее. 
 

     3.1 Статистика запросов Google

 

       Статистика запросов — информация  об обращениях пользователей  к поисковой системе по «ключевым  словам». В большинстве случаев  при работе с сервисом статистики имеется возможность отсеивать результаты по географии или даже по отдельно взятому языку, а иногда и по месяцам. При этом, обычно, сервис показывает не только данные об искомом запросе, но также и о словосочетаниях, синонимах и близких темах («ищут также»).

     Статистика  поисковых систем — предмет профессионального  интереса самых разных групп пользователей, но, прежде всего, она может быть полезна для рекламодателей, создателей интернет-ресурсов и лингвистов.

     Потенциальному  рекламодателю она позволяет  подобрать наиболее заинтересованных клиентов путём выбора наиболее релевантных продаваемому товару или услуге поисковых запросов. Благодаря этому, контекстная реклама в поисковых системах на сегодня является одним из самых дешёвых и эффективных видов продвижения товаров и услуг, поскольку не приходится переплачивать за нетематического читателя, как это зачастую происходит при рекламе в традиционных СМИ (телевидении и газетах), где аудитория, как правило, достаточно широка и разнообразна, и не представляется возможным сфокусироваться лишь на нужном её сегменте.

     Статистика  поисковых систем также входит в  обязательный набор инструментов, используемых профессиональными вебмастерами и  редакторами сайтов, и является неотъемлемым элементом т. н. «белой оптимизации», которая, в отличие от «чёрной оптимизации», не старается использовать несовершенство поисковиков, а ставит своей целью увеличить посещаемость интернет-ресурса за счёт приближения к реальным потребностям среднего пользователя или отдельной группы потребителей информации, товаров или услуг. 

     Для языковедов статистика запросов фактически представляет из себя корпус языка, зачастую позволяющий проводить исследования, которые невозможно провести никаким  другим способом. Так, к примеру, подобного  рода статистика является наиболее доступным источником современного языка, в отличие от анализа поисковых результатов, результаты которого могут лишь приблизительно говорить о текущем словоупотреблении, в силу того, что в интернете сосуществуют тексты самой различной степени древности, в том числе и прошлого, и позапрошлого веков. Кроме того, корпус запросов к поисковой системе считается одним из наиболее репрезентативных источников живого языка.

     Рисунок 3. Статистика поиска Google по слову «yahoo».

     3.2 Google сервисы и продукты.

     Сервисы и продукты.

  • Google Advanced Search – поисковик с расширенными параметрами поиска.
  • Google Suggest – вводите поисковое слово, а Google Suggest пытается на лету догадаться, что вы хотите найти.
  • Google Personalized Search – настройка поисковой страницы под свои нужды.
  • Google Search History – хранит историю всех ваших поисковых фраз.
  • Google Blog search – технолония базирующая на поиске по блогам.
  • Blogger Blog Search – поиск информации по блогам.
  • Google Directory – поиск информации организованных по категориям.
  • Google Alerts – посылает автоматически e-mail, когда появилась новая информация по вашим поисковым словам.
 

     Специальный поисковики:

  • Google Video – поиск по телевизионным программам и видео.
  • Google Image Search – поиск картинок/фотографий.
  • Google Music Search – поиск музыки.
  • Google Book Search – поиск по библиотекам.
  • Google Catalogs – помогает найти нужный товар.
  • Froogle – поиск по магазинам.
  • Google News – поиск по новостям из более 4,500 источников.
  • Google Scholar – поиск по учебным заведениям.
  • Google Maps – географические карты, поиск маршрута и расположение зданий.
  • Google Public Service Search – предлагает учебным и некоммерческим организациям бесплатный поиск по их сайту.
  • Google’s University Search – позволяет искать информацию на школьных сайтах.
  • Google Ride Finder – поиск такси и автобусов
  • Google Base – гигантская база данных. Поиск по типам информации.
  • Google Finance – все о финансах.
 

     Тематический  поиск:

  • Google’s Special Searches – тематические поиски.
  • Google Apple/Macintosh Search – поиск Apple/Macintosh сайты и информацию.
  • Google Microsoft Search – поиск информации, связанной с Microsoft.
  • Google Linux Search – поиск информации, связанной с Linux.
  • Google U.S. Government Search – поиск по всем правительственным и военным сайта США.
  • BSD Unix – поиск информации, связанной с BSD.

Информация о работе Поисковые системы