Поиск информации в интернете

Автор: Пользователь скрыл имя, 05 Декабря 2010 в 20:48, курсовая работа

Описание работы

Целью курсовой работы является изучение особенностей поиска информации в Интернет в разных поисковых системах и каталогах по разным типам запросов.

Для достижения поставленной цели в работе ставятся следующие задачи:

◦обозначить основные теоретические аспекты, связанные с понятием Интернет
◦рассмотреть популярные поисковые системы и каталоги
◦изучить основные способы поиска информации в Интернет
◦научиться формировать простые и расширенные запросы на поиск
◦сопоставить полученные данные по разным типам запросов

Содержание

ВВЕДЕНИЕ 5
1 ИНТЕРНЕТ И ПРОБЛЕМЫ ПОИСКА ИНФОРМАЦИИ 6
2 ОСНОВНЫЕ СИСТЕМЫ И СРЕДСТВА ПОИСКА ИНФОРМАЦИИ 9
2.1 Поисковая система 9
2.2 Специализированные поисковые службы 10
2.3 Метапоискавая система 11
3 ПОПУЛЯРНЫЕ ПОСКОВЫЕ СИСТЕМЫ И КАТАЛОГИ 13
3.1 Международные поисковые системы и каталоги 13
3.2 Российские поисковые службы 18
3.3 Белорусские поисковые службы 22
4 ФОРМИРОВАНИЕ ЗАПРОСА НА ПОИСК 27
4.1 Приёмы поиска информации 27
4.2 Простой запрос 28
4.3 Расширенный запрос 30
ЗАКЛЮЧЕНИЕ 33
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 34
ПРИЛОЖЕНИЕ 1 Анализ в Excel результатов поиска в разных поисковых системах и каталогах по разным типам запросов 35
Простой запрос: "Где можно купить Longman?" 35
Расширенный запрос: "Где можно купить Longman/Muller?" 36
ПРИЛОЖЕНИЕ 2 Тест 37
ПРИЛОЖЕНИЕ 3 Презентация темы в MC PowerPoint 42

Работа содержит 1 файл

Поиск информации в интернет.doc

— 1.86 Мб (Скачать)

2.2 Специализированные  поисковые службы

     Известно, что даже самые мощные из поисковых  серверов охватывают в лучшем случае не более 15% всей сети. А сеть растёт и растёт. Один из выходов из этого  положения – создание специализированных поисковых служб. Их можно разделить по тем же направлениям, что и классификационные каталоги: Культура и искусство, Бизнес, Наука, Здоровье и медицина. А внутри них могут тоже возникать по мере развития сети свои специализированные службы поиска. И, естественно, нужен будет поисковик по этим службам. Но самое главное – не допускать того, чтобы организовали и возглавили всё это государственные структуры. Тогда застой будет обеспечен. Рынок сам определит, какие поисковики нужны, а какие – нет.

     Если  обратиться к поисковым серверам в области культуры, то самый заметный из них – www.culturefinder.com. Здесь можно заказать билеты на спектакли и представления.

     Для того, чтобы выбрать, смотреть ли спектакль на открытой площадке или в помещении, нужно знать прогноз погоды. Для этого существует поисковый сервер www.weather.com

     Если  погода совсем неважная, то можно устроить концерт на дому: поискать слова песен, а заодно и ноты и спеть самим. Для этого сначала нужно найти на сайте www.lyrics.ch слова песен. На сервере www.song.homepage.ru можно найти тексты песен на русском и их ноты.

     Видеодиски  DVD и видеокассеты можно найти на сервере www.videoseeker.com

     Для тех, кто хочет заработать деньги существует множество поисковых  серверов в области бизнеса. Один из них – www.forworld.com

     На  сервере www.healthfinder.com можно получить информацию о здоровье [5].

2.3 Метапоискавая система

     К метапоисковым системам относится поисковые серверы, которые позволяют производить одновременный поиск сразу по нескольким поисковым системам. Они принимают от пользователя запрос и размещают его сразу на нескольких поисковых серверах. Потом они собирают поступившую от них информацию, обобщают ее, структурируют, рафинируют (очищают) и передают клиенту. Увеличенное время исполнения запроса компенсируется улучшенным качеством результатов поиска.

     Первое  время крупные поисковые системы  спокойно смотрели на существование «под собой» метапоисковых систем. Однако в последнее время в связи с бурным развитием идеи порталов все чаще и чаще встречаются запреты на метапоиск. А если говорить точнее, крупные поисковые системы начали заниматься им сами, привлекая ресурсы коллег на взаимовыгодной основе [2].

     К числу метапоисковых систем относятся:

     www.dogpile.com

     www.37.com

     www.meta360.com

     www.search.com

     www.isleuth.com

     В каком пространстве производится поиск? Прежде всего в пространстве web-страниц. Однако, кроме него можно производить поиск интересующих вас теленовостей, адресов электронной почты и даже поиск людей. Последние службы используют различные источники: от телефонных справочников до регистрационных списков пользователей разных служб. Отдельные машины производят поиск файлов.

     Механизм  поиска каждой машины-поисковика представляет собой ноу-хау фирмы. В основном это индексированные базы данных. Но темпы роста числа web- и других документов в сети опережают скорость, с которой обновляются и пополняются базы данных. До недавнего времени эти базы обновлялись каждой службой самостоятельно, вручную или с помощью программ-пауков. В настоящее время нередки случаи разделения труда, когда поисковые серверы привлекают клиентов бесплатным поиском и собирают деньги с рекламодателей, а базы данных покупают у других специализированных компаний.

     Начинают  применяться и новые, так называемые, интеллектуальные технологии (SMART-технологии). В таких случаях учитывают, например, данные рейтинговых служб. В других для поиска используют векторные методы индексации новых документов и поиска информации в векторном пространстве, которые легко распараллеливаются и выполняются значительно быстрее [6].

     Преимуществом метапоисковых средств является то, что объединяются достоинства  и возможности всех поисковых  машин. Кроме того, пользователю не нужно изучать язык запросов каждого  поискового механизма.

     К недостаткам можно отнести не очень быстрый поиск, т.к. необходимо координировать поступление результатов от нескольких серверов. Проблемы, возникшие на одном из серверов, могут приостановить вывод результатов [9].

3 ПОПУЛЯРНЫЕ ПОСКОВЫЕ СИСТЕМЫ И КАТАЛОГИ

     Поисковая система – это специально созданная программа, которая позволяет находить, определять и индексировать информацию в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Uniset Комплекс программ, обеспечивающий функциональность поисковой системы, называют поисковой машиной. Основными критериями качества работы поисковой машины являются релевантность, полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами.

     Как правило, работа поисковой системы  состоит из двух этапов. Поисковый робот (паук) постоянно обходит сеть и собирает информацию с веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача – список ссылок на документы (веб-страницы), соответствующие запросу [7].

3.1 Международные поисковые системы и каталоги

     AltaVista (http: //www. altavista.com/)

     По  количеству индексированных Web-страниц Alta-Vista – одна из крупнейших (но не самая крупная, как это иногда считается) поисковых систем мира. Огромный объем охвата Web-пространства и мощный набор поисковых команд делают эту систему излюбленным средством поиска для большинства пользователей. Система была запущена в эксплуатацию в декабре 1995 и долгое время считалась молодой, но бурно развивающейся. Для начинающих система имеет упрощенную службу, которая называется Ask Alta Vista. В своей работе эта служба привлекает другую поисковую службу – Ask Jeeves [2].

     К сожалению, сегодня нет никаких  оснований, чтобы пользоваться её услугами. Рано проведя акционирование, Alta Vista сегодня вынуждена больше заботится об интересах акционеров, чем о развитии. Для нас это означает, что индексацию новых ресурсов система тормозит, причём принудительно, а обновлением старых ресурсов не занимается. Её указатели безнадёжно устарели, а изобилие рекламных баннеров на станицах поиска никак не способствует скорости работы (рис. 3.1) [3].

Рис. 3.1 Поисковая система Alta-Vista

     Google (http://www.google.com/)

     Появившись  лишь в конце 1999 года, но очень быстро стал завоёвывать популярность. Его база содержит более 200 миллионов адресов документов Сети. В день Google обрабатывает около 10 миллионов запросов. Алгоритмы его работы включают обработку всех метатегов с учётом веса каждого ключевого слова. В нём применены, вероятно, наиболее совершенные на сегодняшний день алгоритмы установления степени релевантности запрошенным ключевым словам поиска [5].

     Служба  Google известна ещё и тем, что при генерации списка  ссылок в первую очередь выдает ссылки на те Web-страницы, к которым из других документов ведет наибольшее количество ссылок. Это дает очень интересный эффект. На большинстве поисковых систем совершенно бесполезно искать информацию по таким тривиальным словам как Cars (Автомобили), Internet, WWW, Games (Игры). Поиск по этим словам вернет столько ссылок, что среди них невозможно найти самые полезные. Служба Google при проведении поиска по тривиальным словам дает отличные результаты, поскольку руководствуется мнением других пользователей, ранее осуществлявших подобный поиск [2].

     В то же время данный поисковый сервер очень динамичен: задавая один и  тот же набор ключевых слов в течение  недели, и через каждые два-три  дня первые места среди найденных  страниц будут меняться, и это означает, что данный поисковик всё время «работает» с ними. И последнее: Google в большей степени оценивает не относительные, а абсолютные адреса ссылок между различными страницами внутри одного сайта. Так что не стоит лениться, нужно всякий раз писать полный адрес (рис. 3.2) [5].

Рис. 3.2 Поисковая система Google

     Yahoo! (http://www.yahoo.com/)

     Это легенда Интернета и одно из самых  известных имён (brand name). Одно только загадочное для русского уха название уже вызывает интерес и споры то ли это крик североамериканских индейцев, заплутавших в лабиринтах Интернета, то ли ещё что-нибудь необычное [6].

     Yahoo! – одна из старейших и наиболее популярных поисковых служб. Её каталог был запущен в эксплуатацию еще в 1994 году аспирантами Стэндфорского университета. Секрет успеха Yahoo! – в человеческом факторе. На службу работают около 150 редакторов, неустанно улучшающих и пополняющих множество тематических разделов огромного каталога. Пользователи могут самостоятельно в присылать сведенья о своих web-страницах для регистрации. В каталоге содержатся данные по одному миллиону Web-узлов. Если поиск по собственному каталогу не дает результата, привлекаются ресурсы поискового указателя Inktomi и Alta Vista [2].

     Из  особенностей заметим, что, пользуясь  командами + - простого списка, Yahoo! не поддерживает операторы and, or ( ), near. В соответствии с последними внесениями Yahoo! превращается в портал, предоставляя другие услуги с основной страницы (рис.3.3) [6].

Рис. 3.3 Поисковая система Yahoo!

     Fast Search (http://www.alltheweb.com/)

     Эта система, принадлежащая норвежской компании, ранее называлась All The Web. Несмотря на то, что она была запущена совсем недавно (в мае 1999 года.), перед ней ставится задача обогнать конкурентов в полноте коллекций ссылкой на Web-страницы [2].

     Создатели системы поставили перед ней  глобальную цель – создать самый  крупный и самый быстрый указатель в мире. Эта цель была достигнута в считанные месяцы. Система первой взяла 300-миллионный рубеж всего через четыре месяца после начала работы, а в 2000 году приблизилась к отметке 600 миллионов Web-страниц [3].

     Такая скорость формирования каталогов позволяет предположить, что система использует новые технологии обработки данных. Объём данных столь велик, что каждый главный каталог обслуживает своя поисковая система [6]. При этом скорость поиска системы составляет доли секунды и нет никакой рекламы (рис.3.4) [3].

Рис. 3.4 Поисковая система Fast Search

     Northern Light (http://www.northernlight.com/)

     Начал работать с 1997 года. Имеет базу данных, содержащую 150 миллионов адресов и охватывает 16% содержимого всей сети. По сравнению с другими поисковыми серверами, он осуществляет самые мягкие методы борьбы со спамом, т.е. он очень доверчив [5].

     Имеет приличный указатель, приближающийся к 300 миллионам Wеb-страниц, и предпринимает заметные усилия по поддерживанию его актуальности. Эта система идеальна для проведения научных исследований благодаря тому, что сочетает индексацию и каталогизацию. После поиска по ключевым словам, система не только выдаёт обширные списки ссылок на найденные ресурсы, но и формирует набор папок, в которых результаты поиска располагаются по отдельным категориям. Кроме того, в системе есть специальный раздел каталожного типа, который называется Special Editions. Он ведётся вручную, и в нём можно найти готовые подборки материалов по актуальным проблемам.

Информация о работе Поиск информации в интернете