Автор: Пользователь скрыл имя, 05 Декабря 2010 в 20:48, курсовая работа
Целью курсовой работы является изучение особенностей поиска информации в Интернет в разных поисковых системах и каталогах по разным типам запросов.
Для достижения поставленной цели в работе ставятся следующие задачи:
◦обозначить основные теоретические аспекты, связанные с понятием Интернет
◦рассмотреть популярные поисковые системы и каталоги
◦изучить основные способы поиска информации в Интернет
◦научиться формировать простые и расширенные запросы на поиск
◦сопоставить полученные данные по разным типам запросов
ВВЕДЕНИЕ 5
1 ИНТЕРНЕТ И ПРОБЛЕМЫ ПОИСКА ИНФОРМАЦИИ 6
2 ОСНОВНЫЕ СИСТЕМЫ И СРЕДСТВА ПОИСКА ИНФОРМАЦИИ 9
2.1 Поисковая система 9
2.2 Специализированные поисковые службы 10
2.3 Метапоискавая система 11
3 ПОПУЛЯРНЫЕ ПОСКОВЫЕ СИСТЕМЫ И КАТАЛОГИ 13
3.1 Международные поисковые системы и каталоги 13
3.2 Российские поисковые службы 18
3.3 Белорусские поисковые службы 22
4 ФОРМИРОВАНИЕ ЗАПРОСА НА ПОИСК 27
4.1 Приёмы поиска информации 27
4.2 Простой запрос 28
4.3 Расширенный запрос 30
ЗАКЛЮЧЕНИЕ 33
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 34
ПРИЛОЖЕНИЕ 1 Анализ в Excel результатов поиска в разных поисковых системах и каталогах по разным типам запросов 35
Простой запрос: "Где можно купить Longman?" 35
Расширенный запрос: "Где можно купить Longman/Muller?" 36
ПРИЛОЖЕНИЕ 2 Тест 37
ПРИЛОЖЕНИЕ 3 Презентация темы в MC PowerPoint 42
СОДЕРЖАНИЕ
Одним из основных способов найти информацию в Интернет являются поисковые машины или поисковые сервера, на которых расположено специальное программное обеспечение для осуществления поиска.
Производится поиск прежде всего в пространстве web-страниц. Однако, кроме него можно производить поиск интересующих вас теленовостей, адресов электронной почты и даже поиск людей. Последние службы используют различные источники: от телефонных справочников до регистрационных списков пользователей разных служб. Отдельные машины производят поиск файлов.
Механизм поиска каждой машины-поисковика представляет собой ноу-хау фирмы. В основном это индексированные базы данных. Но темпы роста числа web- и других документов в сети опережают скорость, с которой обновляются и пополняются базы данных.
Целью курсовой работы является изучение особенностей поиска информации в Интернет в разных поисковых системах и каталогах по разным типам запросов.
Для достижения поставленной цели в работе ставятся следующие задачи:
Мы живём в мире, в котором информационные технологии занимают одну из главных ролей человеческой жизни. С каждым днём всё больше и больше людей пользуются интернетом, где невозможно обойтись без поиска информации. Именно поэтому проблема поиска в Интернет является актуальной. От правильности сформированного запроса зависит результат поиска. Поэтому так важно научиться составлять запрос грамотно и корректно.
Интернет – самая большая компьютерная сеть в мире, объединяющая многочисленные компьютерные сети по всему земному шару для обмена информацией между ними.
В настоящее время Интернет объединяет более 150 тысяч компьютерных сетей. Общее количество компьютеров, подключённых к интернет, превышает 30 миллионов. Услуги интернет используют сегодня более 120 миллионов человек в 170 странах мира [1].
Рассматривая интернет с функциональной точки зрения, можно дать ещё одно определение: Интернет представляет собой недорогое быстродействующее средство общения с абонентами по всему миру, не имеющая аналогов хранилище информации по любым областям знаний; новую перспективную среду для деловой деятельности.
Адрес в интернет – это адрес сервера в системе World Wide Web (WWW) – «всемирная паутина».
WWW – это глобальная система для работы с информацией в гипермедиа виде. Под гипермедиа понимается объединение текстовой и мультимедиа информации (графика, звук, видео). Гипермедиа документ содержит выделенные элементы, которые являются ссылками на отдельные части документа или другие гипермедиа документы, в том числе и расположенные на различных компьютерах системы WWW [1]
Для поиска информации в Сети используются специальные поисковые службы. Обычно поисковая служба — это компания, имеющая свой сервер, на котором работает некая поисковая система. Услуги абсолютного большинства поисковых служб бесплатны, но, тем не менее, по темпам роста сегодня это самый эффективный бизнес в мире. Всего за несколько лет такие службы как Yahoo!, Alta Vista, Inktomi и некоторые другие развились от лабораторных проектов с бюджетом в десяток-другой тысяч долларов до компаний, стоимость которых составляет 10-15 миллиардов долларов. Такого темпа приращения капитала мир еще не знал, особенно для бесплатных (для конечного пользователя) услуг [2].
Существует ряд проблем, которые могут возникнуть во время поиска информации в интернет. Одной из самых распространенных – является некорректный запрос.
Первая ловушка связана с тем, как поисковая система трактует группы слов, введённые через пробел. Допустим, мы хотим разыскать Web-страницы, на которых что-то говорится об операционной системе Microsoft Windows. Логично внести в поле поиска слова Microsoft Windows и ждать результата. Но результат может быть обескураживающим. Одни поисковые системы понимают такую запись как Microsoft И Windows – они дают нам то, что мы ищем. Другие могут понимать эту запись как Microsoft ИЛИ Windows – тогда будут разысканы все Web-страницы, на которых встречается либо первое слово, либо второе, либо оба вместе. Нас, конечно, интересуют только те страницы, на которых оба слова встречаются вместе, но их будет практически невозможно найти среди прочих, не нужных нам страниц.
Например, система Alta Vista по умолчанию считает, что ключевые слова связаны соотношением ИЛИ. Но если вам надо разыскать документы, в которых одновременно содержится как первое, так и второе слово, то перед каждым из них следует поставить знак плюс: +Microsoft +Windows.
Все основные поисковые системы по умолчанию между словами ставят оператор И, хотя у системы «Яндекс» есть свои особенности. Там считается, что эти два слова должны одновременно присутствовать не в документе, а в одном предложении. Если достаточно, чтобы они присутствовали в документе, перед каждым словом надо поставить знак «+», как в системе Alta Vista.
Роль прописных букв. Возможно, вас удивит, что «хлеб» = «ХЛЕБ», но «ХЛЕБ» не равно «хлеб». Именно так и обстоит дело в большинстве поисковых систем. Общее правило такое: если клиент ввёл строчные символы, то разыскиваются как строчные, так и прописные символы, но если клиент использовал прописные буквы, то ищется точное совпадение только с прописными буквами.
Однако некоторые поисковые системы имеют отличия. Так, например, в системе «Рамблер» при индексации все прописные буквы принудительно «понижаются до строчных. Это означает, что использовать в запросе прописные буквы в этой системе бесполезно.
Роль зарезервированных слов. Зарезервированные слова – это слова, которые не учитываются при обработке запроса. Во время индексации Web-страниц программа выбрасывает их из текста, что значительно уменьшает размеры указателей и сокращает время поиска. К таким словам обычно относятся неинформативные слова: предлоги, союзы, местоимения, артикли и другие слова малого размера. Так, например, если в системе «Яндекс» задать поиск фразы «Всё смешалось в доме Облонских», то будет также разысканы документы, содержащие: Что смешалось в доме Облонских? и Где смешалось? В доме у Облонских?
В
некоторых системах могут быть зарезервированы
слова, которые встречаются
Особенно важно учитывать роль зарезервированных слов при проведении контекстного поиска. При таком поиске необходимо точное соответствие между тем, что заказал клиент, и тем, что встречается в Web-документах. Если поисковая система на этапе индексации «зачистила» Web-документы от зарезервированных слов, то с контекстным поиском она справиться не может, разве что только «заглянув» в копии Web-страниц, если таковые у неё хранятся, но на это уходит много времени. Поэтому честный контекстный поиск в поисковых системах – большая редкость [3].
Стоит
также заметить, что поиск в
интернет может привести к платным
сайтам, ложным ссылкам, а также не
исключена возможность
Поисковая система – это специально созданная программа, которая позволяет находить, определять и индексировать информацию в Интернете. Некоторые серверы могут иметь свои метапоисковые системы.
Среди наиболее известных поисковых систем можно назвать англоязычные:
Alta Vista (http://www.altavista.com/)
Google (http://www.google.com/)
Yahoo! (http://www.yahoo.com/)
Cреди русскоязычных:
Aport (http://www.aport.com/)
Rambler (http://www.rambler.ru/)
Yandex (http://www.yandex.ru/)
Среди белорусскоязычных:
Tut (http://www.tut.by/)
Open (http://www.open.by/)
Zubr (http://www.zubr.com/)
Далее следуют поисковые машины, расположенные на специализированных серверах. Если вы знаете тему своего поиска и такой специализированный сервер, то поиск становится более продуктивным. Например, существуют серверы, собирающие информацию о трудоустройстве вообще. А есть специализированные сервера, подбирающие информацию только о вакансиях для программистов. Если первые представляют вам несколько десятков ссылок, то вторые – несколько сотен, часто структурированные в списки, в которых легко ориентироваться.
Некоторые серверы могут иметь свои поисковые системы. Они содержат много информации и проводят поиск по своим документам. Наконец, крупный сайт может иметь свой маленький поисковый механизм, который ищет нужные слова на своих страницах [4].
Изначально многие поисковые узлы выполняли роль машин поиска. Они предоставляли возможности автоматического поиска по ключевым словам. Параллельно с ними существовали узлы – каталоги, на которых можно было искать информацию вручную, путешествуя по многочисленным иерархически выстроенным разделам. Поисковые машины, по мере роста своей популярности, расширили набор сервисов, и вместе с функциями поиска стали предлагать каталоги, бесплатную электронную почту, хостинг, рейтинги, чат, новости, журналы, фотографии, анекдоты и почее. Подобные узлы стали называть не просто поисковыми машинами, а порталами.
Портал – узел в Интернете, который вместе с услугами поисковой машины предлагает собственный информационный контент. На таком узле могут предоставляться дополнительные услуги. Порталы содержат, как правило, собственный каталог частопосещаемых ресурсов.
Существуют также каталоги. Каталог – систематизированный набор ссылок на ресурсы в Интернете, составляемый чаще всего вручную. Ссылки сопровождаются описаниями и могут быть снабжены рейтингами. Некоторые каталоги имеют встроенное средство поиска, обеспечивающее быстрый выход на нужную информацию.
В каталоге ссылки размещаются по определённой иерархической системе, которая напоминает системный каталог в обычной библиотеке.
Каталоги существуют не только в составе поисковых машин, но и в виде отдельных узлов [9].
Персональный Интернет-поиск. Система персонального, или пользовательского, интернет-поиска (Custom Search Engine) – это сервис, позволяющий создать и настроить специализированный поисковик, который учитывает в результатах ваши личные предпочтения и тематические интересы, другими словами – контекст поиска. В простейшем случае такой поиск осуществляется по набору указанных пользователем сайтов, более сложные варианты подразумевают тонкую настройку выдачи результатов, автоматическое добавление тематических сайтов в персональный индекс и организацию совместной работы над поисковиком группы единомышленников. Ценой небольшой потери в широте охвата персональный поиск даёт возможность заметно улучшить точность.
В
настоящее время для