Интернет в профессиональной информационной деятельности

Автор: Пользователь скрыл имя, 04 Ноября 2012 в 15:55, реферат

Описание работы

С технической точки зрения, Интернет сегодня представляет собой миллионы находящихся в разных частях планеты компьютеров, которые связаны друг с другом волоконно-оптическими, спутниковыми или телефонными каналами. У Сети нет единого центра и единой администрации. Общую координацию его деятельности осуществляют международные организации, членами которых являются наиболее авторитетные эксперты из разных стран. Так, например, Internet Research Task Force занимается проблемами развития семейства протоколов TCP/IP, Internet

Содержание

История и принципы организации глобальных компьютерных сетей
Технологическая основа Интернет…………………………………………3
Основные приложения Интернет………………………………………..….5
Система адресации в Интернет………………………………………..……7
Программное обеспечение………………………………………………....11
2. Профессиональный поиск информации в Интернет
2.1. Глобальные справочники ресурсов и поисковые системы……….………15
2.2. Российские справочники и поисковые системы………………..…………25
2.3. Стратегия и методика профессионального информационного поиска….31
3. Справочные и библиографические ресурсы Интернет
3.1. Справочные и библиографические ресурсы Интернет………………...…34
3.2. Библиографические ресурсы Интернет……………………………………40
3.3. Особенности библиографических разысканий в Интернет………………43
Литература………………………………………………………………………….…47

Работа содержит 1 файл

Referat.doc

— 224.00 Кб (Скачать)

Пользоваться мета-поисковыми системами  рекомендуется для выполнения запросов, связанных с поиском очень  простых, и, предположительно, крайне редко встречающихся в Сети предметах (лекарственных препаратах, химических элементах, редких сочетаниях имен собственных и т.п.). В этом случае результаты поиска сразу же дают представление о том, насколько широко данные ключевые слова (объекты) встречаются в Сети. Другой причиной обращения к мета-поиску является крайний недостаток времени. Однако, поскольку мета-поисковые средства очень часто не в состоянии корректно обработать запрос для различных поисковых систем и правильно совместить полученные из разных источников результаты, их использование не рекомендуется при выполнении сложных запросов. Поисковые предписания, включающие несколько словосочетаний с указанием расстояния между терминами и тому подобными условиями, заведомо не могут принести правильный ответ. Развернутый список мета-поисковых систем можно получить в Русской справочной библиотеке (http://www.openweb.ru/stepanov/library/gsengine.htm).

 

2.2. Российские справочники и поисковые системы

Российские справочники  ресурсов Интернет

 В большинстве стран  мира существует множество собственных  справочников ресурсов, которые  гораздо полнее отражают национальный  информационный массив, нежели глобальные  каталоги. В России на сегодняшний день существует несколько подобных источников, ни один из которых пока не отличается высоким качеством.

 

Апорт (справочник) (http://aport.ru)

 В настоящее время  является единственным профессионально  поддерживаемым отечественным справочником Интернет-ресурсов. Данный каталог выступает ключевой составной частью одноименного портала, включающего также поисковую систему, характеристики которой рассмотрены в соответствующем разделе.

Справочник имеет многоуровневую иерархическую структуру, отличающуюся достаточной логичностью и продуманностью. Ее полный вид можно получить, щелкнув по пункту верхнего меню "Все рубрики". Наполнение разделов, однако, производится далеко не всегда корректно (например, среди массовых библиотек указаны РГБ и РНБ, а также национальные библиотеки Британии, Франции, Испании, Литвы и Казахстана). Создатели каталога не выработали четкой политики в отражении материалов: в Апорт учитываются не только российские или содержательно относящиеся к России ресурсы, но и полностью иноязычные зарубежные ресурсы, причина включения которых абсолютно непонятна.

Каждая ссылка справочника  снабжена аннотацией, дающей предварительное  представление о содержимом сервера. Также сообщается его географическое местонахождение, указывается "индекс цитирования", рассчитываемый на основании числа ссылок на данную страницу с других сайтов, и "лига" (этот параметр определяет в большей степени качество дизайна).

К сервисным функциям Апорт относится возможность  сортировки ссылок в рубриках по дате поступления, в алфавите названий, по индексу цитирования или лиге. Справочник обладает хорошей возможностью непосредственного поиска, который можно осуществлять как в справочнике в целом, так и в отдельных его разделах.

Апорт наиболее эффективен при поиске серверов российских учреждений, а также для выявления перечней сайтов однородных объектов, имеющих разные названия: например, сайты известных футболистов, сборники кулинарных рецептов, расписания авиарейсов, списки кадровых агентств, коллекции географических карт и т.п.

К числу главных недостатков  справочника Апорт относится  низкая скорость актуализации сведений. В ряде случаев до четверти ссылок из разделов уже устарели.

Все прочие российские каталоги ресурсов Интернет демонстрируют еще  менее качественный уровень работы. К числу справочников, в которых иногда можно обнаружить интересные сведения, относятся List.ru (list.mail.ru), Weblist (Weblist.ru или www.yahoo.ru), Улитка (www.ulitka.ru), Иван Сусанин (www.susanin.net). К их общим недостаткам относятся отсутствие четких подходов в отборе материалов, серьезные ошибки в систематизации данных, запаздывание в отражении источников, низкий уровень аннотаций. Причинами этого является то, что справочники наполняются непрофессионалами, работа которых ни кем не редактируется. Зачастую наполнение производится исключительно путем самостоятельного ввода данных создателями сайтов, что, естественно, не гарантирует даже минимальный качественный уровень представленных материалов. Создание и поддержание в актуальном состоянии качественных справочников ресурсов Интернет требует серьезных инвестиций, которых в России пока еще нет.

 

Российские поисковые  системы

 Поисковые системы  глобального масштаба свое основное  внимание концентрируют на зарубежных  ресурсах Сети. Задачу поиска  информации на серверах в пределах отдельных стран выполняют локальные машины, специально адаптированные к особенностям конкретных языков. Подобные поисковые средства существуют и в России. Все они специально предназначены для работы с русскоязычными документами и обладают мощным морфологическим аппаратом. К лидирующей группе российских поисковых средств в настоящее время относятся Яндекс, Rambler и Апорт.

 

Яндекс (http://www.yandex.ru или www.ya.ru)

 Запущен в сентябре 1997 года. В настоящее время - признанный лидер российского поискового сервиса. Демонстрирует высокие показатели, как по объему проиндексированных документов, так и по релевантности поиска. На начало августа 2004 года Яндексом проиндексировано свыше 1 миллиона 150 тысяч российских и зарубежных русскоязычных серверов, а также серверов на территории СНГ (всего учтено пордка 180 миллионов оригинальных документов). Актуализация базы осуществляется еженедельно. Кроме того, Яндекс - пока единственная российская поисковая система, индексирующая документы в форматах PDF, RTF и DOC.

Интерфейс максимально  прост - состоит из единственной строки ввода. За счет встроенной системы морфологической  обработки терминов Яндекс приспособлен для формирования запросов на естественном русском языке. Мощнейшая лингвистика позволяет учесть практически все возможные оттенки употребления ключевых слов и составить поисковое предписание в высшей степени широко, охватив все возможные сочетания терминов. В процессе обработки запроса поисковый механизм самостоятельно производит расширения, исключает стоп-слова, анализирует расстояние терминов друг от друга и пр. Типичный запрос в этом случае задается путем ввода отдельных терминов или целой фразы в поисковую строку.

Для формирования более  точного запроса целесообразно  обратиться к "Расширенному поиску" (пункт в нижней части титульной страницы). С помощью структурированного меню можно легко задать ограничения по различным сочетаниям ключевых слов, местоположению термина в документе, времени и языку публикации, месте на сайте.

Максимально детализированный запрос можно создать также и в простой форме с использованием языка запросов Яндекс, который включает множество специальных символов: ~,&,,/,"",,(),|,$, #. Их употребление подробно описано в файле "Синтаксис языка запросов" (http://www.yandex.ru/info/syntax.html). Снабженные этими символами ключевые слова, вводятся в ту же поисковую строку, что и в первом случае.

Безусловным достоинством Яндекс является модуль ранжирования результатов поиска. В его основе лежит алгоритм анализа местоположения и повторяемости термина в документе и анализ внешних ссылок на страницу. Система производит группировку найденных страниц по сайтам на этапе формирования списка результатов и выдает по одному документу с сервера, который, по ее мнению, наиболее соответствует запросу. При этом в ссылке указывается общее число документов с данного сервера, также содержащих искомый термин. Яндекс показывает найденные термины в окружающем словарном контексте, что позволяет сразу же установить степень соответствия найденного документа информационной потребности пользователя.

Среди сервисных функций  Яндекс поиск в новостях, собственном  каталоге ресурсов Интернет и перечне  товаров из электронных магазинов, включая книжные магазины.

 

Rambler (http://www.rambler.ru)

 Запущен в октябре 1996 года и изначально предназначался для выявления материалов на серверах в пределах бывшего СССР. К началу нового тысячелетия Rambler на время утратил лидирующие позиции, устарев практически по всем показателям. Однако проведенная в декабре 2002 коренная модернизации всей программно-аппаратной части позволила поисковой системе вновь обрести былой авторитет. По результатам тестов, Rambler занимает второе место после Яндекса по величине базы данных (ее объем на начало августа 2004 года составляет порядка 113 миллионов страниц). Производительность поискового робота декларируется в объеме 6,9 миллионов страниц в сутки. Rambler также усовершенствовал поиск по новостям, присылая робота на ведущие новостные сайты России каждые два часа.

Система обладает обычной и расширенной ("Расширенный поиск") формами ввода запроса. При серьезных разысканиях лучше обратиться к последней, которая предоставляет дополнительные возможности в ограничении запроса различными параметрами, задании критерия сортировки результатов и степени развернутости выводимых результатов. По умолчанию результаты поиска группируются по сайтам, что весьма логично, поскольку на одном сайте термин используется, как правило, в едином контексте. Всегда четко указывается дата создания документа и дата его последнего индексирования поисковым роботом.

Каждая найденная ссылка снабжена функциями "Восстановить текст", "Все документы с сайта" и "Найти похожие". Все функции  работают очень надежно. Особенно впечатляет последняя, демонстрирующая анализ именно содержания документа, а не его местоположения. Ее применение помогает, в частности, выявлять аспекты применения искомого термина в контексте, который крайне трудно было предположить при начальном поиске.

Помимо наличия и  местоположения ключевых слов, механизм выдачи результатов Rambler учитывает также популярность ресурса, которая определяется его посещаемостью (в случае, если на странице установлен счетчик Rambler Top100) и количеством внешних ссылок на данную страницу. Достоинством модуля выдачи результатов Rambler также является отсев нерелевантных документов и система защиты от сайтов-двойников.

 

Апорт (http://www.aport.ru)

 Поисковая система,  запущенная в феврале 1996 года, ныне замыкает группу лидеров  отечественных навигационных сервисов. Объем ее индексного файла на начало августа 2004 года составляет порядка 68 миллионов документов. По этому показателю Апорт уступает даже зарубежному  Google. Особенностью Апорт является то, что он не ограничивает своих роботов пределами доменов России и СНГ - в перечне результатов можно встретить ссылки на многие зарубежные сервера.

Апорт снабжен массой различных возможностей, заставляющих отнести его к числу самых  удобных для пользователя. Именно в нем одним из первых в российской практике был применен сложный язык запросов (http://aport.ru/help.htm), позволяющий максимально детализировать поисковое предписание и избавить пользователя от информационного шума, возникающего при случайном сочетании ключевых слов. Апорт на достаточно высоком уровне осуществляет поиск MP3-файлов и на настоящее время является, фактически, единственной системой, с помощью которой можно вести разыскание аудиофайлов на российских серверах.

Список результатов  содержит сведения об адресе, дате опубликования  и последней проверке документа. Документы с одного сайта сгруппированы вместе. Доступна, ставшая уже привычной, функция реконструкции текста без обращения к исходному документу. Положительным моментом является то, что найденные ключевые слова выводятся в окружающем контексте из любой части документа, а не только из его начала, что позволяет точно определить соответствие страницы запросу уже на этапе просмотра ссылок.

Помимо поисковой системы, пользователей Апорт привлекают возможности одноименного справочника  ресурсов, являющего на сегодня наиболее объемным каталогом в России.

Кроме перечисленных, в  российском сегменте Сети существует еще несколько поисковых машин, которые не отличаются высокими показателями работы, но также могут быть применены  в случаях, когда лидеры не дают результатов. К их числу относятся: КМ-поиск (go.km.ru), Лупа (www.lupa.ru) и Tela Textorum (tela.dux.ru).

В российском сегменте Интернет представлены также и мета-поисковые  системы, рассылающие запросы, как  в российские, так и глобальные поисковые системы. К этой разновидности относятся Punto (http://Punto.ru) и MetaBot (http://www.metabot.ru). Оба сервиса являются малоизвестными и не отмечены особыми достоинствами. Главное отличие их друг от друга заключается в том, что MetaBot обладает способностью объединять результаты, добытые из разных поисковых машин, а Punto не обеспечивает такое суммирование, фактически лишь транслируя результаты исходных поисковых средств. Punto также осуществляет поиск на новостных сайтах, словарях и разыскание иллюстраций, а MetaBot позволяет производить разыскания файлов на FTP-серверах.

 

2.3. Стратегия и методика профессионального  информационного поиска

Приступая к информационному  поиску в Интернет, следует всегда помнить несколько основных моментов. Прежде всего, никакие средства навигации - справочники или поисковые машины - не охватывают всего текущего информационного массива Интернет. По некоторым оценкам, даже такие признанные лидеры сетевого поиска как Google, отражают не более трети совокупного содержания Сети. Причина этого - постоянный колоссальный прирост объемов информации в Интернет, который, несмотря на все усилия навигационных служб, содержит огромное число белых пятен.

Помимо быстрого роста  и изменения местоположения документов, большинство поисковых систем имеют  внутренние ограничения на отражение материалов одного сайта и на объем индексируемой части страницы. Программы-роботы зачастую не идут в глубь сервера дальше определенной директории, что также сокращает число отраженных материалов.

В тоже время многие крупные  сайты имеют собственную систему поиска, которая отражает весь их информационный массив. Выявив такие сервера с помощью справочников, можно провести более детальное их обследование, использовав локальный поисковый механизм. Например, при поиске сведений о конкретном виде креветки, искусственно разводимой человеком, весьма рациональным будет найти и просмотреть сервера, посвященные в целом аквакультуре, отрасли, занимающейся выращиванием морепродуктов в искусственных теплых водоемах, а при выявлении данных о конкретном заболевании - сервера учреждений, ведущих исследования данной области. Таким образом, для достижения наиболее полных результатов следует применять справочники и поисковые системы в сочетании друг с другом.

Информация о работе Интернет в профессиональной информационной деятельности