Наиболее
развитым языком запросов из современных
ИПС Internet обладает Alta Vista. Кроме обычного
набора AND, OR, NOT эта система позволяет
использовать еще и NEAR, позволяющий
организовать контекстный поиск. Все
документ в системе разбиты на
поля, поэтому в запросе можно указать,
в какой части документа пользователь
надеется увидеть ключевое слово: ссылка,
заглавие, аннотация и т.п. Можно также
задавать поле ранжирования выдачи и критерий
близости документов запросу.
- Основные
характеристики поисковой
системы
- Полнота -
одна из основных характеристик поисковой
системы, представляющая собой отношение
количества найденных по запросу
документов к общему числу документов
в сети Интернет, удовлетворяющих
данному запросу. К примеру, если
в Интернете имеется 100 страниц, содержащих
словосочетание «как выбрать автомобиль»,
а по соответствующему запросу было найдено
всего 60 из них, то полнота поиска будет
0,6. Очевидно, что чем полнее поиск, тем
меньше вероятность того, что пользователь
не найдет нужный ему документ, при условии,
что он вообще существует в Интернете.
- Точность
- еще одна основная характеристика поисковой
машины, которая определяется степенью
соответствия найденных документов запросу
пользователя. Например, если по запросу
«как выбрать автомобиль» находится 100
документов, в 50 из них содержится словосочетание
«как выбрать автомобиль», а в остальных
просто наличествуют эти слова («как правильно
выбрать магнитолу и установить в автомобиль»),
то точность поиска считается равной 50/100
(=0,5). Чем точнее поиск, тем быстрее пользователь
найдет нужные ему документы, тем меньше
различного рода «мусора» среди них будет
встречаться, тем реже найденные документы
не будут соответствовать запросу.
- Актуальность
- не менее важная составляющая поиска,
которая характеризуется временем, проходящим
с момента публикации документов в сети
Интернет, до занесения их в индексную
базу поисковой системы. Например, на следующий
день после появления интересной новости,
большое количество пользователей обратились
к поисковым системам с соответствующими
запросами. Объективно с момента публикации
новостной информации на эту тему прошло
меньше суток, однако основные документы
уже были проиндексированы и доступны
для поиска, благодаря существованию у
крупных поисковых систем так называемой
«быстрой базы», которая обновляется несколько
раз в день.
- Скорость
поиска
Скорость
поиска тесно связана с его
устойчивостью к нагрузкам. Например,
по данным ООО «Рамблер Интернет Холдинг»,
на сегодняшний день в рабочие
часы к поисковой машине Рамблер приходит
около 60 запросов в секунду. Такая загруженность
требует сокращения времени обработки
отдельного запроса. Здесь интересы пользователя
и поисковой системы совпадают: посетитель
желает получить результаты как можно
быстрее, а поисковая машина должна отрабатывать
запрос максимально оперативно, чтобы
не тормозить вычисление следующих запросов.
Наглядность
представления результатов является
важным компонентом удобного поиска.
По большинству запросов поисковая
машина находит сотни, а то и тысячи документов.
Вследствие нечеткости составления запросов
или неточности поиска, даже первые страницы
выдачи не всегда содержат только нужную
информацию. Это означает, что пользователю
зачастую приходится производить свой
собственный поиск внутри найденного
списка. Различные элементы страницы выдачи
поисковой системы помогают ориентироваться
в результатах поиска.одробные пояснения
по странице результатов поиска, например
у «Яндекса» можно посмотреть по ссылке
- Глоссарий
— словарь узкоспециализированных терминов
в какой-либо отрасли знаний с толкованием,
иногда переводом на другой язык, комментариями
и примерами. Собрание глосс и собственно
глоссарии стали предшественниками словаря.
По толкованию энциклопедического словаря
Брокгауза и Ефрона[1], глоссарий — это
объясняющий малоизвестные слова, употребленные
в каком-нибудь сочинении, особенно у греческого
и латин. автора. Глоссарий — это также
список часто используемых выражений.
- Тезаурус
— особая разновидность словарей общей
или специальной лексики, в которых указаны
семантические отношения (синонимы, антонимы,
паронимы, гипонимы, гиперонимы и т. п.)
между лексическими единицами. Таким образом,
тезаурусы, особенно в электронном формате,
являются одним из действенных инструментов
для описания отдельных предметных областей.
- Дескриптор
(позднелат. descriptor, от лат. describо — описываю)
- лексическая единица (слово, словосочетание)
информационно-поискового языка, служащая
для описания основного смыслового содержания
документов. Дескрипторы служат также
для формулировки информационных запросов
при поиске документов в информационно
- поисковой системе.
- Критерий
соответствия- совокупность правил, по
которым при информационном поиске определяется
степень соответствия поискового образа
документа поисковому предписанию и принимается
решение о выдаче или невыдаче этого документа
в ответ на информационный запрос. Наряду
с информационно-поисковым языком критерий
соответствия является одним из элементов
информационно-поисковой системы.
Список использованных
источников
1. http://ru.wikipedia.org/
2.
Н.А. Гайдамакин «Автоматизированные информационные
системы, базы и банки данных», М.: «Гелиос»,
2008.
3.
Андрей Аликберов "Несколько слов о
том, как работают роботы поисковых машин". http://www.citforum.ru/internet/search/art_1.shtml
4.
Павел Храмцов "Поиск и навигация в
Internet". http://www.osp.ru/cw/1996/20/31.htm