Что такое метаданные

Автор: Пользователь скрыл имя, 29 Октября 2013 в 10:27, реферат

Описание работы

Метаданные находятся рядом с нами с тех пор, как первый библиотекарь сделал список хранящихся на полке рукописных свитков. Термин "мета (meta)" появился из Греческого слова, которое означает "рядом, с, после, следующий". Более позднее латинское и английское употребление использует термин "мета" для определения чего-то абстрактного или сверхъестественного. Метаданные, кроме того, могут быть интерпретированы как данные о других данных. Это термин века Интернет, определяющий информацию, которую библиотекари традиционно организовывали в виде каталогов и которая чаще всего используется для описания Web-ресурсов.

Работа содержит 1 файл

Что такое метаданные.docx

— 27.00 Кб (Скачать)

Что такое метаданные?

Метаданные находятся  рядом с нами с тех пор, как  первый библиотекарь сделал список хранящихся на полке рукописных свитков. Термин "мета (meta)" появился из Греческого слова, которое означает "рядом, с, после, следующий". Более позднее латинское и английское употребление использует термин "мета" для определения чего-то абстрактного или сверхъестественного. Метаданные, кроме того, могут быть интерпретированы как данные о других данных. Это термин века Интернет, определяющий информацию, которую библиотекари традиционно организовывали в виде каталогов и которая чаще всего используется для описания Web-ресурсов.

Запись метаданных состоит  из набора атрибутов или элементов, необходимых для описания данного  ресурса. Например, наиболее часто встречающаяся  в библиотеках система метаданных - библиотечный каталог - содержит набор  записей метаданных с элементами, которые описывают книгу либо другую библиотечную единицу: автор, заглавие, дата создания или публикации, предметных охват и шифр, определяющий местонахождение  единицы на полке. Связь между  записью метаданных и ресурсом, который  она описывает может осуществляться двумя способами:

Элементы могут содержаться  в записи. хранящейся отдельно от описываемой единицы, как это происходит в библиотечных каталогах

Метаданные могут храниться  непосредственно в теле ресурса 

Примеры внедренных метаданных, которые хранятся вместе с самим ресурсом включают каталогизацию в публикациях (Cataloging In Publication - CIP) - данные, печатающиеся на обороте титульного листа книги или заголовки TEI в электронном тексте. Многие стандарты метаданных, используемые сегодня, включая Dublin Core, не предписывают того или иной тип связи, оставляя решение при каждой конкретной реализации за разработчиком.

 Несмотря на то, что  концепция метаданных предшествовала  Internet и Web, взрыв мирового интереса к стандартам и практике применения метаданных вызван все возрастающим числом электронных публикаций, цифровых библиотек и сопутствующей "информационной перегрузке", произошедшей от появления огромного количества недифференцированных цифровых данных, доступных в режиме реального времени. Всякий, кто пытался найти информацию онлайн, пользуясь одним из популярных поисковых Web-сервисов, имел возможность испытать разочарование от нахождения сотен, если не тысяч "хитов" с ограниченной возможностью усовершенствования или увеличения точности поиска. Огромный выбор стандартов описания и приложений для электронных ресурсов сможет улучшить нахождение релевантных ресурсов в "сообществах Интернет". Как отметили лидеры в области развития метаданных: "Объединение стандартизованных описательных метаданных с сетевыми объектами обладает потенциальными возможностями существенно улучшит возможности нахождения ресурсов, предоставляя возможность поиска по полям (например, автору, заглавию), пермутационным индексам для нетекстовых объектов, осуществлять доступ к суррогату содержания, значительно отличается от доступа к собственно содержанию ресурса".

Все, что необходимо для "стандартизованных  описательных метаданных", это адреса Dublin Core.

 

Что такое DUBLIN CORE?

Полная официальная версия настоящего документа расположена  по адресу:  http://dublincore.org/documents/2001/04/12/usageguide/.

 Стандарт метаданных  Дублинского ядра (Dublin Core) - простой, но эффективный набор элементов для описания широкого спектра сетевых ресурсов. Стандарт Dublin Core включает в себя пятнадцать элементов, семантика которых была совместно определена международными междисциплинарными группами профессионалов в области библиотечного дела, вычислительной техники, кодирования текстов, специалистов музейного дела, других смежных областей исследования.

 Можно посмотреть на  Dublin Core и с другой стороны как на "маленький язык для выведения отдельного класса заключений о ресурсах". В этом языке существует два класса терминов - элементы (существительные) и квалификаторы (прилагательные) которые могут быть организованы в простые утверждения. Сами ресурсы понимаются в этом языке как предметы. В разнообразном мире Internet Dublin Core представляется как "пиджин (гибридный язык) метаданных для цифровых туристов": легко схватываемый, но не обязательно соответствующий задаче выражения комплексных отношений или понятий.

 Каждый элемент имеет  ограниченный набор квалификаторов, атрибутов, которые могут быть  использованы для дальнейшего  уточнения (но не расширения) значения  элемента. Инициатива метаданных  Дублинского ядра (Dublin Core Metadata Initiative - DCMI) определила стандартные пути "квалификации" элементов с использованием различных типов квалификаторов. Набор рекомендованных квалификаторов в соответствии с "лучшей практикой" DCMI в настоящее время доступен, ведется процесс официальной регистрации.

 Несмотря на то, что  Dublin Core ориентирован на документо-подобные объекты (document-like objects), поскольку традиционные текстовые ресурсы достаточно хорошо понятны, он может быть приложим также и к другим ресурсам. Его пригодность для применения к отдельным не-документными ресурсами зависит от степени близости и сходства их метаданных с метаданными традиционных документов, а также от того, какие задачи решаются с помощью этих метаданных. (Разработчики заинтересованы в использовании Dublin Core для различных ресурсов, содействующих просмотру страниц Проектов Dublin Core, чтобы составить суждение об использовании Dublin Core применительно к их ресурсам).

 Dublin Core имеет целью реализацию следующих характеристик:

  • Простоты создания и поддержки

 Набор элементов Dublin Core должен быть по возможности мал и прост для того, чтобы дать не-специалистам возможность с легкостью и минимальными затратами создавать записи описаний информационных ресурсов для обеспечения высокой эффективности нахождения этих ресурсов в сетевой среде.

  • Легко понимаемую семантику

 Обнаружение информации  в безбрежном сообществе Интернет  весьма затруднено из-за различий  в терминологии и практике  описания, применяющейся в той  или иной отрасли знания. Dublin Core может помочь 'цифровым туристам' - неподготовленным к поиску - найти индивидуальный путь с помощью общего набора элементов, семантика которых универсально понятна и поддерживается. Например, ученые, которые хотят найти работы конкретного автора, искусствоведы, интересующиеся работами конкретных художников, могут согласиться в важностью такого элемента, как "создатель". Совпадения в целом, только немного более общие, позволяют с помощью набора элементов увеличить прозрачность и доступность всех ресурсов как в пределах отдельной дисциплины, так и вне их.

  • Международный охват

 Набор элементов Dublin Core разработан на английском языке, но созданы версии и на многих других языках, включая финский, норвежский, тайваньский, японский, португальский, немецкий, греческий, индонезийский и испанский. Специальная группа "Многоязычный Dublin Core" координирует попытки связать эти версии в распределенном регистре, используя технологию Формата описания ресурсов (Resource Description Framework), разработанную Консорциумом Всемирной паутины (W3C).

 

Набор элементов метаданных DC: справочное описание

Предисловие

Настоящий документ обобщает обновленные определения элементов  метаданных Dublin Core (Дублинского ядра), первоначально определенных в RFC2413 (Метаданные Dublin Core для нахождения ресурсов). Эти новые определения официально известны как Версия 1.1.

В определениях используется формальный стандарт для описания элементов  метаданных. Формализация помогает улучшить взаимодействие с другими сообществами, использующими метаданные, повысить четкость, определить границы и внутреннюю связь определений элементов  метаданных Dublin Core. Для определения каждого элемента Dublin Core используется набор из десяти атрибутов из стандарта ISO/IEC 11179 (ИСО 11179 - Спецификация и стандартизация элементов данных) для описания элементов данных, которые включают в себя:

  • Имя - метка, определяющая элемент данных;
  • Идентификатор - уникальный идентификатор, присвоенный элементу данных;
  • Версия - версия элемента данных;
  • Орган регистрации - организация (лицо), имеющая полномочия регистрации элемента данных;
  • Язык - язык, на котором дается характеристика элемента данных;
  • Определение - формулировка, которое четко представляет содержание и внутреннюю природу элемента данных;
  • Обязательность - указывает, требуется ли элемент данных всегда либо может быть представлен в зависимости по необходимости (содержит значение)
  • Тип данных - указывает тип данных, которые могут быть представлены в качестве значений элемента данных;
  • Максимальная распространённость - указывает какие бы то ни было ограничения повторяемости элемента данных;
  • Комментарий - примечание, касающееся применения элемента данных.  

К счастью, шесть из вышеперечисленных  атрибутов являются общими для всех элементов Dublin Core.

Представленные атрибуты, являясь частью формальных определений  элементов, не будут, тем не менее, повторяться  в приводимых ниже определениях.

Определения, представленные здесь, включают обе формы элементов  Dublin Core - концептуальную и репрезентативную, т.е. их содержание и представление. Атрибут Определение фиксирует семантическую концепцию, а атрибуты - Тип данных и Комментарии - представление данных.

Каждое определение Dublin Core относится к описываемому ресурсу. Ресурс определяется в RFC2396 (Унифицированный идентификатор ресурса (URI): Общий синтаксис) как "все, что имеет индивидуальность / своебразие / особенность". Для метаданных Dublin Core типичным ресурсом является информационный или служебный ресурс, но может быть использовано и более широкое толкование.

 

Квалификаторы Dublin Core

Предисловие

Настоящий документ представляет результаты процесса отбора квалификаторов для Набора элементов метаданных Dublin Core  (DCMES). Приведенные в нем квалификаторы были определены в рабочих группах по спецификации элементов Инициативы метаданных Dublin Core  (DCMI) и одобрены Комиссией по использованию Dublin Core как соответствующие принципам хорошей практики при характеристике Элементов метаданных Dublin Core. Рабочие группы предлагали "кандидатуры" квалификаторов исходя из соображений их широкого распространения (что, в свою очередь помогло бы улучшить взаимодействие между приложениями), а затем эти предложения обсуждались и были вынесены на голосование членов Комиссии по использованию DCMI.

 При определениии состава этих квалификаторов предпочтение отдавалось словарям, системам индексации, элементам, уже поддерживаемым авторитетными ораганами. Следует подчеркнуть, что список подерживаемых извне словарей определен здесь как предварительный. Существует гораздо больше контролируемых словарей или систем классификации, которые здесь не приводятся. DCMI приветствует предложения, касающиеся дополнительных существующих стандартов, которые могут использоваться в качестве квалификаторов.

 Неизбежно, могут возникнуть  ситуации, когда агент или клиент  неожиданно встретит описания DCMES, в которых используются неизвестные  квалификаторы, созданные разработчиками  для удовлетворения специализированных  локальных или определяемых спецификой  предметной области потребностей. Полезность интерпретации таких  DCMES-описаний бует зависеть от возможности приложения игнорировать неизвестные квалификаторы и приводить значение элемента к его более широкой форме без квалификаторов. Направляющим принципом для квалификации элементов Dublin Core является, говоря разговорным языком принцип "глупость отбрасывается", который состоит в том, что клиент имеет возможность игнорировать любой квалификатор и использовать описание, как если бы в нем и не было квалификаторов. Несмотря на то, что при этом может утрачивается некоторая специфика, оставшееся значение элемента (без квалификаторов) должно продолжать оставаться в целом корректным и пригодным для поиска.

 Предполагается, что разработчики  будут создавать дополнительные  квалификаторы для использования  в своих локальных приложениях  или в пределах определенных  предметных областей. Такие квалификаторы  могут быть непонятны для других  приложений. Тем не менее, квалификаторы,  которые присвоены в соответствии  с принципами квалификации, определенными  здесь, с большей вероятностью  будут использоваться другими  сообществами, учитывая широкий  контекст межпредметного поиска.

 На момент ратификации  этого документа DCMI признала два  общих класса квалификаторов:

  • Детализация элемента. Посредством этих квалификаторов значение элемента сужается или специфицируется. Детализированный элемент имеет общее значение с элементом без квалификаторов, но с более конкретными границами. Клиент, который не понимает сецифического термина, детлизирующего элемент, должен иметь возможность игнорировать квалификаторы и иметь дело со значением метаданных как если бы это был элемент без квалификатора (более широкий). Доступ к определениям терминов для детализации элементов должен быть открытым.
  • Схема кодировки. ти квалификаторы служат для идентификации схем, которые помогают в интерпретации значения элемента. Эти схемы включают контролируемые словари, системы записи или правила анализа. Значение, определенное с помощью схемы кодировки, представляет собой символ, выбранный из контролируемого словаря (например, индекс системы классификации или набор предметных рубрик) либо строку определенной структуры (например, "2000-01-01" как стандартное обозначение даты). Если схема кодировки непонятна клиенту или агенту, значение все же может оказаться полезным при чтении человеком. Схемы кодировки, определенные описанием как квалификаторы должны быть четко идентифицированы и доступны для общего использования.

 Все квалификаторы,  приведенные в настоящем документе,  подпадают под одну из данных  категорий. Другие категории квалификаторов  могут быть выявлены лишь спустя  какое-то время по результататм практической деятельности. Предлагаемые квалификаторы, представленные в Комиссию по использованию DCMI и не подпадающие под одну из категорий или имеющие недостатки в каком-либо отношении (например, четкость определения), будут обсуждаться в дальнейшем и пересматриваться для их принятия в будущем.

 Квалификаторы, приведенные  здесь, не являются закрытым  набором, предназначенным для  удовлетворения всех потребностей  пользователей. Точнее, они формируют  фундамент для большей группы  квалификаторов, которые будут разрабатываться  в качестве дополнительных различными  сообществами и представляться  Комиссии по использованию DCMI для рассмотрения и принятия. Разработчики могут использовать  эти квалификаторы при условии,  что они уверены в их соответствии  принципу "отбрасывания глупости" и поддерживают использование  подобных квалификаторов в качестве  примеров в процессе развития  локальных квалификаторов для  элементов метаданных Dublin Core.

Информация о работе Что такое метаданные