Что такое метаданные
Реферат, 29 Октября 2013, автор: пользователь скрыл имя
Описание работы
Метаданные находятся рядом с нами с тех пор, как первый библиотекарь сделал список хранящихся на полке рукописных свитков. Термин "мета (meta)" появился из Греческого слова, которое означает "рядом, с, после, следующий". Более позднее латинское и английское употребление использует термин "мета" для определения чего-то абстрактного или сверхъестественного. Метаданные, кроме того, могут быть интерпретированы как данные о других данных. Это термин века Интернет, определяющий информацию, которую библиотекари традиционно организовывали в виде каталогов и которая чаще всего используется для описания Web-ресурсов.
Работа содержит 1 файл
Что такое метаданные.docx
— 27.00 Кб (Скачать)Что такое метаданные?
Метаданные находятся рядом с нами с тех пор, как первый библиотекарь сделал список хранящихся на полке рукописных свитков. Термин "мета (meta)" появился из Греческого слова, которое означает "рядом, с, после, следующий". Более позднее латинское и английское употребление использует термин "мета" для определения чего-то абстрактного или сверхъестественного. Метаданные, кроме того, могут быть интерпретированы как данные о других данных. Это термин века Интернет, определяющий информацию, которую библиотекари традиционно организовывали в виде каталогов и которая чаще всего используется для описания Web-ресурсов.
Запись метаданных состоит
из набора атрибутов или элементов,
необходимых для описания данного
ресурса. Например, наиболее часто встречающаяся
в библиотеках система
Элементы могут содержаться в записи. хранящейся отдельно от описываемой единицы, как это происходит в библиотечных каталогах
Метаданные могут храниться непосредственно в теле ресурса
Примеры внедренных метаданных, которые хранятся вместе с самим ресурсом включают каталогизацию в публикациях (Cataloging In Publication - CIP) - данные, печатающиеся на обороте титульного листа книги или заголовки TEI в электронном тексте. Многие стандарты метаданных, используемые сегодня, включая Dublin Core, не предписывают того или иной тип связи, оставляя решение при каждой конкретной реализации за разработчиком.
Несмотря на то, что
концепция метаданных
Все, что необходимо для "стандартизованных описательных метаданных", это адреса Dublin Core.
Что такое DUBLIN CORE?
Полная официальная версия
настоящего документа расположена
по адресу: http://dublincore.org/
Стандарт метаданных Дублинского ядра (Dublin Core) - простой, но эффективный набор элементов для описания широкого спектра сетевых ресурсов. Стандарт Dublin Core включает в себя пятнадцать элементов, семантика которых была совместно определена международными междисциплинарными группами профессионалов в области библиотечного дела, вычислительной техники, кодирования текстов, специалистов музейного дела, других смежных областей исследования.
Можно посмотреть на Dublin Core и с другой стороны как на "маленький язык для выведения отдельного класса заключений о ресурсах". В этом языке существует два класса терминов - элементы (существительные) и квалификаторы (прилагательные) которые могут быть организованы в простые утверждения. Сами ресурсы понимаются в этом языке как предметы. В разнообразном мире Internet Dublin Core представляется как "пиджин (гибридный язык) метаданных для цифровых туристов": легко схватываемый, но не обязательно соответствующий задаче выражения комплексных отношений или понятий.
Каждый элемент имеет
ограниченный набор
Несмотря на то, что Dublin Core ориентирован на документо-подобные объекты (document-like objects), поскольку традиционные текстовые ресурсы достаточно хорошо понятны, он может быть приложим также и к другим ресурсам. Его пригодность для применения к отдельным не-документными ресурсами зависит от степени близости и сходства их метаданных с метаданными традиционных документов, а также от того, какие задачи решаются с помощью этих метаданных. (Разработчики заинтересованы в использовании Dublin Core для различных ресурсов, содействующих просмотру страниц Проектов Dublin Core, чтобы составить суждение об использовании Dublin Core применительно к их ресурсам).
Dublin Core имеет целью реализацию следующих характеристик:
- Простоты создания и поддержки
Набор элементов Dublin Core должен быть по возможности мал и прост для того, чтобы дать не-специалистам возможность с легкостью и минимальными затратами создавать записи описаний информационных ресурсов для обеспечения высокой эффективности нахождения этих ресурсов в сетевой среде.
- Легко понимаемую семантику
Обнаружение информации
в безбрежном сообществе
- Международный охват
Набор элементов Dublin Core разработан на английском языке, но созданы версии и на многих других языках, включая финский, норвежский, тайваньский, японский, португальский, немецкий, греческий, индонезийский и испанский. Специальная группа "Многоязычный Dublin Core" координирует попытки связать эти версии в распределенном регистре, используя технологию Формата описания ресурсов (Resource Description Framework), разработанную Консорциумом Всемирной паутины (W3C).
Набор элементов метаданных DC: справочное описание
Предисловие
Настоящий документ обобщает
обновленные определения
В определениях используется формальный стандарт для описания элементов метаданных. Формализация помогает улучшить взаимодействие с другими сообществами, использующими метаданные, повысить четкость, определить границы и внутреннюю связь определений элементов метаданных Dublin Core. Для определения каждого элемента Dublin Core используется набор из десяти атрибутов из стандарта ISO/IEC 11179 (ИСО 11179 - Спецификация и стандартизация элементов данных) для описания элементов данных, которые включают в себя:
- Имя - метка, определяющая элемент данных;
- Идентификатор - уникальный идентификатор, присвоенный элементу данных;
- Версия - версия элемента данных;
- Орган регистрации - организация (лицо), имеющая полномочия регистрации элемента данных;
- Язык - язык, на котором дается характеристика элемента данных;
- Определение - формулировка, которое четко представляет содержание и внутреннюю природу элемента данных;
- Обязательность - указывает, требуется ли элемент данных всегда либо может быть представлен в зависимости по необходимости (содержит значение)
- Тип данных - указывает тип данных, которые могут быть представлены в качестве значений элемента данных;
- Максимальная распространённость - указывает какие бы то ни было ограничения повторяемости элемента данных;
- Комментарий - примечание, касающееся применения элемента данных.
К счастью, шесть из вышеперечисленных атрибутов являются общими для всех элементов Dublin Core.
Представленные атрибуты, являясь частью формальных определений элементов, не будут, тем не менее, повторяться в приводимых ниже определениях.
Определения, представленные здесь, включают обе формы элементов Dublin Core - концептуальную и репрезентативную, т.е. их содержание и представление. Атрибут Определение фиксирует семантическую концепцию, а атрибуты - Тип данных и Комментарии - представление данных.
Каждое определение Dublin Core относится к описываемому ресурсу. Ресурс определяется в RFC2396 (Унифицированный идентификатор ресурса (URI): Общий синтаксис) как "все, что имеет индивидуальность / своебразие / особенность". Для метаданных Dublin Core типичным ресурсом является информационный или служебный ресурс, но может быть использовано и более широкое толкование.
Квалификаторы Dublin Core
Предисловие
Настоящий документ представляет результаты процесса отбора квалификаторов для Набора элементов метаданных Dublin Core (DCMES). Приведенные в нем квалификаторы были определены в рабочих группах по спецификации элементов Инициативы метаданных Dublin Core (DCMI) и одобрены Комиссией по использованию Dublin Core как соответствующие принципам хорошей практики при характеристике Элементов метаданных Dublin Core. Рабочие группы предлагали "кандидатуры" квалификаторов исходя из соображений их широкого распространения (что, в свою очередь помогло бы улучшить взаимодействие между приложениями), а затем эти предложения обсуждались и были вынесены на голосование членов Комиссии по использованию DCMI.
При определениии состава этих квалификаторов предпочтение отдавалось словарям, системам индексации, элементам, уже поддерживаемым авторитетными ораганами. Следует подчеркнуть, что список подерживаемых извне словарей определен здесь как предварительный. Существует гораздо больше контролируемых словарей или систем классификации, которые здесь не приводятся. DCMI приветствует предложения, касающиеся дополнительных существующих стандартов, которые могут использоваться в качестве квалификаторов.
Неизбежно, могут возникнуть
ситуации, когда агент или клиент
неожиданно встретит описания DCMES,
в которых используются
Предполагается, что разработчики
будут создавать
На момент ратификации этого документа DCMI признала два общих класса квалификаторов:
- Детализация элемента. Посредством этих квалификаторов значение элемента сужается или специфицируется. Детализированный элемент имеет общее значение с элементом без квалификаторов, но с более конкретными границами. Клиент, который не понимает сецифического термина, детлизирующего элемент, должен иметь возможность игнорировать квалификаторы и иметь дело со значением метаданных как если бы это был элемент без квалификатора (более широкий). Доступ к определениям терминов для детализации элементов должен быть открытым.
- Схема кодировки. ти квалификаторы служат для идентификации схем, которые помогают в интерпретации значения элемента. Эти схемы включают контролируемые словари, системы записи или правила анализа. Значение, определенное с помощью схемы кодировки, представляет собой символ, выбранный из контролируемого словаря (например, индекс системы классификации или набор предметных рубрик) либо строку определенной структуры (например, "2000-01-01" как стандартное обозначение даты). Если схема кодировки непонятна клиенту или агенту, значение все же может оказаться полезным при чтении человеком. Схемы кодировки, определенные описанием как квалификаторы должны быть четко идентифицированы и доступны для общего использования.
Все квалификаторы,
приведенные в настоящем
Квалификаторы, приведенные
здесь, не являются закрытым
набором, предназначенным для
удовлетворения всех