Машиночитаемый каталог или каталогизация

Автор: Пользователь скрыл имя, 24 Декабря 2011 в 11:31, реферат

Описание работы

Термин MARC представляет собой акроним названия системы Machine- Readable Catalogue or Cataloguing (Машиночитаемый каталог или каталогизация). Однако это название не совсем точно, поскольку MARC не является ни каким-либо видом каталога, ни методом каталогизации. Фактически MARC- это краткий и удобный термин для обозначения процесса маркировки любой части каталогизационной записи так, чтобы она могла быть обработана с помощью компьютера.

Работа содержит 1 файл

Машиночитаемый каталог или каталогизация.docx

— 31.68 Кб (Скачать)

    00422dam 22001337 450000500170000008000100001709000170002710

    0001400044245007200058260002500130300001600155653009500171990

    002200266^19970806174944.8^00$a519.2^00$a519$xЮ 16$hП^ 0$aЮди

    н М.Д.^ 0$aСходимость распределений и сумм случайных величин$

    bУчебн.метод.пособие^ 0$aМн.$bУниверситетское^00$a254 c.$bил.

    ^00$aТеория вероятности, Статистические исследования, Прикладн

    ая  математика, Случайные величины^00$b2$e2$v2$t77$z0$j2^« 

    Проанализируем  этот пример.

    Первые 24 позиции являются маркером. Он заканчивается  цифрами "4500". Непосредственно  после маркера начинается справочник. Метки в этом примере подчёркнуты.. Каждая отдельная статья справочника вместе с меткой имеет длину 12 символов. Первой меткой является 005. Следующие 4 позиции после каждой метки указывают длину поля. В этой записи данные в поле 005 (дата корректировки) имеют длину 17 символов. Следующие 5 позиций обозначают начальную точку отсчёта (позицию начального символа) для этого поля в строке данных, которая следует за справочником (после первого разделителя "^").

    Поле 005 начинается с позиции 00000 (первая позиция является позицией 0). Следующей  является метка поля 008, которое имеет  длину 10 символов и начинается с 17-й  позиции (длина предшествующего поля 17, добавленная к его начальной позиции 00000, равна 17). Следующая метка поля- 090. Оно имеет длину 17 символов и начинается с 27-ой позиции (17+10=27)...

    Последнее поле 990 имеет длину 22 символа и  начинается с 266 позиции.

    Разделители полей (в примере они изображены знаком ^) отмечают конец справочника и конец каждого поля, которые следуют за справочником.

    Разделитель записи (изображённый в этом примере  знаком «) заканчивает каждую библиографическую запись.

    Приведём, наконец, этот пример в виде размеченного изображения: 

    Маркер......................................................................00422dam 22001337 4500

    DTLT (дата и время последней транзакции)....005.......19970806174944.8

    Индекс  УДК.............................................................080........$a 519.2

    Шрифты....................................................................090.......$a 519

    ..................................................................................................$x Ю 16

    ..................................................................................................$h П

    Имя автора...............................................................100........$a Юдин М. Д.

    Заглавие....................................................................245........$a Сходимость распределений

      случайных величин

    ..................................................................................................$b Учебн.метод.пособие

    Публикация.............................................................260........$a Мн.

    .................................................................................................$b Университетское

    Физическое  описание...........................................300.......$a 254 с.

    .................................................................................................$b ил.

    Ключевые  слова ....................................................653........$a Теория вероятности, Статистические

      исследования, Прикладная математика,

      Случайные величины

    Данные  о заказе....................................................990.........$b 2

    .................................................................................................$e 2

    .................................................................................................$v 2

    .................................................................................................$t 77

    .................................................................................................$z 0

    .................................................................................................$j 2 

    ГЛАВА 2 . ФОРМАТ UNIMARC.

    2.1. ЦЕЛИ СОЗДАНИЯ ФОРМАТА UNIMARC.

    С начала 70-х годов семейство MARC увеличилось более чем на 20 форматов. Различия в содержании данных этих форматов вызывают необходимость редактирования записи до обмена ими.

    Для преодоления несовместимости форматов было принято решение разработать  международный формат MARC (UNIMARC), который позволил бы принимать записи, составленные в любом формате MARC так, чтобы они могли конвертироваться в UNIMARC, а из него в любой другой формат MARC. Для этого каждой национальной службе достаточно будет составить только две программы (одну для конвертирования в UNIMARC, другую из формата UNIMARC) вместо специальных программ конвертирования в каждый из форматов MARC, например, INTERMARC в UKMARC, USMARC в UKMARC и т.д. Таким образом, основной целью создания формата UNIMARC является содействие международному обмену данными в машиночитаемой форме между национальными библиографическими службами, а также более простое и удобное составление описания библиографических единиц, их поиск и контроль. Последнее достигается с помощью разработанных методов записи библиографической информации, осуществляемой в соответствии с международными стандартами. 

    2.2. ОТЛИЧИЕ ФОРМАТА UNIMARC ОТ ФОРМАТА USMARC.

    Прежде  всего нужно отметить, что те определения, которые приводились для формата USMARC подходят (или правильнее сказать применяются) в формате UNIMARC (то есть понятия поля, метки, индикатора, маркера, справочника и др. сохраняются). Таким образом, не имеет смысла описывать столь же подробно формат UNIMARC, как был описан формат USMARC. Поэтому стоит остановиться на тех фрагментах, которые отличают эти два формата.

    Основным  отличием форматов UNIMARC и USMARC являются прежде всего несоответствия полей, подполей, индикаторов и т.п. (то есть правильнее будет сказать несоответствия меток полей, подполей, индикаторов и т. п.). К отличиям можно отнести также и то, что количество полей в формате UNIMARC не совпадает с количеством полей в формате USMARC, причём в UNIMARC полей больше чем в USMARC. Это связано с тем, что сам формат UNIMARC, как было сказано ранее, создавался значительно позже, чем формат USMARC и, соответственно, при создании UNIMARC учитывалось всё, чтобы этот формат был лучшим и заменил все остальные форматы.

    Дальнейшие  отличия между форматами UNIMARC и USMARC являются более мелкими (вытекающими из вышеперечисленных) и связаны опять таки с тем, что формат UNIMARC "младше" формата USMARC (например, количество подполей в полях, длины полей, различия в обозначениях индикаторов и другое).

    Приведём, наконец, пример записи коммуникативного формата UNIMARC и сопоставим его примеру записи коммуникотивного формата USMARC: 

    00579nam 2200193 45000010011000000100018000111000041000291

    01000800070200006900078210002400147215002300171225003000194

    61000580022467500270028268600170030968600170032670000160034

    3702002600359^ru96-37586^ $a5-88201-040-3^ $a19970708d1996

    u a0rusb0103 ca^0 $arus^1 $aInternet Windows95$fПитер Кент$g

    Перевод с англ. В. Л. Григорьева^ $aM.$cКомпьютер$d1996^ $

    a367 c.$cил.$d21 см^1 $aКомпьютерный мир 21 века^0 $aВычисл

    ительные  сети глобальные-операционные системы^ $a681.324/.0

    66(100)$zrus^ $a50$drugasnti^ $a32.97$drubbk^ 1$aКент$bПитер

    ^ 1$aГригорьев$bВ. Л.^« 

    Начнём  с того, что первые 24 позиции являются маркером. Аналогично с записью USMARC, после маркера следует справочник. Метки в справочнике подчёркнуты каждая статья справочника занимает 12 символов (4 позиции на длину поля и 5 позиций на точку отсчёта).

    Если  внимательно посмотреть, то нетрудно заметить, что метки полей в  UNIMARC отличаются от меток в USMARC (например, поле автора в UNIMARC-200, а в USMARC-100). Также видно, что повторяется поле 686. Это говорит о том, что поля в UNIMARC могут повторяться. Больше того, в UNIMARC последовательность приведения полей в записи является свободной ,то есть поля не обязательно должны идти в справочнике в порядке возростания (001, 010, 100, 200 и т.д.), они могут располагатся свободно (605, 710, 702, 012 и т.д.).

    Остальные особенности записи формата UNIMARC приведены в начале пункта 2.2. 

     2.3. КОНВЕРТИРОВАНИЕ ДАННЫХ ПО СТРУКТУРЕ USMARC«UNIMARC.

    При создании конверторов USMARC«UNIMARC необходимо составить определённые алгоритмы программ.

    Рассмотрим  алгоритм программы-конвертора UNIMARC ®USMARC.

    Программа-конвертор  может состоять из 3 блоков.

    В первом блоке программа-конвертор  должна считывать те данные из файла, которые необходимо конвертировать.

    Второй  блок является основным и самым сложным. В нём, собственно, и происходит конвертирование данных. Это конвертирование также можно разделить на несколько состовных частей. Сначала необходимо перестроить маркер. После предстоит конвертирование справочника. Тут будет важным перевести все метки полей, подполей и индикаторов, которые не совпадают. Эту задачу можно решить с помощью дополнительного файла, в котором указаны все метки полей, подполей и индикаторов одного из форматов. Также нужно учитывать и то, что длины полей формата, который конвертируется могут не совпадать с длинами полей нового формата (то есть надо пересчитать эти длины).

    В третьем блоке новую запись необходимо записать в новый файл, который  и будет отображать форму записи нового формата.

    Алгоритм  конвертора USMARC®UNIMARC строится аналогичным образом 

    ЗАКЛЮЧЕНИЕ.

    Итак, мы провели небольшой обзор по форматам автоматизированных библиографических  систем USMARC и UNIMARC (так как именно эти два формата имеют наибольшее распространение и доверие в мире).

    Основная  цель данного исследования заключалась не в детальном рассмотрении форматов USMARC и UNIMARC, а в том, чтобы подчеркнуть факт перехода библиотек на эти автоматизированные системы.

    Хотелось  бы подчеркнуть также и то, что  более предпочтительней является формат записи UNIMARC, чем USMARC (или ещё какой-нибудь). Причины этого назывались ранее. Можно сказать что формат UNIMARC уже вытесняет формат USMARC, и впоследствии он (UNIMARC) станет форматом, используемым в большинстве стран мира. Однако наука не стоит на месте, и возможно, уже в скором времени появится более удобный формат.

Информация о работе Машиночитаемый каталог или каталогизация