Реляционная модель данных для больших совместно используемых банков данных

Автор: Пользователь скрыл имя, 13 Февраля 2011 в 15:14, реферат

Описание работы

Существующие недедуктивные системы форматированных данных предоставляют пользователям файлы с древовидной структурой или немного более общие сетевые модели данных. В разд. 1 обсуждаются недостатки таких моделей. Вводятся модель, основанная на n-арных отношениях, нормальная форма отношений базы данных и универсальный подъязык данных. В разд. 2 обсуждаются некоторые операции над отношениями (отличные от операций логического вывода), а затем эти операции применяются к проблемам избыточности и согласованности пользовательской модели.

Содержание

1. Реляционная модель и нормальная форма

1.1. Введение

1.2. Зависимости данных в существующих системах

1.3. Реляционное представление данных

1.4. Нормальная форма

1.5. Некоторые лингвистические аспекты

1.6. Выразимые, именованные и хранимые отношения

2. Избыточность и согласованность

2.1. Операции над отношениями.

2.2. Избыточность

2.3. Согласованность

2.4. Заключение

Литература

Работа содержит 1 файл

Реляционная модель данных для больших совместно используемых банков данных.doc

— 299.50 Кб (Скачать)
      Файл       Сегмент       Поля 
      F       ДЕТАЛЬ        номер детали
                      наименование  детали
                      описание  детали
                      имеющееся количество
                      заказанное  количество
      G       ПРОЕКТ        номер проекта 
                      наименование  проекта
                      описание  проекта 
              ДЕТАЛЬ        номер детали
                      подтвержденное  количество
 

  
Структура 4. Детали и Проекты наравне, Связь назначения деталей проектам подчинена Деталям 

      Файл       Сегмент       Поля 
      F       ДЕТАЛЬ        номер детали
                      наименование  детали
                      описание детали
                      имеющееся количество
                      заказанное  количество
              ПРОЕКТ        номер проекта 
                      подтвержденное  количество
      G       ПРОЕКТ        номер проекта 
                      наименование  проекта 
                      описание  проекта 
 

  
Структура 5. Детали, Проекты и Связь  назначения деталей проектам наравне

      Файл       Сегмент       Поля 
      F       ДЕТАЛЬ        номер детали
                      наименование  детали
                      описание  детали
                      имеющееся количество
                      заказанное  количество
      G       ПРОЕКТ        номер проекта 
                      наименование  проекта 
                      описание  проекта 
      H       ПОДТВЕРЖДЕНИЕ       номер детали
                      номер проекта
                      подтвержденное  количество

      Теперь  рассмотрим задачу выборки номера детали, названия детали и количества деталей  этого типа для каждой детали, используемой в проекте с названием "альфа". Следующие наблюдения могут быть сделаны независимо от того, какая конкретная информационная система с древовидной организацией информации выбирается для решения этой задачи. Если для этого разрабатывается программа P, ориентированная на использование одной из приведенных выше структур (т.е. P не определяет, какова реальная структура представления данных), то при любом выборе P не сможет работать, по меньшей мере, с тремя потенциально возможными структурами. Более точно, если P следует структуре 5, то ей не удастся работать со всеми другими структурами; если PP следует структуре 3 или 4, то ей, по меньшей мере, не удастся работать со структурами 1,2 и 5; если P следует структуре 1 или 2, ей, как минимум , не удастся работать со структурами 3, 4 и 5. В каждом случае причина проста. Если отсутствуют проверки для определения реально заданной структуры, то работа P заканчится неудачей по причине попытки перехода по ссылке к несуществующему файлу (в доступных сегодня системах это трактуется как ошибка) или из-за отсутствия перехода по ссылке к файлу, содержащему нужную информацию. Читателю, который в этом сомневается, рекомендуется написать пробные программы для решения этой простой задачи.

      Поскольку в общем случае непрактично создавать  прикладные программы, которые проверяют  все древовидные структуризации, допускаемые системой, эти программы перестают работать после выполнения необходимых изменений структуры.

      Системы, которые предоставляют пользователям  сетевую модель данных, порождают  аналогичные трудности. И в случае деревьев, и в случае сетей пользователь (или его программа) должен обеспечить набор путей доступа к данным. Неважно, находятся ли эти пути в точном соответствии с определяемыми ссылками путями в хранимом представлении (в IDS это соответствие является предельно простым, в TDMS – совсем наоборот). В результате, независимо от конкретного вида хранимого представления, интерактивная деятельность и программы становятся зависимыми от существования пользовательских путей доступа.

      Одно  из решений состоит в следовании той политике, что определенный пользователем путь доступа нельзя вывести из употребления до тех пор, пока существуют программы, использующие этот путь доступа. Такая политика непрактична, поскольку число путей доступа в модели, общей для сообщества пользователей банка данных, в конце концов станет чрезмерно велико.

      1.3. Реляционное представление  данных 

      Термин  отношение используется здесь в его общепринятом математическом смысле. Для заданных множеств S1, S2, ..., Sn (не обязательно различных) R является отношением на этих n множествах, если представляет собой множество кортежей степени n, у каждого из которых первый элемент взят из множества S1, второй – из множества S2 и т.д.1) Мы будем называть Sj j-тым доменом R. Говорят, что такое отношение R имеет степень n. Отношения степени 1 часто называют унарными, степени 2 – бинарными, степени 3 – тернарными и степени nn-арными.

      Для наглядности мы будем часто использовать представление отношений в виде массивов, но нужно помнить, что это конкретное представление не является существенной частью излагаемого реляционного представления. Массив, представляющий n-арное отношение R, обладает следующими свойствами:

  1. Каждая строка представляет кортеж степени n.
  2. Порядок строк не является существенным.
  3. Все строки различны.
  4. Порядок столбцов является существенным – он соответствует порядку S1, S2,..., Sn доменов, на которых определяется R (однако обратите внимание на приводимые ниже замечания по поводу отношений с упорядоченными и неупорядоченными доменами).
  5. Значимость каждого столбца частично выражается посредством его пометки именем соответствующего домена.

      В примере на рис.1 показано отношение  степени 4 поставка. В этом отношении отражаются выполняемые поставки деталей от указанных поставщиков для указанных проектов в указанных количествах.

      поставка       (поставщик       деталь       проект       количество)
              1       2       5       17
              1       3       5       23
              2       3       7       9
              2       7       5       4
              4       1       1       12

      Рисунок 1. Отношение степени 4

      Можно спросить: если столбцы помечены именами соответствующих доменов, зачем нужна упорядоченность столбцов? Как показывает рис.2, для двух столбцов могут иметься одинаковые заголовки (означающие одинаковые домены), но смысл этих столбцов может быть различным. Показанное отношение называется компонент. В этом тернарном отношении два первых домена называются деталь, а третий – количество. Смысл отношения компонент (x, y, z) состоит в том, что деталь x является непосредственным компонентом (или составной частью) детали y, и для сборки одного экземпляра детали y требуется z экземпляров детали x. Это отношение играет критическую роль в проблеме разборки деталей.

      компонент       (деталь       деталь       количество)
              1       5       9
              2       5       7
              3       5       2
              2       6       12
              3       6       3
              4       7       1
              6       7       1

      Рисунок 2.Отношение с двумя одинаковыми доменами

      Примечательным  фактом является то, что некоторые  современные системы (главным образом, те, которые основываются на файлах с древовидной структурой) не в  состоянии обеспечить представление  данных для отношений, которые имеют  два или более одинаковых домена. Примером такой системы является текущая версия IMS/360 [5].

      Ко  всем данным, находящимся в банке  данных, можно относиться как к  коллекции изменяющихся во времени  отношений. Эти отношения обладают разными степенями. Во время существования каждого n-арного отношения в него могут вставляться дополнительные кортежи степени n, удаляться существующие кортежи и изменяться компоненты существующих в нем кортежей.

      Однако  во многих коммерческих, правительственных  и научных банках данных степени некоторых отношений бывают достаточно велики (степень 30 не является редкостью). Обычно не следует обременять пользователей потребностью помнить порядок доменов в любом отношении (например, порядок поставщик-деталь-количество в отношении поставка). Поэтому мы предлагаем, чтобы пользователи имели дело не с отношениями с упорядоченными доменами, а со связями, которые являются двойниками отношений с неупорядоченными доменами.2) Для достижения этого домены должны быть однозначно идентифицируемы, по крайней мере, в пределах любого данного отношения, без использования их позиции. Таким образом, там, где существует два или более одинаковых домена, мы требуем, чтобы в каждом случае имена доменов были уточнены отдельным именем роли, служащим для указания роли, которую этот домен играет в данном отношении.

Информация о работе Реляционная модель данных для больших совместно используемых банков данных