Автор: Пользователь скрыл имя, 13 Февраля 2011 в 15:14, реферат
Существующие недедуктивные системы форматированных данных предоставляют пользователям файлы с древовидной структурой или немного более общие сетевые модели данных. В разд. 1 обсуждаются недостатки таких моделей. Вводятся модель, основанная на n-арных отношениях, нормальная форма отношений базы данных и универсальный подъязык данных. В разд. 2 обсуждаются некоторые операции над отношениями (отличные от операций логического вывода), а затем эти операции применяются к проблемам избыточности и согласованности пользовательской модели.
1. Реляционная модель и нормальная форма
1.1. Введение
1.2. Зависимости данных в существующих системах
1.3. Реляционное представление данных
1.4. Нормальная форма
1.5. Некоторые лингвистические аспекты
1.6. Выразимые, именованные и хранимые отношения
2. Избыточность и согласованность
2.1. Операции над отношениями.
2.2. Избыточность
2.3. Согласованность
2.4. Заключение
Литература
Если π21(R) или S являются функциями,8) то при соединении R с S не может возникнуть точка неоднозначности. В этом случае естественное соединение является единственным соединением R с S. Заметьте, что повторяющееся уточнение "R с S" является необходимым, поскольку S может быть соединимым с R (как и R с S), и это соединение должно быть предметом полностью отдельного рассмотрения. На рис.5 ни одно из отношений R, π21(R), S, π21(S) не является функцией.
Неоднозначность в соединении R и S может быть иногда разрешена при помощи других отношений. Предположим, что нам даны или мы можем построить на доменах проект и поставщик из источников, не зависимых от R и S, отношение T со следующими свойствами:
В этом случае мы можем построить соединение трех отношений R, S, T, то есть тернарное отношение такое, что
π12(U)=R, π23(U)=S, π31(U)=T
Такое соединение мы будем называть циклическим 3-соединением, чтобы отличать его от линейного 3-соединения, которое представляло бы собой 4-арное отношение V такое, что
π12(V)=R, π23(V)=S, π34(V)=T.
Поскольку возможно существование более чем одного циклического 3-соединения (см., например, рис.8,9), обстоятельства, при которых это может происходить, накладывают гораздо более сильные ограничения, чем условия множественности 2-соединений. Более точно, отношения R, S, T должны содержать точки неоднозначности соединений R и S (скажем, точка x), S и T (скажем, y) и T и R ( скажем, z) и, более того, y должно соответствовать x в S, z соответствовать y в T и x соответствовать z в R. Заметьте, что на рис.8 точки x=a, y=d, z=2 обладают этими свойствами.
R (s p) | S (p j) | T (j s) |
1 a | a d | d 1 |
2 a | a e | d 2 |
2 b | b d | e 2 |
b e | e 2 |
Рисунок 8.Бинарные отношения с несколькими циклическими 3-соединениями
U (s p j) | U" (s p j) |
1 a d | 1 a d |
2 a e | 2 a d |
2 b d | 2 a e |
2 b e | 2 b d |
2 b e |
Рисунок 9.Два циклических 3-соединения отношений c рис.8
Естественное линейное соединение трех бинарных отношений R, S, T определяется так:
R*S*T = { (a,b,c,d) : R(a,b) ∧ S(b,c) ∧ T(c,d) },
где скобки в левой части равенства не нужны, т.к. естественное 2-соединение (*) ассоциативно. Для получения циклического аналога мы введем оператор ν, выдающий в качестве результата отношение степени n-1 из отношения степени n, связывая вместе его концы. Если R есть n-арное отношение (n≥2), то связывание R определяется уравнением
ν(R) = { (a1, a2, ....,an-1) : R(a1, a2, ...., an-1, an) ∧ a1=an}
Теперь мы можем представить естественное циклическое 3-соединение R, S, T выражением
ν(R*S*T).
Обобщение
понятий линейного и
Мы можем трактовать R как бинарное отношение над доменами A, B. Точно так же, мы можем трактовать S как бинарное отношение над доменами B, C. Теперь полностью применимы понятия линейного и циклического 3-соединений. Аналогичный подход может быть предпринят для линейных и циклических n-соединений n отношений разных степеней.
2.1.4. Композиция. Читатель, возможно, знаком с понятием композиции применительно к функциям. Мы обсудим обобщение этого понятия и применим его вначале к бинарным отношениям. Наши определения композиции и композиционности основаны непосредственно на определениях соединения и соединимости, приведенных выше.
Предположим, что нам даны два отношения R и S. T является композицией R и S, если существует соединение U отношений R и S такое, что T = π13 (U). Таким образом, два отношения являются композиционными в том и только в том случае, когда они являются соединяемыми. Однако, существование более чем одного соединения R и S не влечет за собой существования более чем одной композиции R и S.
Для естественного соединения R и S существует естественная композиция,9) определяемая как
R · S = π13 (R*S) .
Естественная композиция отношений R и S, приведенных на рис. 5, показана на рис.10, другая композиция приведена на рис.11 (получена из соединения, представленного на рис.7).
В случае существования двух или более соединений, количество различных композиций может варьироваться от 1 до общего количества различных соединений. Ha рис.12 представлен пример двух отношений, имеющих несколько соединений и всего одну композицию. Заметьте, что точка неоднозначности c теряется при композиции R и S, т.к. однозначное соответствие устанавливается через точки a,b,d,e.
R · S | (проект | поставщик) |
1 | 1 | |
1 | 2 | |
2 | 1 | |
2 | 2 |
Рисунок 10. Естественная композиция отношений R и S (показанных на рис.5)
T | (проект | поставщик) |
1 | 2 | |
2 | 1 |
Рисунок 11. Другая композиция отношений R и S (показанных на рис.5)
R | (поставщик | деталь) | S | (деталь | проект) |
1 | a | a | g | ||
1 | b | b | f | ||
1 | c | c | f | ||
2 | c | c | g | ||
2 | d | d | g | ||
2 | e | e | f |
Рисунок 12. Много соединений, только одна композиция
Расширение понятия композиции на пары необязательно бинарных отношений (возможно, с разными степенями) следует тому же подходу, что и расширение понятия попарного соединения таких отношений.
Недостаточное понимание понятия композиции привело некоторых разработчиков систем к ситуации, которую можно назвать ловушкой связей. Эта ловушка может быть проиллюстрирована на следующем примере. Предположим, что описание каждого поставщика связано указателями с описаниями каждой из деталей, поставляемых этим поставщиком, и, аналогичным образом, описание каждой детали связано с описаниями каждого проекта, использующего эту деталь. Напрашивающийся вывод, являющийся, вообще говоря, ошибочным, заключается в том, что если проследовать по всем путям от данного поставщика через детали, поставляемые им к проектам, в которых используются эти детали, то можно получить правильное множество всех проектов, в которых участвует этот поставщик. Такое заключение верно только в очень частном случае, когда искомое отношение между проектами и поставщиками является, по существу, естественным соединением двух других отношений – и конечно, мы должны добавить фразу "в любой момент времени", т.к. обычно это свойство подразумевает существование требований, относящихся к технике путей доступа.
Информация о работе Реляционная модель данных для больших совместно используемых банков данных