Автор: Пользователь скрыл имя, 05 Ноября 2011 в 21:54, курсовая работа
Систематическая организация данных и способов их обработки осуществляется в банках данных. Банк данных = база данных + СУБД.
База данных - это некоторая структурированная совокупность данных, описывающая некоторую предметную область решаемых задач.
Элемент описания - наименьшая единица описания в базе данных. Совокупность элементов описания, объединенных отношением принадлежности к одному объекту называется записью.
СОДЕРЖАНИЕ 3
1. ПРОЕКТИРОВАНИЕ БАЗ ДАННЫХ 4
1.1. ОБЩИЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ 4
1.1.1. Основные определения 4
1.1.2. Понятие “Ключ” 4
1.1.3. Понятие «нормализации» 5
1.1.4. Понятие "сущность" и "связь" 5
1.2. ОБЩЕСИСТЕМНЫЙ РАЗДЕЛ 6
1.2.1. Модели данных. 6
1.2.2. Иерархические системы 6
1.2.3. Сетевые системы 7
1.2.4. Реляционная модель данных. 8
1.3. ПРЕДСТАВЛЕНИЕ ДАННЫХ С ПОМОЩЬЮ МОДЕЛИ СУЩНОСТЬ-СВЯЗЬ (ER- МОДЕЛЬ). 9
1.3.1. Нормальные формы ER-схем 9
1.3.2. Получение реляционной схемы из ER-схемы 10
1.4. ПРОЕКТИРОВАНИЕ РЕЛЯЦИОННЫХ БД 11
1.5. НОРМАЛИЗАЦИЯ. 12
2. СПЕЦИАЛЬНАЯ ЧАСТЬ 14
2.1. ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 14
2.2. ИССЛЕДОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ И РАЗРАБОТКА МОДЕЛИ 15
2.3. РЕАЛИЗАЦИЯ МОДЕЛИ 22
3. ЗАКЛЮЧЕНИЕ. 30
4. СПИСОК ЛИТЕРАТУРЫ: 32
Систематическая организация данных и способов их обработки осуществляется в банках данных. Банк данных = база данных + СУБД.
База данных - это некоторая структурированная совокупность данных, описывающая некоторую предметную область решаемых задач.
Элемент описания - наименьшая единица описания в базе данных. Совокупность элементов описания, объединенных отношением принадлежности к одному объекту называется записью.
Применение банков данных позволяет решить четыре основные проблемы:
Каждый кортеж должен иметь ключ — идентификатор. Иногда кортеж может идентифицироваться значением одного атрибута, но бывает и так, что для идентификации кортежа необходимы значения нескольких атрибутов.
Кортеж должен обладать двумя свойствами:
Нормализация — это декомпозиция исходной информационной таблицы на несколько таблиц, обладающих лучшими свойствами при добавлении, удалении или изменении данных.
Цель нормализации — получение такого проекта базы данных, в котором каждый факт появляется только в одном месте.
Теория нормализации основана на определении зависимостей между столбцами таблиц.
Функциональная зависимость — некоторое поле “В” таблицы функционально зависит от поля “А” таблицы в том и только в том случае, если в любой момент времени для каждого из значений “А” существует только 1 из значений “В” (поля “А” и “В” могут быть составными).
Полная функциональная зависимость — поле “В” находится в полной функциональной зависимости от “А” и не зависит функционально от любого подмножества “А”.
Полная декомпозиция таблицы - такая совокупность ее проекций, соединение которых полностью совпадает с содержимым таблиц.
Сущность – некоторый объект или процесс предметной области, который может быть идентифицирован некоторым образом.
Набор сущностей – множество сущностей одного типа. Сущность представляет из себя множество атрибутов.
Ключ – такая группа атрибутов, которая позволяет однозначно отображать набор сущностей в соответствующую группу набора значений.
Связь – некоторая ассоциация установленная между несколькими сущностями.
Набор связей – некоторое отношение между n-сущностями.
Если объединять 2 сущности – бинарная связь. Если больше двух n-арная связь.
Моделью данных (МД) является некоторое формализованное описание, отражающее состав и типы данных, а также взаимодействие между этими данными. Различают внешние и внутренние модели данных.
Внешняя модель данных (логическая подсхема) описывает структуру и характеристику информации, относящуюся к некоторой конкретной процедуре или к группе родственных процедур.
Внутренняя модель данных ( логическая схема) объединяет все логические подсхемы предметной области.
Модели данных различаются также по способу отражения данных на логическом уровне:
Типичным представителем (наиболее известным и распространенным) является Information Management System (IMS) фирмы IBM. Первая версия появилась в 1968 г. До сих пор поддерживается много баз данных, что создает существенные проблемы с переходом как на новую технологию БД, так и на новую технику.
Иерархическая БД состоит из упорядоченного набора деревьев; более точно, из упорядоченного набора нескольких экземпляров одного типа дерева.
Тип дерева состоит из одного "корневого" типа записи и упорядоченного набора из нуля или более типов поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи.
Эта модель данных является самой быстрой. Как показано на Рис.1 все связи идут строго сверху вниз, что соответствует структуре «дерева». Это обеспечивает быстрый и достоверный поиск необходимой информации.
Для иерархической МД определены такие понятия, как ключ и связь. Ключ представляет собой некоторое уникальное имя, которое является именем нужной записи. Для формирования ключа используется либо отдельный атрибут записи (простой) либо несколько атрибутов (составной). Связь же позволяет группировать записи в некоторое множество (группы) и позволяет указывать взаимоотношения между множествами.
Однако у нее имеется
Типичным представителем является Integrated Database Management System (IDMS) компании Cullinet Software, Inc., предназначенная для использования на машинах основного класса фирмы IBM под управлением большинства операционных систем. Архитектура системы основана на предложениях Data Base Task Group (DBTG) Комитета по языкам программирования Conference on Data Systems Languages (CODASYL), организации, ответственной за определение языка программирования Кобол. Отчет DBTG был опубликован в 1971 г., а в 70-х годах появилось несколько систем, среди которых IDMS.
Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков. Это показано на рисунке 2. Сетевая БД состоит из набора записей и набора связей между этими записями.
Это реализация связи между 2-мя сегментами. Каждый экземпляр набора имеет своего владельца и свой компонент. Допускается также, чтобы записи одного сегмента были владельцами нескольких наборов.
Реляционные базы данных используются для хранения, доступа к данным и управления ими. Данные хранятся в таблицах, представленных в виде логических столбцов и строк. Столбцы таблицы называются полями, а строки - записями. Каждой записи в таблице должна соответствовать информация в каждом поле. Пример простейший такой таблицы представлен в виде таблицы 1.1.
На сегодняшний день реляционные базы данных являются наиболее современными, хотя и уступают по времени доступа с вышеупомянутыми моделями.
Таблица 1.1
Код
Студента |
Ф.И.О. | Название дисциплины | Оценка |
0001
0002 0003 |
Бокарев А.С.
Бударов К.С. Кабанков П.Ю. |
Физика
Информатика Метрология |
Удовл
Хор Отл |
На использовании разновидностей ER-модели основано большинство современных подходов к проектированию баз данных (главным образом, реляционных). ER- модель основывается на некоторой важной семантической информации о предметной области предназначенная для логического представления данных. Является наиболее общей моделью и от нее могут быть поражены все остальные модели данных. ER- модель разработал Питер Чен в 1976 году. Любой фрагмент может быть представлять множество сущностей между которыми множество связей.
Как и в реляционных схемах баз данных, в ER-схемах вводится понятие нормальных форм, причем их смысл очень близко соответствует смыслу реляционных нормальных форм. Заметим, что формулировки нормальных форм ER-схем делают более понятным смысл нормализации реляционных схем.
В первой нормальной форме ER-схемы устраняются повторяющиеся атрибуты или группы атрибутов, т.е. производится выявление неявных сущностей, "замаскированных" под атрибуты.
Во
второй нормальной форме устраняются
атрибуты, зависящие только от части
уникального идентификатора. Эта
часть уникального
В третьей нормальной форме устраняются атрибуты, зависящие от атрибутов, не входящих в уникальный идентификатор. Эти атрибуты являются основой отдельной сущности.
Шаг 1. Каждая простая сущность превращается в таблицу. Простая сущность - сущность, не являющаяся подтипом и не имеющая подтипов. Имя сущности становится именем таблицы.
Шаг 2. Каждый атрибут становится возможным столбцом с тем же именем; может выбираться более точный формат. Столбцы, соответствующие необязательным атрибутам, могут содержать неопределенные значения; столбцы, соответствующие обязательным атрибутам, - не могут.
Шаг 3. Компоненты уникального идентификатора сущности превращаются в первичный ключ таблицы. Если имеется несколько возможных уникальных идентификатора, выбирается наиболее используемый. Если в состав уникального идентификатора входят связи, к числу столбцов первичного ключа добавляется копия уникального идентификатора сущности, находящейся на дальнем конце связи (этот процесс может продолжаться рекурсивно). Для именования этих столбцов используются имена концов связей и/или имена сущностей.
Шаг 4. Связи многие-к-одному (и один-к-одному) становятся внешними ключами. Т.е. делается копия уникального идентификатора с конца связи "один", и соответствующие столбцы составляют внешний ключ. Необязательные связи соответствуют столбцам, допускающим неопределенные значения; обязательные связи - столбцам, не допускающим неопределенные значения.
Шаг 5. Индексы создаются для первичного ключа (уникальный индекс), внешних ключей и тех атрибутов, на которых предполагается в основном базировать запросы.
При проектировании базы данных решаются две основных проблемы: