Введение в теорию баз данных
Автор: Пользователь скрыл имя, 14 Декабря 2011 в 18:26, лекция
Описание работы
Лекция посвящена рассмотрению основных понятий теории баз данных и основных моделей данных, на которых строятся современные БД.
Работа содержит 1 файл
Лекция 1. Введение в теорию баз данных.doc
— 123.50 Кб (Скачать)Лекция 1. Введение в теорию баз данных
Лекция
посвящена рассмотрению
основных понятий теории
баз данных и основных
моделей данных, на которых
строятся современные
БД.
Цель: выявить основные структурные элементы баз данных и основные принципы, используемые при их разработке.
Основные понятия
Существуют различные определения понятия база данных (БД). Чаще всего под БД понимается поименованная совокупность структурированных данных, относящихся к некоторой предметной области. Однако в этом случае БД весьма трудно отличить от обычной картотеки или архива документов.
Можно выделить три свойства, которые отличают БД от простой совокупности данных:
- БД хранится и обрабатывается в вычислительной системе.
- Данные в БД хорошо структурированы, т.е. выделены основные элементы, их типы и связи между элементами, а также ограничения на допустимые операции.
- Обеспечивается поиск и обработка данных.
Наиболее распространенным типом БД являются реляционные базы данных. Рассмотрим основные структурные элементы реляционной БД:
- Поле – элементарная единица организации данных. Для описания поля используют характеристики: имя, тип, длина, точность и т.д. Соответствует столбцу в таблице.
- Запись – совокупность логически связанных полей. Соответствует строке в таблице.
- Собственно таблица (отношение).
Система баз данных
Система баз данных (СБД) – это компьютеризированная система структурированных данных, основная цель которой хранение информации и предоставление ее по требованию.
Различают однопользовательские и многопользовательские системы.
Однопользовательская система (Single-user system) – это система, в которой в одно и то же время к БД может получить доступ только один пользователь.
Многопользовательская система (Multi-user system) – это система, в которой в каждый момент времени к БД могут получить доступ несколько пользователей. Основная задача такой системы – позволить пользователю работать с БД как с однопользовательской.
Обычно в СБД выделяют четыре основных элемента:
- Данные.
- Аппаратное обеспечение.
- Программное обеспечение (ПО).
- Пользователи.
Упрощенная
схема СБД представлена на рис. 1.1.
Рис. 1.1.
Элементы системы баз данных
Данные
Данные
в БД можно охарактеризовать как
интегрированные и общие. Интегрированные
данные можно представить как объединение
нескольких отдельных файлов, полностью
или частично неперекрывающихся. В случае
общих данных отдельные области данных
можно использовать нескольким различным
пользователям.
Аппаратное обеспечение
К нему относятся:
- накопители для хранения информации вместе с устройствами ввода/вывода;
- процессор вместе с основной памятью, которая используется для поддержки работы ПО системы.
Программное обеспечение
Основная часть ПО – это система управления базами данных, СУБД (DBMS – DataBase Management System – диспетчер БД).
Основная функция СУБД – предоставление пользователю возможности работать с БД, не вникая в детали на уровне аппаратуры.
СУБД
поддерживает пользовательские операции
высокого уровня. К таким операциям
относятся и операции, выполняемые
с помощью языка SQL (Structured Query Language,
структурированный язык запросов) – специального
языка БД. СУБД хотя и основной, но не единственный
программный компонент системы, среди
других можно назвать утилиты, средства
разработки приложений, генераторы отчетов
и другие.
Пользователи
Различают три группы пользователей СБД:
- Прикладные программисты. Для целей разработки прикладных программ, которые используют базы данных, применимы различные языки и среды программирования: Visual Basic, C++, Java, C# и другие. Прикладные программы получают доступ к базе данных посредством выдачи соответствующего запроса к СУБД (обычно это операторы SQL).
- Конечные (рядовые) пользователи. Конечный пользователь может получать доступ к базе данных, применяя одно из интерактивных приложений. Многие СУБД предоставляют не только средства для выполнения запросов SQL, но и графические утилиты, позволяющие создавать запросы без знания SQL.
- Администраторы БД. Занимаются управлением работы сервера БД.
Организация данных в БД
В базе данных выделяют следующие элементы:
- данные;
- объекты;
- связи;
- свойства.
Данные
В БД данные обычно называют постоянными, хотя они конечно не являются таковыми в общепринятом понимании. Так их назвали в сравнении с изменчивыми данными – транзитными (промежуточные результаты, входные, выходные данные).
Входные данные – это информация, передаваемая системе с терминала или рабочей станции. Когда эта информация сохранена в таблицах, она становится частью постоянных данных или влечет за собой изменения постоянных данных.
Выходные
данные – это сообщения и результаты,
выдаваемые системой на экран, печать
и иное устройство вывода.
Объекты
В
реляционных БД это таблицы (другое
название – отношения), описывающие
некоторые объекты реального мира. Реляционные
базы данных хранят все данные только
в таблицах.
Связи
Связи отображают зависимости между объектами. Как правило, они бывают двусторонними. Допустим, есть два объекта Students и Groups, по связи между ними можно ответить на два вопроса:
- какой группе принадлежит данный студент;
- какие студенты входят в данную группу.
Схема,
на которой представлены объекты
и их связи, называется Схема
объект-отношение или Диаграмма
объект-отношение
(рис. 1.2.).
Рис. 1.2.
Связь между таблицами Students
и Groups
В
схеме могут быть связи, указывающие
на один и тот же тип объекта. Например,
преподаватель является наставником молодого
преподавателя. В конкретном наборе объектов
может быть любое количество связей. Между
двумя таблицами может быть более одной
связи.
Свойства
Все объекты и связи имеют определенные свойства. Свойства объектов выражаются полями таблицы. Свойства связей выражаются в их характеристиках при формировании.
Виды моделей данных
Ядром любой БД является модель данных. Модель данных – это совокупность структуры данных и операций их обработки.
Кратко рассмотрим основные виды моделей данных и выявим их основные преимущества и недостатки, при этом будем учитывать факторы, характеризующие принципиальные особенности моделей, а также факторы, связанные с реализацией этих моделей на ЭВМ.
- Иерархическая модель данных. Представляет собой совокупность элементов, связанных по строго определенным правилам. Объекты, связанные иерархическими отношениями образуют ориентированный граф. Основными понятиями иерархической модели данных являются: уровень, узел (или элемент) и связь. Такая модель данных обладает следующими свойствами:
- каждый узел связан только с одним вышестоящим узлом, кроме вершины;
- иерархическая модель данных имеет только одну вершину, узел не подчинен более никаким узлам;
- от каждого узла существует единственный путь к вершине;
- связь не может быть установлена между объектами, находящимися через уровень;
- связь между узлами первого уровня не определяется.
Примеры.
- Файловая структура организации информации.
- Структура организации (директор, заместитель, руководители отделов, сотрудники) (рис.1.3).
Рис. 1.3.
Иерархическая структура данных
Преимущества:
- Простота.
- Минимальный расход памяти.
Недостатки:
- Отсутствие универсальности – не всякую информацию можно выразить в иерархической модели данных.
- Исключительно навигационный принцип доступа к данным.
- Доступ к данным только через корневой элемент.
- Сетевая модель данных. Элементами этой модели являются: уровень, узел, связь. Отличия в том, что элемент одного уровня может быть связан с любым количеством элементов соседнего уровня, и не существует подчиненности уровней друг другу.
Свойства сетевой модели:
- связь не может быть установлена между объектами, находящимися через уровень;
- связь между узлами первого уровня не определяется.
Пример.
Рассмотрим работу над проектами: можно
выделить три вида объектов – сотрудники,
проекты, заказчики (рис.1.4).
Рис. 1.4.
Сетевая структура данных
Преимущества:
- Универсальность.
- Возможность доступа к данным через значения нескольких отношений.
Недостатки:
- Сложность – обилие понятий, вариантов их взаимосвязей и способов реализации.
- Допустимость только навигационного принципа доступа к данным.
- Реляционная модель данных (табличная). Это способ представления данных в виде таблиц. Элементы: поле (столбец), запись (строка) и таблица (отношение). В дальнейшем мы будем рассматривать именно реляционную модель данных, которая используется в реляционных системах. Под реляционной системой понимается система, основанная на следующих принципах:
- данные пользователя представлены только в виде таблиц;
- пользователю предоставляются операторы, генерирующие новые таблицы из старых (для выборки данных).
Пример.
Рассмотрим отношения Студенты и
Группы:
Students:
| StudentID | LastName | FirstName | MiddleName | GroupID |
| 1 | Казаков | Петр | Владимирович | 1 |
| 2 | Васильев | Иван | Аркадьевич | 2 |
| 4 | Шишкина | Дарья | Сергеевна | 1 |