Введение в теорию баз данных

Автор: Пользователь скрыл имя, 14 Декабря 2011 в 18:26, лекция

Описание работы

Лекция посвящена рассмотрению основных понятий теории баз данных и основных моделей данных, на которых строятся современные БД.

Работа содержит 1 файл

Лекция 1. Введение в теорию баз данных.doc

— 123.50 Кб (Скачать)
 

Groups:

GroupID Supervisor
1 Царев С.М.
2 Пестов Д.Н.
 

      Преимущества:

  1. Простота. В такой модели всего одна информационная конструкция, формализующая табличное представление. Она наиболее привычна для пользователя.
  2. Теоретическое обоснование. Существуют строгие методы нормализации данных в таблицах (будет подробно рассмотрено в лекциях 10-11).
  3. Независимость данных. При изменении БД, ее структуры необходимы бывают лишь минимальные изменения прикладных программ.
 

      Недостатки:

  1. Низкая скорость, т.к. требуются операции соединения.
  2. Большой расход памяти в силу организации всех данных в виде таблиц.
 
      
  1. Система инвертированных списков – система индексов. Систему инвертированных списков можно рассматривать как частный случай сетевой модели данных, которая имеет два уровня. Основные элементы: основной файл, инвертированный список (файл), список связей. В такой системе имеется несколько основных файлов, имеющих единую сквозную нумерацию.
 

      Пример. Рассмотрим объекты Сотрудники и Зарплата. 

Сотрудники:

Сотрудник Должность
01 Иванов программист
02 Сидоров лаборант
03 Шишкин преподаватель
04 Васильев преподаватель
 
 
 

Зарплата:

Сотрудник Дата Сумма
05 Иванов 1.10.2008 5000
06 Сидоров 5.10.2008 7500
07 Иванов 3.12.2008 10000
08 Шишкин 3.12.2008 8000
09 Васильев 25.01.2009 5000
10 Васильев 27.01.2009 8750
 

      Инвертированный список может быть сформирован по любому полю основных списков, в нем каждому значению сопоставляется список номеров (индексов). 

      Пример: инвертированный список Должность:

  • программист – 01;
  • лаборант – 02;
  • преподаватель – 03, 04
 

      Список  связей составляется только по основным столбцам. 

      Пример: рассмотрим два списка связей:

  • СотрудникиЗарплата:
    • 01 – 05, 07
    • 02 – 06
    • 03 – 08
    • 04 – 09, 10
  • ЗарплатаСотрудники:
    • 05 – 01
    • 06 – 02
    • 07 – 01
    • 08 – 03
    • 09 – 04
    • 10 – 04
 

      Инвертированные списки являются основой для создания информационно-поисковых систем (ИПС). В ИПС ключевые атрибуты соответствуют ключевым словам, определяющим тематику поиска. 

      Так как недостатки реляционной модели данных компенсируются ростом быстродействия и ресурсов современных компьютеров, то в настоящее время именно такие модели получили наибольшее распространение.

 

Архитектура БД

 

      Существует архитектура БД, предложенная исследовательской группой ANSI/SPARC1 и называется архитектурой ANSI/SPARC.

      Каждая  система баз данных не обязана  соответствовать этому определению, например, «малые» системы, весьма вероятно, не будут поддерживать все функции предложенной архитектуры. Тем не менее, рассматриваемая архитектура с достаточной точностью описывает большинство систем (и не только реляционных).

      Принято выделять три уровня в архитектуре СУБД.

  1. Внутренний уровень (называемый также физическим) наиболее близок к физическому хранилищу информации, т.е. связан со способами хранения информации на физических устройствах. Внутренний уровень отображает физические элементы для хранения информации. Он представляет собой бесконечное адресное пространство, из которого информация проецируется на внешние носители.
  2. Внешний уровень (называемый также пользовательским) наиболее близок к пользователям, т.е. связан со способами представления данных для отдельных пользователей (прикладной программист или конечный пользователь). Для каждого пользователя может существовать свой язык СУБД. Для прикладного программиста – это язык программирования, а для конечного пользователя – это язык, основанный на меню, формах и т.д. Но все эти языки включают язык данных, встроенный в СУБД. Для каждого отдельного пользователя может быть интересна некоторая отдельная часть БД. Такие части, с которыми работает пользователь, называются внешним представлением.
  3. Концептуальный уровень (называемый также логическим) является «промежуточным» уровнем между двумя первыми. Это представление всей информации БД в более абстрактной форме. На этом уровне хранятся собственно данные, независимые от формы их представления. Концептуальное представление состоит из множества экземпляров данных. Данные здесь представлены в виде концептуальной схемы. Кроме самих данных в эту схемы могут быть включены определения дополнительных средств, например, правила обеспечения целостности.
 

      Подробная схема архитектуры системы баз  данных представлена на рис. 1.5. 

 

Рис. 1.5. Уровни архитектуры систем баз данных

Классификация БД

 

      Базы  данных классифицируют по различным признакам, рассмотрим основные из них.

  1. По технологии обработки.
  • Централизованные. Хранятся в памяти одной вычислительной системы.
  • Распределенные. Состоят из нескольких, возможно пересекающихся частей, хранящихся в различных узлах вычислительной сети.
  1. По способу доступа к данным.
  • С локальным доступом. Характеризуется тем, что к такой БД имеется доступ пользователя одной ЭВМ.
  • С удаленным (сетевым) доступом. Доступно для всех пользователей сети.
  1. По архитектуре.
  • Файл-сервер. Предполагает выделение одной машины в сети в качестве центральной (сервер файлов), на ней хранится централизованная БД, которая используется совместно.
  • Клиент-сервер. Предполагается выделение сервера БД, который кроме хранения осуществляет обработку данных. Систему БД можно рассматривать как систему, состоящую из двух частей: сервер и набор клиентов. Сервером БД называется собственно СУБД, а клиентами – различные приложения, которые выполняются над СУБД.
  1. По содержимому.
  • Географические.
  • Исторические.
  • Научные.
  • Мультимедийные.
  • и т.д.
 

      Краткие итоги. Рассмотрены основные понятия баз данных, представлены различные классификации систем управления базами данных. Определены основные модели данных, которые используются в конкретных реализациях СУБД: иерархическая, сетевая, реляционная и система индексов.

Информация о работе Введение в теорию баз данных