Базы данных. Основные понятия и классификация

Автор: Пользователь скрыл имя, 12 Января 2013 в 20:38, контрольная работа

Описание работы

Базу данных (БД) можно определить как унифицированную совокупность данных, совместно используемую различными задачами в рамках некоторой единой автоматизированной информационной системы (ИС).
Теория управления базами данных как самостоятельная дисциплина начала развиваться приблизительно с начала 50-х годов двадцатого столетия. За это время в ней сложилась определенная система фундаментальных понятий.

Работа содержит 1 файл

Системы управления базами данных.doc

— 148.50 Кб (Скачать)

СОДЕРЖАНИЕ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Базу данных (БД) можно определить как унифицированную совокупность данных, совместно используемую различными задачами в рамках некоторой единой автоматизированной информационной системы (ИС).

Теория управления базами данных как  самостоятельная дисциплина начала развиваться приблизительно с начала 50-х годов двадцатого столетия. За это время в ней сложилась определенная система фундаментальных понятий. Приведем некоторые из них:

Предметная область - часть реального мира, подлежащую изучению с целью организации управления в этой сфере и последующей автоматизации процесса управления.

Объектом называется элемент информационной системы, сведения о котором хранятся в базе данных. Иногда объект также называют сущностью. Классом объектов называют их совокупность, обладающую одинаковым набором свойств.

Атрибут — это информационное отображение  свойств объекта. Ключевым элементом данных называются такой атрибут (или группа атрибутов), который позволяет определить значения других элементов данных. Запись данных — это совокупность значений связанных элементов данных.

Первичный ключ — это атрибут (или группа атрибутов), который уникальным образом идентифицируют каждый экземпляр объекта (запись). Вторичным ключом называется атрибут (или группа атрибутов), значение которого может повторяться для нескольких записей (экземпляров объекта). Прежде всего, вторичные ключи используются в операциях поиска записей.

Процедуры хранения данных в базе должны подчиняться некоторым общим  принципам, среди которых в первую очередь следует выделить:

  • целостность и непротиворечивость данных, под которыми понимается как физическая сохранность данных, так и предотвращение неверного использования данных, поддержка допустимых сочетаний их значений, защита от структурных искажений и несанкционированного доступа;
  • минимальная избыточность данных обозначает, что любой элемент данных должен храниться в базе в единственном виде, что позволяет избежать необходимости дублирования операций, производимых с ним.

Программное обеспечение, осуществляющее операции над базами данных, получило название СУБД — система управления базами данных.

Основные понятия.

Понятие «управление данными» (data management) впервые появляется задолго до баз данных (БД) и систем управления базами данных (СУБД) в качестве одной из основных функций операционной системы (ОС) ЭВМ.

В табл.1 приводится более или менее полная диаграмма различных траекторий управления данными ( стрелки означают выдачу запроса на данные, передача данных осуществляется в обратном направлении).

 











 

Табл.1.Управление данными в ОС и СУБД

Широкое использование баз данных различными категориями пользователей привело, с одной стороны, к созданию интерфейсов, требующих минимум времени на освоение средств управления системой, а с другой – к построению мощных, гибких СУБД, имеющих в том числе развитые средства защиты данных от случайного или преднамеренного разрушения. Появились и средства автоматизации разработки, позволяющие создать базу данных любому пользователю, даже не владеющему основами БД.

Возможности накапливать и оперативно обрабатывать большие объемы информации, характеризующие деятельность предприятий за достаточно длительные периоды и в различных аспектах, дали новый импульс к развитию аналитических систем. Такого рода системы поддержки принятия решений обычно используются для оценки и выбора альтернативных решений, прогнозирования, идентификации объектов и состояний и т.д.

Представление символьных данных.

Рассмотрим методы дискретного  представления информации, или кодирования (которые, кстати, появились задолго до эры вычислительных машин)..

Первым широко известным примером является азбука Морзе,в которой буквы латиницы (или кириллицы) и цифры кодируются сочетаниями из «точек» и «тире». Воспользуемся данным кодом для иллюстрации основных понятий, связанных с кодированием (не вдаваясь в теорию кодирования).

Кодируемые (обозначаемые) элементы входного алфавита обычно называют символами.

Кодирующие (обозначающие) элементы выходного  алфавита называют знаками, количество различных знаков в выходном алфавите назовем значностью; количество знаков в кодирующей последовательности для одного символа – разрядностью кода; последовательным кодом является такой, в котором знаки следуют один за другим во времени (например, радио- или оптические сигналы либо передача по двум проводам, 2-жильному кабелю), параллельным — тот, в котором знаки передаются одновременно (например, по четырем проходам, 4-жильиому кабелю), образуя символ (т. е. символ передается и один прием, в один момент времени).

Применительно к азбуке Морзе (AM):

  • символами являются элементы языкового алфавита (буквы А—Z или А—Я) и цифровой алфавит (здесь — цифры 0-9);
  • знаками — «точка» и «тире» (или «+» и «-» либо «1» и «О», короче — два любых разных знака);
  • поскольку знаков два, AM является двузначным (бинарным, двоичным) кодом, если бы их было 3, то мы имели бы дело с троичным, тернарным, трехзначным кодом;
  • поскольку число знаков в AM колеблется от 1 (буквы «Е», «Т») ДО 5 (Цифры), здесь имеет место код с переменной разрядностью (в АМ часто встречающиеся в тексте символы обозначены более короткими кодовыми комбинациями нежели редкие символы);
  • так как знаки передаются последовательно (электрические импульсы, звуковые или оптические сигналы разной длины, соответствующие «точкам» и «тире»), АМ есть последовательный код.

Первые опыты телеграфной связи  осуществлялись именно посредством AM, причем приемное устройство записывало импульсы переменной длины в виде «точек» и «тире» на  движущуюся телеграфную ленту, однако уже в начале ХХ в. осуществлен переход на 5-разрядный (5-битовый);- телеграфный код.

В табл.2,3 приводится перечень наиболее известных кодов, некоторые из них использовались первоначально для связи, кодирования данных, а затем для представления информации в ЭВМ:

  • код Бодо – 5-разрядный код, бывший в прошлом европейским стандартом для телеграфной связи (другое название – IA-1 – international alphabet #1);
  • М-2 (российское обозначение), или IA-2 (международное обозначение), - телеграфный код, предложенный Международным консультационным комитетом по телефонии и телеграфии (МККТТ) и заменивший код Бодо (табл.3).

Код

Разрядность

IA-2 (М-2, МККТТ-2)

5

Baudot (Бодо)

5

ISO-7 (IA-2, ASCII-2,USASII,ANSI X3 4)

7

EBCDIC

8

ASCII-8

8

Hollerit (Перфокарты Холлерита)

12


Таблица 2. Разрядность некоторых  наиболее известных кодов.

 

Символ

IA-2

Бодо

ISO-7

EBCDIC

ASCII-8

Холлерит

A

03

10

41

C1

A1

900

B

19

06

42

C2

A2

880

C

16

43

C3

A3

840

D

09

44

C4

A4

820

a

   

61

81

E1

 

b

   

62

82

E2

 

c

   

63

83

E3

 

d

   

64

84

E4

 

. (точка)

05

2E

4B

4E

842

, (запятая)

09

2C

6B

4C

242

: (двоеточие)

 

3B

5E

5B

40A

? (вопрос)

10

0D

3F

6F

5F

206


Таблица 3. Фрагменты некоторых кодовых таблиц.

  • ASCII (American Standard Code for information Interchange) — стандартный 7-битовый код для передачи данных, поддерживает 128 символов, включающих прописные и строчные символы латиницы, цифры, специальные значки и управляющие символы. Это код, к которому были добавлены некоторые национальные символы (10 бинарных комбинаций), был принят Международной организацией по стандартизации (ISO) как стандарт ISO-7;
  • EBCDIC (Expanded Binary Coded Decimal Inform Code) — 8-разрядный код, предложенный фирмой IBM для машин серий IBM/360-375 (внутреннее представление данных в памяти), а затем распространившийся и на системы других производителей;
  • ASCII-8 — 8-разрялиый код, принятый для внутреннего и внешнего представления данных в вычислительных системах. Включает стандартную часть (128 символов) и национальную (128 символов). Соответственно в зависимости от национальной части кодовые таблицы различаются (табл.4);
  • код Холлерита, предложенный для ПК (1913 г.), затем использовавшийся для кодирования информации перед вводом в ЭВМ с перфокарт.

 

Наименование кодовой страницы (Code page)

Интерпретация кодовой страницы

Latin-1

Международный стандарт (ISO-8859-1) для интерпретации 2-й половины 1 (128-256) кода ASCII, таблица предназначена для латиницы

Latin-8

Международный стандарт (ISO-8859-8) для иврита

Latin-C

Международный стандарт (ISO-8859) для кириллицы

СР-437

Стандарт IBM для интерпретации 2-й половины (128-256) кода ASCII, таблица предназначена для греческого алфавита

СР-850

Стандарт IBM для восточноевропейских алфавитов

CP-852

Стандарт IBM для греческого алфавита

СР-862

Стандарт IBM для иврита

СР-866

Стандарт IBM для русской кириллицы


Таблица 4. Некоторые кодовые таблицы  ASCII.

 

Одним из «последних слов» в процессе развития систем символьного кодирования является универсальный код UNICODE (Universal Code) — стандарт 16-разрядного кодирования символов.

Стандарт UNICODE разработан техническим комитетом, в который вошли представители ряда ведущих фирм. Он определяет коды, обеспечивающие идентификацию различных символов: букв, иероглифов, цифр и т. д. Код может использоваться вместо 7—8-битовых, в том числе и ASCII. Поскольку в 16-разрядном UNICODE можно закодировать 65 536 символов вместо 128 в ASCII, то отпадает необходимость в создании модификаций таблиц кодов. Это существенно упрощает обработку текстовых файлов, хотя и несколько увеличивает их размеры.

UNICODE охватывает 28 000 букв, знаков, слогов, иероглифов, национальных языков мира, 30 000 мест в UNICODE зарезервировано. Использование этого резерва дает возможность пользователям вводить математические, а также технические символы, а также создавать собственные символы.

При передаче данных часто используются избыточные коды, т.е. такие, которые за счет усложнения структуры позволяют повысить надежность передачи данных. К ним в первую очередь относятся коды с обнаружением ошибок. Чаще всего это циклические избыточные коды. Простая разновидность такого кода – код с контролем по четности. Широко используется для обнаружения ошибок в блоках данных также код контроля циклической избыточности CRC.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Уровни информационных процессов.

Данное понятие характеризует степень связи информационных процессов с предметной областью – информационные технологии; информационные системы; информационные ресурсы:

  • Автоматизированную информационную технологию (АИТ, ИТ) определим как целенаправленное и согласованное использование технических средств информатизации ( аппаратурный фактор); программных средств и систем ( программный фактор); информационных массивов и баз данных (информационный фактор); интеллектуальных усилий и человеческого труда (человеческий и гуманитарный фактор) для решения задач предметной области.
  • Информационные системы (АИС, ИС) определяются как комплексы информационных технологий, ориентированных на процедуры сбора, обработки, хранения, поиска, передачи и отображения предметной области;
  • Информационные ресурсы (ИР) — комплексы соответствующих информационных систем, рассматриваемые прежде всего на социально-экономических уровнях описания и применения, в принципе можно утверждать, что информационные технологии являются менее зависимыми от структуры и специфики подметной области, чем информационные системы и/или ресурсы, однако эта связь всегда существует.

База данных на уровне информационных технологий представляет собой коллекцию информации, обычно совокупность многих файлов, доступ к которой осуществляется либо через ФС ОС, либо посредством простых СУБД, (точнее, систем программирования с элементами СУБД), таких, Аccess, Foxpro. На уровне информационных систем БД является компонентой модели предметной области ИС и обычно поддерживается мощной СУБД (Oracle, Adabas, SQL Server), автономно реализующей основные операции доступа к данным, размещенным в небольшом количестве файлов ОС, без активной эксплуатации возможности ФС.

Информация о работе Базы данных. Основные понятия и классификация