СППР с помощью хранилищ данных

Автор: Пользователь скрыл имя, 25 Февраля 2013 в 14:32, курсовая работа

Описание работы

Рассмотреть технологии разработки и внедрения Хранилищ Данных. Подготовить этапы проекта. Выбор модели и структуры Хранилищ Данных.Рассмотреть понятие Витрины Данных. Анализ данных: OLAP. Разработать хранилище данных для врача-травмотолога. Подвести итоги.

Содержание

Введение
1 Реферат……………………………………………………………………………………...5
Зарождение концепции хранилища данных…………………………...…...5
Логическая архитектура хранилища данных……………….………………6
Физическая архитектура хранилища данных…………………………...….8
Технология разработки и внедрения Хранилища Данных………………………….....9
Этапы проекта………………………………………………………………..9
Выбор модели данных Хранилища………………………..………………11
Выбор Структуры Хранилища Данных………………………………...…14
Витрины Данных………………………………………………………...…15
Хранилище Метаданных (Репозиторий)……………………………….....18
Загрузка хранилища……………………………………………………..…20
Анализ данных: OLAP……………………………………………………..22
3 Интеллектуальный анализ данных……………………………………………….........24
4 Разработка хранилища данных для врача травматолога ………………………….…26
4.1 Постановка задачи…………………………………………………………...26
4.2 Математическая модель………………………………………………….….27
4.3 Логическая модель…………………………………………………….….....27
4.4 Практическая реализация СППР для врача травматолога…………..….29
4.5 Результаты работы…………………………………………………....…….30
Заключение
Список литературы

Работа содержит 1 файл

Курсовая работа..docx

— 436.24 Кб (Скачать)

Содержание

 

Техническое задание

Введение

1 Реферат……………………………………………………………………………………...5

    1. Зарождение концепции хранилища данных…………………………...…...5 

    1. Логическая архитектура хранилища  данных……………….………………6
    2. Физическая архитектура хранилища данных…………………………...….8
  1. Технология разработки и внедрения Хранилища Данных………………………….....9
    1. Этапы проекта………………………………………………………………..9
    2. Выбор модели данных Хранилища………………………..………………11
    3. Выбор Структуры Хранилища Данных………………………………...…14
    4. Витрины Данных………………………………………………………...…15
    5. Хранилище Метаданных (Репозиторий)……………………………….....18
    6. Загрузка хранилища……………………………………………………..…20
    7. Анализ данных: OLAP……………………………………………………..22

3  Интеллектуальный анализ данных……………………………………………….........24

4  Разработка хранилища данных для врача травматолога ………………………….…26

4.1          Постановка задачи…………………………………………………………...26

4.2          Математическая модель………………………………………………….….27

4.3          Логическая модель…………………………………………………….….....27

4.4         Практическая реализация СППР для врача травматолога…………..….29

4.5          Результаты работы…………………………………………………....…….30

Заключение

Список литературы

 

 

  1. ТЕХНИЧЕСКИЕ ТРЕБОВАНИЯ.

Технические требования разрабатываются  студентом и приводятся ниже в  тексте задания.

Рассмотреть технологии разработки и внедрения Хранилищ Данных. Подготовить  этапы проекта. Выбор модели и  структуры Хранилищ Данных.Рассмотреть понятие Витрины Данных. Анализ данных: OLAP. Разработать хранилище данных для врача-травмотолога. Подвести итоги.


  1. ТРЕБОВАНИЯ К ОФОРМЛЕНИЮ ПОЯСНИТЕЛЬНОЙ ЗАПИСКИ.

Пояснительная записка оформляется  как единый текстовый документ, содержащий разделы, подразделы и, при необходимости, пункты и подпункты. Она должна начинаться с титульного листа и технического задания, утвержденного руководителем  курсового проекта. Пояснительная  записка оформляется в соответствии с требованиями стандартов «Правила оформления текстовых документов» ГОСТ 7.32 - 2001, ГОСТ 2.105-95 (http://guap.ru/guap/standart/prav_main.shtml). Там же приведены примеры оформления библиографических ссылок.

  1. КАЛЕНДАРНЫЙ ГРАФИК РАБОТЫ

Номер недели в семестре

Основная тема консультации

Основное содержание работы, выполняемой  студентом между консультациями

осень

весна

1-2

23-24

Вводное занятие, составление списка группы и закрепление студентов  за конкретными преподавателями. Разъяснение  порядка выбора предметных тем курсовой работы

Анализ литературы по теме работы. Выбор  и формулировка темы работы и обоснование  ее актуальности.

3-4

25-26

Обсуждение предложенных студентами тем курсовых работ 

Отправка преподавателю формулировки темы курсовой работы и получение  подтверждения о ее утверждении

5-6

27-28

Утверждение тем курсовых работ 

Подготовка и заполнение бланка технического задания на выполнение работы. Отправка его преподавателю и получение  подтверждения о его утверждении

7-8

29-30

Утверждение технических заданий

Сбор исходных данных и разработка метода решения задачи в соответствии с техническим заданием

9-10

31-32

Обсуждение результатов выбора метода решения задачи

Решение задачи

11-12

33-34

Обсуждение результатов решения  задачи

Подготовка пояснительной записки, отправка ее преподавателю на предмет  ее утверждения. Подготовка структуры  доклада. Подготовка перечня слайдов  для выступления

13-14

35-36

Утверждение пояснительной записки. Обсуждение структуры доклада. Обсуждение перечня слайдов

Подготовка окончательного варианта текста доклада. Подготовка публичного выступления

15-16

37-38

Публичная защита курсовой работы

 

 

 

Задание принял к исполнению

 

(_____________________)

 

Задание выдал

 

(____________________)


 

 

Введение

 

В той или иной степени Системы  Поддержки Принятия Решений (СППР) присутствуют в любой информационной системе (ИС). Поэтому, осознанно или нет, к задаче создания системы поддержки принятия решений организации приступают сразу после приобретения вычислительной техники и установки программного обеспечения. По мере развития бизнеса, упорядочения структуры организации и налаживания межкорпоративных связей, проблема разработки и внедрения СППР становится особенно актуальной. Одним из подходов к созданию таких систем стало использование хранилищ данных. В настоящей статье рассматриваются этапы и методики проведения подобных работ на опыте и с применением методологии компании Price Waterhouse, которая на сегодня выполнила 40 крупномасштабных проектов по созданию корпоративных Хранилищ Данных.

СППР можно, в зависимости от данных, c которыми они работают, разделить на оперативные, предназначенные для немедленного реагирования на текущую ситуацию, и стратегические - основанные на анализе большого количества информации из разных источников с привлечением сведений, содержащихся в системах, аккумулирующих опыт решения проблем.

СППР первого типа получили название Информационных Систем Руководства (Executive Information Systems, ИСР). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия или OLTP-системы, в идеале адекватно отражающей в режиме реального времени все аспекты производственного цикла предприятия. Для ИСР характерны следующие основные черты:

  • отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;
  • ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т. п.;
  • как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.

СППР второго типа предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы  их было удобно использовать в ходе процесса принятия решений. Неотъемлемым компонентом СППР этого уровня являются правила принятия решений, которые  на основе агрегированных данных подсказывают менеджерскому составу выводы и  придают системе черты искусственного интеллекта. Такого рода системы создаются  только в том случае, если структура  бизнеса уже достаточно определена и имеются основания для обобщения  и анализа не только данных, но и  процессов их обработки. Если ИСР  есть не что иное как развитие системы оперативного управления производственными процессами, то СППР в современном понимании - это механизм развития бизнеса, который включает в себя некоторую часть управляющей информационной системы, обширную систему внешних связей предприятия, а также технологические и маркетинговые процессы развития производства.

 

 

    1. Реферат

1.1 Зарождение концепции хранилища данных

Ясно, что чем больше информации вовлечено в процесс принятия решений, тем более обоснованное решение может быть принято. Информация, на основе которой принимается решение, должна быть достоверной, полной, непротиворечивой и адекватной. Поэтому при проектировании СППР возникает вопрос о том, на основе каких данных эти системы будут  работать. В ИСР качество оперативных  решений обеспечивается тем, что  данные выбираются непосредственно  из информационной системы управления предприятием (или из БД предприятия), которая адекватно отражает состояние  бизнеса на данный момент времени. Ранние версии СППР второго типа в качестве исходных использовали относительно небольшой  объем агрегированных данных, поддающихся  проверке на достоверность, полноту, непротиворечивость и адекватность.

По мере роста и развития ИСР, а также совершенствования алгоритмов принятия решений на основе агрегированных данных, системы принятия решений  столкнулись с проблемами, вызванными необходимостью обеспечить растущие потребности  бизнеса. В ИСР накопился объем  данных, замедляющий процесс построения отчетов настолько, что менеджерский состав не успевал готовить на их основе соответствующие решения. Кроме  того, с развитием межкорпоративных связей потребовалось вовлекать в процесс анализа данные из внешних источников, не связанных напрямую с производственными процессами и потому не входящих в систему управления предприятием.

В СППР второго типа традиционная технология подготовки интегрированной  информации на основе запросов и отчетов  стала неэффективной из-за резкого  увеличения количества и разнообразия исходных данных. Это стало сильно задерживать менеджмент, для которого требовалось быстро принимать решения. Кроме того, постепенное накопление в БД предприятия данных для принятия решений и последующий их анализ стали отрицательно сказываться  на оперативной работе с данными.

Решение было найдено и сформулировано в виде концепции Хранилища Данных (Data Warehouse, ХД), которое выполняло бы функции предварительной подготовки и хранения данных для СППР на основе информации из системы управления предприятием (или хранилища данных предприятия), а также информации из сторонних источников, которые в достаточном количестве стали доступны на рынке информации.

Этот подход потребовал новых технологических  решений, к созданию которых несколько  лет назад приступили основные производители  промышленных СУБД и разработчики систем анализа данных. Сегодня накоплен обширный опыт разработки и внедрения  специализированных структур данных и  создания СППР на основе СУБД разных типов. Известна и технология создания больших  Хранилищ, как правило, на основе реляционных  СУБД.

Ограниченный объем статьи не позволил рассмотреть все аспекты Технологии Хранилищ Данных, поэтому некоторые  вопросы затронуты здесь только вскользь, а отдельные проблемы (например, взаимодействие СППР с Internet) не обсуждаются вовсе. Мы постарались сосредоточиться на ключевых этапах разработки ХД, чтобы охарактеризовать процесс разработки ХД в целом.

1.2. Логическая архитектура хранилища данных

 

В архитектуре, основанной на схеме «звезда», база данных состоит из таблицы фактов, которая описывает все транзакции, и таблицы измерений для каждой из сущностей. В примере с FSC каждая транзакция охватывает несколько сущностей — клиент, продавец, продукт, заказ, дата сделки и город, где сделка состоялась. Каждая сделка также имеет параметры — в нашем случае число проданных экземпляров продукта и общая сумма, которую заплатил покупатель.

Каждый кортеж в таблице фактов состоит из указателя на каждый объект в транзакции и численные параметры, связанные с транзакцией. Каждая таблица измерений состоит из столбцов, которые соответствуют атрибутам объекта. Вычисление соединения между таблицей фактов и набором таблиц измерений — более эффективная операция, чем вычисление соединения произвольных реляционных таблиц.

Некоторые сущности, однако, связаны  в иерархии, которые схема «звезда» корректно не поддерживает. Иерархия — это многоуровневая группировка, каждый уровень которой состоит из непересекающихся групп значений уровня, находящегося непосредственно ниже данного. Так, все продукты могут группироваться в непересекающееся множество категорий, которые, в свою очередь, сгруппированы в непересекающееся множество семейств.

Схема «снежинка» — усовершенствованная схема «звезда», в которой иерархия измерений представляется точным образом благодаря нормализации таблиц измерений. В «звезде», приведенной на рис. 1, набор атрибутов описывает каждое измерение и может быть связан иерархией отношений. Например, измерение продукта FSC состоит из пяти атрибутов: имя продукта (Running Shoe 2000), категория (спортивная), семейство продуктов (обувь), цена (80 долл.) и маржа (80%).

Рис. 1. Схема «снежинка» для гипотетической компании Footwear Sellers Company. Набор атрибутов описывает каждое измерение и связывается через иерархию отношений.


 

1.3. Физическая архитектура хранилища данных

 

Системы баз данных используют избыточные структуры, такие как индексы  и материализованные представления  для эффективной обработки сложных  запросов. Определение самого подходящего  набора индексов и представлений  — это сложная задача формирования физической архитектуры. Хотя поиск  в индексе и сканирование индекса  могут быть эффективны для запросов, связанных с выбором данных, запросы, предполагающие интенсивную обработку  данных, могут потребовать последовательного  сканирования всей реляционной таблицы  или ее вертикальных фрагментов. Увеличение эффективности сканирования таблиц и использование распараллеливания  для уменьшения времени ответа на запрос — важные моменты, которые  следует учитывать при проектировании физической архитектуры.

Информация о работе СППР с помощью хранилищ данных