Автор: Пользователь скрыл имя, 25 Февраля 2013 в 14:32, курсовая работа
Рассмотреть технологии разработки и внедрения Хранилищ Данных. Подготовить этапы проекта. Выбор модели и структуры Хранилищ Данных.Рассмотреть понятие Витрины Данных. Анализ данных: OLAP. Разработать хранилище данных для врача-травмотолога. Подвести итоги.
Введение
1 Реферат……………………………………………………………………………………...5
Зарождение концепции хранилища данных…………………………...…...5
Логическая архитектура хранилища данных……………….………………6
Физическая архитектура хранилища данных…………………………...….8
Технология разработки и внедрения Хранилища Данных………………………….....9
Этапы проекта………………………………………………………………..9
Выбор модели данных Хранилища………………………..………………11
Выбор Структуры Хранилища Данных………………………………...…14
Витрины Данных………………………………………………………...…15
Хранилище Метаданных (Репозиторий)……………………………….....18
Загрузка хранилища……………………………………………………..…20
Анализ данных: OLAP……………………………………………………..22
3 Интеллектуальный анализ данных……………………………………………….........24
4 Разработка хранилища данных для врача травматолога ………………………….…26
4.1 Постановка задачи…………………………………………………………...26
4.2 Математическая модель………………………………………………….….27
4.3 Логическая модель…………………………………………………….….....27
4.4 Практическая реализация СППР для врача травматолога…………..….29
4.5 Результаты работы…………………………………………………....…….30
Заключение
Список литературы
Содержание
Техническое задание
Введение
1 Реферат……………………………………………………………
3 Интеллектуальный анализ
данных………………………………………………......
4 Разработка хранилища данных для врача травматолога ………………………….…26
4.1
Постановка задачи…………………………………………………………..
4.2 Математическая модель………………………………………………….….27
4.3
Логическая модель…………………………………………………….…..
4.4 Практическая реализация СППР для врача травматолога…………..….29
4.5
Результаты работы…………………………………………………....…
Заключение
Список литературы
Технические требования разрабатываются студентом и приводятся ниже в тексте задания.
Рассмотреть технологии разработки и внедрения Хранилищ Данных. Подготовить этапы проекта. Выбор модели и структуры Хранилищ Данных.Рассмотреть понятие Витрины Данных. Анализ данных: OLAP. Разработать хранилище данных для врача-травмотолога. Подвести итоги. |
Пояснительная записка оформляется
как единый текстовый документ, содержащий
разделы, подразделы и, при необходимости,
пункты и подпункты. Она должна начинаться
с титульного листа и технического
задания, утвержденного руководителем
курсового проекта. Пояснительная
записка оформляется в
Номер недели в семестре |
Основная тема консультации |
Основное содержание работы, выполняемой студентом между консультациями | |
осень |
весна | ||
1-2 |
23-24 |
Вводное занятие, составление списка группы и закрепление студентов за конкретными преподавателями. Разъяснение порядка выбора предметных тем курсовой работы |
Анализ литературы по теме работы. Выбор и формулировка темы работы и обоснование ее актуальности. |
3-4 |
25-26 |
Обсуждение предложенных студентами тем курсовых работ |
Отправка преподавателю |
5-6 |
27-28 |
Утверждение тем курсовых работ |
Подготовка и заполнение бланка технического
задания на выполнение работы. Отправка
его преподавателю и получение
подтверждения о его |
7-8 |
29-30 |
Утверждение технических заданий |
Сбор исходных данных и разработка метода решения задачи в соответствии с техническим заданием |
9-10 |
31-32 |
Обсуждение результатов выбора метода решения задачи |
Решение задачи |
11-12 |
33-34 |
Обсуждение результатов |
Подготовка пояснительной |
13-14 |
35-36 |
Утверждение пояснительной записки. Обсуждение структуры доклада. Обсуждение перечня слайдов |
Подготовка окончательного варианта текста доклада. Подготовка публичного выступления |
15-16 |
37-38 |
Публичная защита курсовой работы |
Задание принял к исполнению |
(_____________________) | |||
Задание выдал |
(____________________) |
Введение
В той или иной степени Системы Поддержки Принятия Решений (СППР) присутствуют в любой информационной системе (ИС). Поэтому, осознанно или нет, к задаче создания системы поддержки принятия решений организации приступают сразу после приобретения вычислительной техники и установки программного обеспечения. По мере развития бизнеса, упорядочения структуры организации и налаживания межкорпоративных связей, проблема разработки и внедрения СППР становится особенно актуальной. Одним из подходов к созданию таких систем стало использование хранилищ данных. В настоящей статье рассматриваются этапы и методики проведения подобных работ на опыте и с применением методологии компании Price Waterhouse, которая на сегодня выполнила 40 крупномасштабных проектов по созданию корпоративных Хранилищ Данных.
СППР можно, в зависимости от данных, c которыми они работают, разделить на оперативные, предназначенные для немедленного реагирования на текущую ситуацию, и стратегические - основанные на анализе большого количества информации из разных источников с привлечением сведений, содержащихся в системах, аккумулирующих опыт решения проблем.
СППР первого типа получили название Информационных Систем Руководства (Executive Information Systems, ИСР). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия или OLTP-системы, в идеале адекватно отражающей в режиме реального времени все аспекты производственного цикла предприятия. Для ИСР характерны следующие основные черты:
СППР второго типа предполагают
достаточно глубокую проработку данных,
специально преобразованных так, чтобы
их было удобно использовать в ходе
процесса принятия решений. Неотъемлемым
компонентом СППР этого уровня являются
правила принятия решений, которые
на основе агрегированных данных подсказывают
менеджерскому составу выводы и
придают системе черты
Ясно, что чем больше информации вовлечено в процесс принятия решений, тем более обоснованное решение может быть принято. Информация, на основе которой принимается решение, должна быть достоверной, полной, непротиворечивой и адекватной. Поэтому при проектировании СППР возникает вопрос о том, на основе каких данных эти системы будут работать. В ИСР качество оперативных решений обеспечивается тем, что данные выбираются непосредственно из информационной системы управления предприятием (или из БД предприятия), которая адекватно отражает состояние бизнеса на данный момент времени. Ранние версии СППР второго типа в качестве исходных использовали относительно небольшой объем агрегированных данных, поддающихся проверке на достоверность, полноту, непротиворечивость и адекватность.
По мере роста и развития ИСР,
а также совершенствования
В СППР второго типа традиционная технология подготовки интегрированной информации на основе запросов и отчетов стала неэффективной из-за резкого увеличения количества и разнообразия исходных данных. Это стало сильно задерживать менеджмент, для которого требовалось быстро принимать решения. Кроме того, постепенное накопление в БД предприятия данных для принятия решений и последующий их анализ стали отрицательно сказываться на оперативной работе с данными.
Решение было найдено и сформулировано в виде концепции Хранилища Данных (Data Warehouse, ХД), которое выполняло бы функции предварительной подготовки и хранения данных для СППР на основе информации из системы управления предприятием (или хранилища данных предприятия), а также информации из сторонних источников, которые в достаточном количестве стали доступны на рынке информации.
Этот подход потребовал новых технологических решений, к созданию которых несколько лет назад приступили основные производители промышленных СУБД и разработчики систем анализа данных. Сегодня накоплен обширный опыт разработки и внедрения специализированных структур данных и создания СППР на основе СУБД разных типов. Известна и технология создания больших Хранилищ, как правило, на основе реляционных СУБД.
Ограниченный объем статьи не позволил
рассмотреть все аспекты
В архитектуре, основанной на схеме «звезда», база данных состоит из таблицы фактов, которая описывает все транзакции, и таблицы измерений для каждой из сущностей. В примере с FSC каждая транзакция охватывает несколько сущностей — клиент, продавец, продукт, заказ, дата сделки и город, где сделка состоялась. Каждая сделка также имеет параметры — в нашем случае число проданных экземпляров продукта и общая сумма, которую заплатил покупатель.
Каждый кортеж в таблице фактов состоит из указателя на каждый объект в транзакции и численные параметры, связанные с транзакцией. Каждая таблица измерений состоит из столбцов, которые соответствуют атрибутам объекта. Вычисление соединения между таблицей фактов и набором таблиц измерений — более эффективная операция, чем вычисление соединения произвольных реляционных таблиц.
Некоторые сущности, однако, связаны в иерархии, которые схема «звезда» корректно не поддерживает. Иерархия — это многоуровневая группировка, каждый уровень которой состоит из непересекающихся групп значений уровня, находящегося непосредственно ниже данного. Так, все продукты могут группироваться в непересекающееся множество категорий, которые, в свою очередь, сгруппированы в непересекающееся множество семейств.
Схема «снежинка» — усовершенствованная схема «звезда», в которой иерархия измерений представляется точным образом благодаря нормализации таблиц измерений. В «звезде», приведенной на рис. 1, набор атрибутов описывает каждое измерение и может быть связан иерархией отношений. Например, измерение продукта FSC состоит из пяти атрибутов: имя продукта (Running Shoe 2000), категория (спортивная), семейство продуктов (обувь), цена (80 долл.) и маржа (80%).
|
Рис. 1. Схема «снежинка» для гипотетической компании Footwear Sellers Company. Набор атрибутов описывает каждое измерение и связывается через иерархию отношений. |
Системы баз данных используют избыточные
структуры, такие как индексы
и материализованные