Назначение, задачи и особенности применения технологии оперативного анализа данных в АС АДППР “Аналитика 2000”

Автор: Пользователь скрыл имя, 03 Декабря 2012 в 23:44, реферат

Описание работы

Основные цели создания ПК «Аналитика» заключаются в:
сокращении времени и трудозатрат, необходимых для получения оперативной агрегированной информации;
повышении производительности труда сотрудников УТСиА
улучшении качества аналитических данных, выдаваемых, по запросам вышестоящих организаций;
предоставлении возможности руководителям высшего и
среднего звена, а также аналитикам ориентироваться в огромных
объемах данных и выбирать информацию, необходимую для принятия решений;
обеспечении возможности графического представления
данных, а также получения отчетов сводной информации.

Работа содержит 1 файл

Реферат Аналитика 2000.doc

— 172.50 Кб (Скачать)

 

 

 

 

 

Реферат

 

 

по дисциплине

“Информационные таможенные технологии”

 

 

 

тема

“Назначение, задачи и особенности применения технологии оперативного анализа данных в АС АДППР “Аналитика 2000””

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Содержание

 

 

Введение

Основные  цели создания ПК «Аналитика» заключаются  в:

  • сокращении времени и трудозатрат, необходимых для получения оперативной агрегированной информации;
  • повышении производительности труда сотрудников УТСиА
  • улучшении качества аналитических данных, выдаваемых, по запросам вышестоящих организаций;
  • предоставлении возможности руководителям высшего и 
    среднего звена, а также аналитикам ориентироваться в огромных 
    объемах данных и выбирать информацию, необходимую для принятия решений;
  • обеспечении возможности графического представления 
    данных, а также получения отчетов сводной информации.

Таможенный  процесс, реализуемый с помощью  ПК “Аналитика”, относится к аналитической части деятельности центрального аппарата ГТК России в области использования информации таможенной статистики внешней торговли России на федеральном уровне.

Исходной информацией  для решения аналитических задач являются данные из центральной базы данных электронных копий грузовых таможенных деклараций (ЦБД ГТД), размещенной в ГНИВЦ ГТК России. Непосредственно анализируемой конечным пользователем (аналитиком) с помощью ПК «Аналитика» информацией является база агрегированных данных (БАД) грузовых таможенных деклараций, полученная путем загрузки из ЦБД ГТД.

Результатом работы конечного пользователя (аналитика) являются различные (произвольные в рамках определенных размерностей) табличные формы и их графические представления.

ПК «Аналитика»  связан с другими комплексами, входящими в технологическую схему сбора и обработки информации ЕАИС ГТК России, единством используемых данных ЦБД ГТД и связанных с ней данных нормативно-справочной информации. ЦБД ГТД, сформированная программным комплексом загрузки и ведения ЦБД ГТД ЕАИС ГТК России, является источником данных для программного комплекса «Аналитика».

Программный комплекс «Аналитика» позволяет формировать и исполнять нерегламентированные («гибкие») запросы к базе агрегированных данных ГТД в среде СУБД Oracle и Oracle Express и относится к классу систем динамического анализа данных .

 

структура комплекса

Программный комплекс «Аналитика» имеет структуру, приведенную на рис.1.

Служебные подсистемы программного комплекса «Аналитика» обеспечивают работу функциональной подсистемы. К служебным относятся:

  • подсистема администрирования — обеспечивает выполнение 
    операций по разграничению доступа к ЦБД ГТД и базам агрегированных данных, по настройке сессии для осуществления взаимодействия с ЦБД ГТД, по определению параметров физического размещения файлов агрегированных данных;
  • подсистема загрузки — обеспечивает выполнение операций 
    по загрузке данных, подлежащих анализу из ЦБД ГТД (Хранили 
    ща Данных1), в базы агрегированных данных (Витрины Данных2). 

Подсистема  загрузки состоит из:

— задачи загрузки технологической БД — обеспечивает формирование промежуточной, технологической БД, используемой как источник данных для последующей загрузки агрегированных баз данных;

— задач загрузки баз агрегированных данных (БАД)- обеспечивает загрузку целевой базы данных Витрин Данных - в реляционном (задача загрузки реляционных БАД) и многомерном представлении (задача загрузки многомерных БАД);

— Функциональная подсистема программного комплекса «Аналитика» обеспечивает конечных пользователей — аналитиков (сотрудников УТСиА) возможностями анализа данных в рамках, определенных техническим заданием задач:

  • Задача 1 — «Общие итоги по всем товарам»;
  • Задача 2— «Распределение экспорта-импорта РФ по странам и товарам»;
  • Задача 3 — «Категории участников»;

Задача 4 — «Подакцизные товары».

 

Рис. 1 Структура программного комплекса  “Аналитика”3

Подсистема администрирования

 

Подсистема  обеспечивает выполнение стандартными средствами функций администрирования СУБД Oracle и Oracle Express в целях обеспечения функционирования программного комплекса «Аналитика».

Администрирование сервера Oracle включает выполнение следующих основных операций:

  • создание базы Oracle и выделение необходимого табличного пространства для технологической базы и реляционной базы агрегированных данных;
  • создание пользователя - «хозяина (OWNER)» таблиц технологической базы и реляционной базы агрегированных данных;
  • обеспечение доступа «хозяину» технологической базы к базе 
    ЦБД ГТД на сервере Oracle для осуществления DATABASE LINK 
    (связи) между технологической базой и ЦБД ГТД;
  • обеспечение доступа «хозяину» технологической базы к базе 
    НСИ на сервере Oracle для осуществления DATABASE LINK (связи) между технологической базой и базой НСИ.

Администрирование сервера Oracle Express включает выполнение следующих основных операций:

- определение и установку прав доступа пользователей на определенные базы Oracle Express либо через права доступа на файлы (Windows NT), либо через указание пользователей определенных баз данных (Oracle Express Administrator);

  • определение оптимального размера файла многомерной 
    базы агрегированных данных, задание имени базы данных, определение ее размещения;
  • обеспечение связи Oracle Express с Oracle для выполнения 
    загрузки многомерной базы агрегированных данных и для обеспечения взаимодействия многомерной и реляционных баз агрегированных данных в ходе решения аналитических задач.

Подсистема загрузки

 

Подсистема  загрузки обеспечивает выполнение операций по загрузке данных, подлежащих анализу, из ЦБД ГТД (Хранилища Данных) в технологическую базу данных и далее в реляционную и многомерную базы агрегированных данных (БАД) (Витрины Данных), рис. 2.

Задача загрузки технологической  базы данных

 

Загрузка  данных из ЦБД ГТД (Хранилища Данных) в целевые БД Витрин Данных осуществляется через промежуточную, технологическую реляционную БД (стрелка 1, рис.2). Выбор такого решения обусловлен следующим:

  • существующая сегодня реализация ЦБД ГТД допускает наличие ГТД, имеющих несуществующие или неопределенные ссылки на кодификаторы НСИ. Очевидно, что для задач анализа данных, где кодификатор выступает в роли одного из измерений многомерного куба, такое не допустимо. При загрузке в промежуточную базу данных эта проблема решается путем установки принудительной ссылки на специальное дополнительное значение классификатора. Например, в исходной ЦБД ГТД имеется запись ГТД, содержащая код страны отправления отсутствующих в кодификаторе стран мира и территорий, в этом случае в классификатор вводится дополнительное значение кода «неизвестная страна», а в данной записи ГТД делается ссылка на это значение. При загрузке данных из ЦБД в технологическую БД также производится дополнительная проверка;
  • формирование целевых баз данных Витрин Данных с выполнением функций агрегации информации ЦБД ГТД является весьма продолжительным (около 68 часов за два года) и ресурсоемким процессом. Поэтому с целью снижения нагрузки на ЦБД ГТД целесообразнее производить агрегацию данных и загрузку БД Витрин Данных из промежуточной технологической БД, более того, такую БД можно использовать в монопольном режиме опять же для ускорения выполнения операций агрегации данных, что практически невозможно при работе с ЦБД ГТД.


 

- процедура  формирования целевых баз данных  Витрин Данных работает тем эффективнее, чем меньше число полей в исходной БД. Исходная (технологическая) БД содержит около 20 полей (сущности ДЕКЛАРАЦИЯ и ТОВАР), в то время как ЦБД ГТД содержит в сумме более 520 полей;

— для увеличения производительности процедуры формирование целевых баз данных Витрин Данных при использование отдельной схемы исходной (технологической) БД можно создать столько индексов, сколько для этого нужно;

— для загрузки технологической БД право на доступ к ЦБД ГТД необходимо лишь на ограниченное время (4 часа) при помощи создания временного DATABASE LINK. С точки зрения информационной безопасности - чем меньше время доступа к информации, тем лучше.

Задачи загрузки базы агрегированных данных

 

Целевая база данных (Витрины Данных) программного комплекса «Аналитика», на которой непосредственно решаются задачи анализа данных, представлена реляционной и многомерной базами агрегированных данных.

При загрузке данных из технологической базы в  таблицы базы агрегированных данных (стрелка 2, рис.2) производится помесячное суммирование (агрегация) информации о статистической стоимости и количестве товара, обеспечивающая требуемые уровни агрегации информации для решения функциональных задач комплекса.

Гибридное решение, реализованное в программном  комплексе «Аналитика», при котором одна, наиболее часто используемая, часть агрегированных данных хранится в многомерной базе данных л среде МСУБД Oracle Express, а другая часть данных хранится в реляционной базе данных в среде РСУБД Oracle, откуда и выбирается в случае необходимости — обеспечивает быстрый доступ к агрегированным данным при оптимизации дисковой памяти.

Многомерная база агрегированных данных представляет собой набор объектов и данных, специальным образом организованных для просмотра информации в различных перспективах или срезах. Наиболее важными объектами многомерной базы данных .являются переменные, размерности, отношения (зависимости). При загрузке информации в объекты многомерной базы агрегированных данных из технологической базы (стрелка 3, рис.2) берется нормативно-справочная информация (кодификаторы), а из реляционной базы агрегированных данных - агрегированные данные о стоимости и количестве товара в соответствии с выбранным уровнем гибридного размещения агрегированных данных.

Функциональная подсистема

 

Функциональная подсистема программного комплекса «Аналитика» используется его конечным пользователем (аналитиком) дня непосредственного решения функциональных задач анализа данных, находящихся в целевых реляционной и многомерной базах агрегированных данных (Витринах Данных) ПК «Аналитика».

Решение конечным пользователем задач, входящих в  функциональную подсистему программного комплекса «Аналитика», заключается в анализе агрегированных данных посредством последовательности интерактивных динамических отчетов (таблиц и диаграмм), называемых брифингами.

Каждая из перечисленных ниже задач характеризуется  параметрами соответствующего операционного пространства - элементами данных, на множестве которых выполняется решение задачи анализа информации. Операционное пространство включает в себя:

  • Размерности (или Измерения) - атрибуты данных в модели, 
    комбинация значений которых однозначно определяет экземпляр набора значений данных (показателей) в базе агрегированных данных;
  • Показатели - значения агрегированных данных, подлежащие анализу. Для каждой допустимой комбинации значений размерностей в базе агрегированных данных может храниться только одно значение показателя.

Задача №1: «Общие итоги по всем товарам»

Характеристики  операционного пространства:

Размерности:

  • временной интервал выпуска ГТД - год, квартал, месяц;
  • товарная номенклатура ВЭД нотации года;
  • товарная номенклатура ВЭД нотации года;
  • страна-получатель товара (при направлении перемещения ЭКСПОРТ);
  • страна-отправитель товара (при направлении перемещения ИМПОРТ);
  • направление перемещения товара (экспорт-импорт);
  • таможенное управление, на территории которого производилось таможенное оформление.

Анализируемые показатели:

  • статистическая стоимость товара;
  • количество товара по основной единице измерения;
  • количество товара по дополнительной единице измерения. 
    Перечень размерностей, имеющих возможности по агрегации-дезагрегации:
  • таможенное управление (по всем управлениям, выборочно 
    по множеству управлений);
  • страны (по экономическим и географическим ареалам, по всем странам, выборочно по множеству стран);
  • коды ТНВЭД (с возможностью группировки по 2,4,6 и 9-ти знакам кода ТНВЭД, по множеству кодов).

Формы представления  анализируемых показателей:

Информация о работе Назначение, задачи и особенности применения технологии оперативного анализа данных в АС АДППР “Аналитика 2000”