Информационные технологии в статистике

Автор: Пользователь скрыл имя, 10 Февраля 2011 в 18:09, курсовая работа

Описание работы

Фундаментом и необходимым условием развития системы электронной обработки статистической информации является модернизация технической базы, которая во многом определяется научно-техническим прогрессом в области производства и применения средств вычислительной техники.
Поэтому становится актуальным исследование роли информационных технологий в статистике. В связи с этим целью работы явился анализ автоматизированного рабочего места статистика.
Для реализации указанной цели поставлены следующие задачи: рассмотреть роль информационных технологий в статистике; рассмотреть особенности автоматизированного рабочего места статистика.

Содержание

ВВЕДЕНИЕ 3
1. РОЛЬ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В СТАТИСТИКЕ 5
1.1. Необходимость модернизации органов государственной статистики 9
1.2. Электронная обработка статистических данных 11
1.3. Современные методы и средства электронной обработки статистической информации на основе баз данных 13
1.4. АРМ экономиста-статистика 18
2. АВТОМАТИЗАЦИЯ ДЕЯТЕЛЬНОСТИ В ОБЛАСТИ РАСПРОСТРАНЕНИЯ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ 22
2.1. Основные свойства и функциональная структура КАБСД 22
2.2. Информационные и диагностические средства КАБСД 28
2.3. АРМ статистика 33
3. СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В РОССИЙСКОЙ
СТАТИСТИКЕ 39
ЗАКЛЮЧЕНИЕ 45
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 46

Работа содержит 1 файл

КУРСОВАЯ АРМ СТАТИСТИКА.docx

— 83.00 Кб (Скачать)

     Агрегированный  объект представляет собой совокупность сгруппированных элементарных объектов на основе некоторых признаков. Такими признаками являются отрасли экономики, ведомственная подчиненность, территориальная  принадлежность и др., определяемые прежде всего общесоюзными классификаторами отраслей народного хозяйства, системой обозначений органов государственного управления и системой обозначений  административно-территориальных объектов. Базы данных, входящие в систему  интегрированных ресурсов, в зависимости  от объекта наблюдения делятся на микробазы и макробазы данных. Микробазы содержат информацию по объектам статистического наблюдения. Макробазы  данных содержат агрегированные данные, полученные после обработки информации.

     Для проектирования, ведения и представления  социально-экономической информации пользователям на основе создания микро- и макробаз данных, как было описано  ранее, применяется промышленная система  управления базами данных и создан и развивается инструментальный пакет прикладных программ «СТАТЭК». Эта система характеризуется  следующими параметрами:

  • эксплуатируется в ЛВС с использованием различных СУБД: MS SQL Server, Access, (ORACLE при развитии);
  • реализована в архитектуре клиент-сервер;
  • интегрирована с программными средствами Word, Excel, SPSS, Access, Microsoftmap;
  • разработана на объектно-ориентированном языке программирования Power Builder.

     В последние годы в мире сформировались новые направления (концепции) хранения и анализа статистической информации в виде баз данных, использующих новые, перспективные технические и промышленные программные средства их реализации. К ним относятся:

1) концепция  построения баз данных как  хранилища данных (Data Warehouse);

2) оперативная  аналитическая обработка (On-Line Analytical Processing, OLAP);

3) интеллектуальный  анализ данных — ИАД (Data Mining). Инструментальная система «СТАТЭК»  базируется на комплексном использовании  всех трех перечисленных направлений.

     В основе концепции хранилища данных лежат две основные идеи:

1) интеграция  в едином хранилище данных, описывающих  конкретные факты социально-экономических  явлений, событий, характеик объектов  статистического наблюдения. В процессе  интеграции должно выполняться  согласование рассогласованных  микроданных по объекту наблюдения  и, возможно, их агрегация. Данные  могут поступать из внешних  источников;

2) разделение  наборов данных и приложений, используемых для оперативной  обработки и применяемых для  решения задач анализа.

     Инструментальный  пакет «СТАТЭК» имеет трехуровневую  архитектуру. Реализация функции проектирования и ведения хранилища статистических данных осуществляется подсистемами первого  и второго уровней пакета «СТАТЭК».

     1.4. АРМ экономиста-статистика

 

      Для решения аналитических задач  в ГКС РФ широко используются АРМ экономиста-статистика.

      АРМ представляет собой комплекс программных  средств на ПЭВМ, обеспечивающих автоматизацию  решения аналитических задач  пользователя непосредственно на его  рабочем месте на основе автоматизации  трудовой деятельности экономиста-статистика.

      АРМ экономиста-статистика представляет собой  комплекс подсистем, обеспечивающих автоматизацию  процедур, необходимых для решения  аналитических задач: подсистема "Интерфейс", подсистема "Табличный процессор", подсистема "Математическая статистика", подсистема "Подготовка метаинформации на ПЭВМ для АБД".

      Подсистема "Интерфейс" обеспечивает связь  с внешними системами и между  подсистемами АРМ. Данная подсистема выполняет  следующие функции: ведение локальной  базы АБД на ПЭВМ (создание локальной  базы, ввод, корректировка, печать) ; загрузка в локальную базу обменного массива  АБД; выборка информации из локальной  базы в загрузочный массив АБД; ввод и корректировка информации локальной  базы на ПЭВМ; работа с совокупностью  локальных баз, в частности, их учет; выборка информации из локальной  базы в форматах подсистемы "Математическая статистика"; экономический анализ массива данных за любой период, совокупности объектов, анализ динамических рядов; автоматическое вычисление индексов физического объема, индексов цен, розничных  производных показателей (средних  и др.) .

      При анализе динамических рядов рассчитываются базисные и цепные индексы, абсолютные и относительные приросты, абсолютные и средние значения за определенный период, средний абсолютный прирост, темп роста.

      Для оформления результатов на экране дисплея  и в твердой копии можно  получить горизонтальные гистограммы  и графики, выборку информации из локальной базы в форматах подсистемы "Табличный процессор".

      Подсистема "Интерфейс" состоит из двух управляющих  модулей — "Вариант пользователя", "Вариант администратора базы" и ряда прикладных программ, реализующих  конкретные режимы работы.

      Подсистема "Табличный процессор" обеспечивает преобразование данных локальной базы или описанных таблиц в выходные формы, содержащиеся в текстовом  файле для дальнейшей их распечатки.

      На  основании данных текущей локальной  базы, описания таблиц, установленного фильтра подсистема "Табличный  процессор" получает выходные формы  в текстовом файле для дальнейшего  распечатывания.

      Табличная форма получается на полной локальной  базе или ее подмножестве. Для этого  вводится "фильтр", т.е. признаки ограничивающие параметры базы.

      Выходной  информацией подсистемы является текстовый  файл, содержащий полученную таблицу.

      Входной информацией подсистемы являются: локальная  база; описание таблиц (фильтр в базе, описание шапки, боковика, формул расчета  граф) .

      Подсистема "Математическая статистика" обеспечивает анализ данных методами математической статистики.

      Данные  поступают из подсистемы "Интерфейс" или вводятся вручную.

      Анализ  данных методами математической статистики осуществляется с помощью 3-х подсистем: динамический ряд, факторный анализ, корреляционный анализ.         30 Подсистема "Динамический ряд" осуществляет построение полигона, гистограммы частот и кумулятивной линии; подбирает тренд из выбранного класса функций; производит сглаживание исходного динамического ряда; строит прогноз на основе выбранного тренда и на основе авторегрессионной модели; производит анализ остатков на автокорреляцию и нормальность.

      Подсистема "Факторный анализ" позволяет  получить линейную модель, описанную  небольшим числом фундаментальных  единиц, факторов, содержательная интерпретация  которых является прерогативой квалифицированного пользователя. Кроме того здесь рассчитываются значения "нагрузок на общие факторы" и сами общие факторы.

      Предоставляется графическая интерпретация факторов на плоскости и в пространстве.

      Подсистема "Корреляционный анализ" позволяет  получить корреляционную матрицу, средние, стандартные отклонения, а также  критические значения трех типов: В  — бинарный (или дихотомический) , Р — ранжированный (порядковый) , Х — количественный (интервальный) .

      Результаты  работы данной подсистемы — корреляционная матрица — может использоваться в дальнейшем анализе, например, в  факторном анализе и представляет самостоятельный интерес для  проверки взаимосвязи между переменными (в том числе и между разными  типами) .

      Подсистема "Подготовка метаинформации на ПЭВМ для АБД" предназначена для  формирования файлов, содержащих информацию для программ формирования и обновления файлов базы данных АБД в пакетном режиме автономно на ПЭВМ.

      При этом от пользователя не требуется  знание сложного языка АБД, информация вводится в диалоговом режиме, а  соответствующие служебные записи для АБД формируются автоматически.  
 
 
 

 

  1. АВТОМАТИЗАЦИЯ ДЕЯТЕЛЬНОСТИ В ОБЛАСТИ  РАСПРОСТРАНЕНИЯ  СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ
 

     Статистическая  информация широко представлена на зарубежном информационном рынке. Существует несколько сотен АБД, хранящих статистическую информацию, которая используется в различных сферах экономики.

     В некоторых зарубежных АБД содержится статистическая информация по России, полученная как из официальных, так  и из неофициальных источников, однако ее доля в общем объеме информации, хранящейся в АБД, весьма незначительна.

     Расширение  гласности статистики, рост интереса к России во всем мире создают возможность построения отечественных коммерческих автоматизированных банков статистических данных (КАБСД). В органах государственной статистики имеются необходимые объективные предпосылки для создания и эксплуатации КАБСД – информационная база, развитая вычислительная сеть, достаточно высокий уровень подготовки кадров 

     2.1. Основные свойства  и функциональная  структура КАБСД 

     Создание  статистического АБД для коммерческой деятельности направлено на решение следующих основных задач:

  • обеспечение информационного обслуживания российских и зарубежных пользователей путем предоставления им доступа к проблемно-ориентированным и специализированным базам данных, содержащим динамические ряды показателей, аналитические текстовые и библиографические материалы российской государственной статистики;
  • обеспечение комплексного информационно-справочного обслуживания пользователей путем предоставления им информации о составе баз данных АБД, регламенте их актуализации и пополнения новыми статистическими показателями и материалами, комментариев по методологии исчисления и сопоставления данных, хранимых в АБД;
  • обучение пользователей работе с банком данных через автоматизированную обучающую подсистему КАБСД;

     предоставление  пользователям консультаций через автоматизированную систему электронной почты

     КАБСД обеспечивает следующие основные режимы информационного обслуживания пользователей: "on-line", "off-line", избирательное  распространение информации (ИРИ).

     Режим "on-line" наиболее распространен  и часто используется в информационном обслуживании пользователей в большинстве  коммерческих АБД. Он обеспечивает непосредственное взаимодействие пользователей с АБД в процессе поиска и обработки информации, которая передается на терминальное устройство (дисплей или персональную ЭВМ) в ходе сеанса работы с АБД.

     Режим "off-line" отличается от "on-line" тем, что информация, выдаваемая АБД по запросу пользователя, не направляется на терминальное устройство, а в  виде бумажного документа посылается пользователю по почте. Этот режим также достаточно распространен в коммерческих АБД. Он удовлетворяет многих пользователей, которые не нуждаются в особой оперативности получения информации из АБД. Распространенность режима "off-line" обусловлена и достаточно низкой по сравнению с режимом "on-line" стоимостью услуг.

     Режим избирательного распространения информации ИРИ является развитой формой режима "off-line" и строится на основе каталогизированных запросов. В этом режиме пользователь может поместить свой запрос в каталог запросов АБД на долгосрочное хранение для постоянного получе

     получения по почте новых данных по интересующей его тематике. КАБСД должен обеспечивать автоматический просмотр каталогизированных запросов и выдачу информации: при каждой актуализации данных, на которые имеется ссылка в каталогизированном запросе; по требованию пользователя; в заданные пользователем моменты времени.

     Цены  на услуги ИРИ выше, чем на услуги в режиме "off-line", однако удобство однократного формирования запроса  к АБД и постоянного получения новой информации привлекает к нему постоянных пользователей (научных работников, сотрудников коммерческих организаций, имеющих долговременные интересы, и т.д.).

     КАБСД представляет собой систему информационных, программных, языковых, организационных и технических средств, предназначенную для ввода, накопления, хранения, актуализации, обработки и выдачи статистических данных по запросам пользователей. Поэтому разработка КАБСД опирается прежде всего на общие принципы построения автоматизированных систем обработки экономической информации. Эти принципы нашли широкое отражение в отечественной и зарубежной литературе.

Информация о работе Информационные технологии в статистике