Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор: Пользователь скрыл имя, 08 Декабря 2011 в 23:04, лабораторная работа

Описание работы

Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные о среднегодовой стоимости основных производственных фондов и выпуске продукции за год по 32-м предприятиям, выпускающим однотипную продукцию (выборка 10%-ная, механическая).
В статистическом исследовании эти предприятия выступают как единицы выборочной совокупности. Генеральную совокупность образуют все предприятия корпорации. Анализируемые признаки предприятий – Среднегодовая стоимость основных производственных фондов и Выпуск продукции – изучаемые признаки единиц совокупности.

Работа содержит 1 файл

oth_alg(Коряжная, 2 вариант).doc

— 656.00 Кб (Скачать)

5.1.2. Зависимость доверительных  интервалов коэффициентов  уравнения от заданного  уровня надежности

     Доверительные интервалы коэффициентов а0, а1 построенного уравнения регрессии при уровнях надежности Р=0,95 и Р=0,683 представлены в табл.2.7, на основе которой формируется табл.2.9.

     Таблица 2.9

     Границы доверительных интервалов коэффициентов уравнения

Коэффициенты Границы доверительных интервалов
Для уровня надежности Р=0,95 Для уровня надежности Р=0,683
нижняя верхняя нижняя верхняя
а0 -84,8549 18,3365 -58,9221 -7,5963
а1 0,9011 1,2775 0,9957 1,1829

     Вывод:

     В  генеральной  совокупности  предприятий  значение  коэффициента  а0 следует ожидать с надежностью Р=0,95 в пределах -84,85 а0 18.34, значение коэффициента а1 в пределах 0,90 а1 1,28. Уменьшение уровня надежности ведет к сужению доверительных интервалов коэффициентов уравнения.

        • Определение практической пригодности построенной регрессионной модели.

           Практическую  пригодность построенной модели можно охарактеризовать по величине линейного коэффициента корреляции r:

        • близость к единице свидетельствует о хорошей аппроксимации исходных (фактических) данных с помощью построенной линейной функции связи ;
        • близость к нулю означает, что связь между фактическими данными Х и Y нельзя аппроксимировать как построенной, так и любой другой линейной моделью, и, следовательно, для моделирования связи следует использовать какую-либо подходящую нелинейную модель.
        • Пригодность построенной регрессионной модели для практического использования можно оценить и по величине индекса детерминации R2, показывающего, какая часть общей вариации признака Y объясняется в построенной модели вариацией фактора X.
        • В основе такой оценки лежит равенство R = r (имеющее место для линейных моделей связи), а также шкала Чэддока, устанавливающая качественную характеристику тесноты связи в зависимости от величины r.
        • Согласно шкале Чэддока высокая степень тесноты связи признаков достигается лишь при >0,7, т.е. при >0,7. Для индекса детерминации R2 это означает выполнение неравенства R2 >0,5.
        • При недостаточно тесной связи признаков X, Y (слабой, умеренной, заметной) имеет место неравенство 0,7, а следовательно, и неравенство .
        • С учетом вышесказанного, практическая пригодность построенной модели связи оценивается по величине R2 следующим образом:
        • неравенство R2 >0,5 позволяет считать, что построенная модель пригодна для практического применения, т.к. в ней достигается высокая степень тесноты связи признаков X и Y, при которой более 50% вариации признака Y объясняется влиянием фактора Х;
        • неравенство означает, что построенная модель связи практического значения не имеет ввиду недостаточной тесноты связи между признаками X и Y, при которой менее 50% вариации признака Y объясняется влиянием фактора Х, и, следовательно, фактор Х влияет на вариацию Y в значительно меньшей степени, чем другие (неучтенные в модели) факторы.

           Значение  индекса детерминации R2 приводится в табл.2.5 в ячейке В79 (термин "R - квадрат").

           Вывод:

           Значение линейного коэффициента корреляции r и значение индекса детерминации R2 согласно табл. 2.5 равны: r =0,91, R2 =0,83. Поскольку и , то построенная линейная регрессионная модель связи  пригодна для практического использования.

        •   Общая оценка адекватности  регрессионной модели  по F-критерию Фишера

             Адекватность  построенной регрессионной модели фактическим данным (xi, yi) устанавливается по критерию Р.Фишера, оценивающему статистическую значимость (неслучайность) индекса детерминации R2.

             Рассчитанная  для уравнения регрессии оценка значимости R2 приведена в табл.2.6 в ячейке F86 (термин "Значимость F"). Если она меньше заданного уровня значимости α=0,05, то величина R2 признается неслучайной и, следовательно, построенное уравнение регрессии может быть использовано как модель связи между признаками Х и Y для генеральной совокупности предприятий отрасли.

         
         

             Вывод:

             Рассчитанный уровень значимости αр индекса детерминации R2 есть αр= 1,97601E-12. Так как он меньше заданного уровня значимости α=0,05, то значение R2 признается типичным и модель связи между признаками Х и Y -33,26+1,09Х применима для генеральной совокупности предприятий отрасли в целом.

          •   Оценка погрешности  регрессионной модели

               Погрешность регрессионной модели можно оценить  по величине стандартной ошибки построенного линейного уравнения регрессии . Величина ошибки оценивается как среднее квадратическое отклонение по совокупности отклонений исходных (фактических) значений yi признака Y от его теоретических значений , рассчитанных по построенной модели.

               Погрешность регрессионной модели выражается в  процентах и рассчитывается как  величина .100.

               В адекватных моделях погрешность  не должна превышать 12%-15%.

               Значение  приводится в выходной таблице "Регрессионная статистика" (табл.2.5) в ячейке В81 (термин "Стандартная ошибка"), значение    в таблице описательных  статистик (ЛР-1, Лист 1, табл.3, столбец 2).

               Вывод:

               Погрешность линейной регрессионной модели составляет .100= (23,93/260,87).100=9,17 %, что подтверждает адекватность построенной модели -33,26+1,09Х.

            Задача 6. Дать экономическую интерпретацию:

                1) коэффициента регрессии а1;

                3) остаточных величин  i.

                2) коэффициента эластичности КЭ;

          6.1. Экономическая интерпретация коэффициента регрессии а1

               В случае линейного уравнения регрессии  =a0+a1x величина коэффициента регрессии a1 показывает, на сколько в среднем (в абсолютном выражении) изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения. Знак при a1 показывает направление этого изменения.

           
           

               Вывод:

          Коэффициент регрессии а1 =1,09 показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1 млн руб. значение результативного признака Выпуск продукции увеличивается в среднем на 1,09 млн руб.

          6.2. Экономическая интерпретация  коэффициента эластичности.

               С целью расширения возможностей экономического анализа явления используется коэффициент эластичности , который измеряется в процентах и показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%.

               Средние значения и приведены в таблице описательных статистик (ЛР-1, Лист 1, табл.3).

               Расчет  коэффициента эластичности:

                =1,09*(270/260,87) =1,12%.

               Вывод:

               Значение  коэффициента эластичности Кэ=1,12 показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1% значение результативного признака Выпуск продукции увеличивается в среднем на 1,12%.

          6.3. Экономическая интерпретация  остаточных величин  εi

               Каждый  их остатков характеризует отклонение фактического значения yi от теоретического значения , рассчитанного по построенной регрессионной модели и определяющего, какого среднего значения    следует ожидать, когда фактор Х принимает значение xi.

               Анализируя  остатки, можно сделать ряд практических выводов, касающихся выпуска продукции  на рассматриваемых предприятиях отрасли.

               Значения  остатков i (таблица остатков из диапазона А98:С128) имеют как положительные, так и отрицательные отклонения от ожидаемого в среднем объема выпуска продукции (которые в итоге уравновешиваются, т.е. ).

               Экономический интерес представляют наибольшие расхождения между фактическим объемом выпускаемой продукции yi и ожидаемым усредненным объемом .

           
           

               Вывод:

               Согласно  таблице остатков максимальное превышение ожидаемого среднего объема выпускаемой  продукции  имеют три предприятия - с номерами 20, 27, 6,  а максимальные отрицательные отклонения - три предприятия с номерами 24, 8, 26. Именно эти шесть предприятий подлежат дальнейшему экономическому анализу для выяснения причин наибольших отклонений объема выпускаемой ими продукции от ожидаемого среднего объема и выявления резервов роста производства.

               Задача 7. Нахождение наиболее адекватного нелинейного уравнения регрессии с помощью средств инструмента Мастер диаграмм.

                Уравнения регрессии и их графики построены для 3-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.

                Уравнения регрессии и соответствующие  им индексы детерминации R2 приведены в табл.2.10 (при заполнении данной таблицы коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел).

               Таблица 2.10

               Регрессионные модели связи

               Вид уравнения      Уравнение регрессии Индекс

          детерминации  R2

          Полином 2-го порядка 0,0008х2+0,6846х+18,955 0,8353
          Полином 3-го порядка 0,00002х3-0,0148х2+4,7673х-327,88 0,8381
          Степенная функция 0,4481х1,1361 0,8372

                Выбор наиболее адекватного уравнения  регрессии определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

                Вывод:

                Максимальное  значение индекса детерминации R2 =0,8381. Следовательно, наиболее адекватное исходным данным нелинейное уравнение регрессии имеет вид 0,00002х3-0.0148х2+4,7673х-327,88.

           
           

                 ПРИЛОЖЕНИЕ 

          Результативные таблицы и графики

          Распечатка  Листа 2 Рабочего файла
           
           

             ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ  ИНСТИТУТ

           

             КАФЕДРА СТАТИСТИКИ

           
           
           
           
           
           
           

             О Т Ч Е Т 

             о результатах выполнения

             компьютерной  лабораторной работы

           

          Автоматизированный  анализ динамики социально-экономических  явлений в среде  MS Excel

           
           

             Вариант № 2

           
           
           
           
           
           
           
           
           

                          Выполнил: ст. IV курса 2 в/о гр 262100  

           

                                                                                        Коряжная Екатерина Александровна

           

                                                                                               Проверил: Зелепухина Елена Николаевна

           
           
           
           
           
           
           
           

          Новороссийск 2011 г.

           

          1. Постановка задачи  статистического  исследования 

                В процессе статистического изучения деятельности одного из предприятий получены данные о годовом выпуске продукции (в стоимостном выражении) за шестилетний период, а также данные о выпуске продукции по месяцам за 6-ой год.

                Полученные  два ряда динамики представлены на Листе 3 Рабочего файла в формате электронных таблиц процессора Excel, годовые данные – в диапазоне ячеек A6:B12, а данные за 6-ой год по месяцам - в диапазоне D6:E19.

                  Таблица 3.1
          Исходные  данные
          Годы Выпуск  продукции, млн. руб.   Месяцы Выпуск продукции, млн. руб.
          1 3320,00   январь 205,00
          2 3560,00   февраль 271,00
          3 3950,00   март 330,00
          4 3830,00   апрель 300,00
          5 4065,00   май 360,00
          6 4437,00   июнь 340,00
                июль 396,00
                август 371,00
                сентябрь 450,00
                октябрь 471,00
                ноябрь 483,00
                декабрь 460,00
                Итого 4437,00

                В процессе автоматизированного анализа динамики выпуска продукции за шестилетний период необходимо решить следующие статистические задачи.

          Задание 1. Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.

          Задание 2. Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции.

          Задание 3. Выявление тенденции развития изучаемого явления (тренда) по данным о выпуске продукции по месяцам за 6-ой год методами скользящей средней и аналитического выравнивания.

          2. Выводы по результатам  выполнения лабораторной  работы4

          Задание 1.

            Расчёт  и анализ показателей  ряда динамики выпуска продукции за шестилетний период.

          Выполнение  Задания 1 заключается в решении двух задач:

          Задача 1.1. Расчет цепных и базисных показателей динамики: абсолютный прирост; темп роста; темп прироста и абсолютное значение 1 % прироста.

          Задача 1.2. Расчет средних показателей ряда динамики: средний уровень ряда динамики; средний абсолютный прирост; средний темп роста и средний темп прироста.

                Задача 1.1.

              Аналитические показатели рядов динамики строятся на основе сравнения двух уровней  ряда. Используют два способа сравнения уровней:

              1) базисный способ, при котором каждый последующий уровень сравнивается с одним и тем же уровнем, принятым за базу сравнения (то есть база сравнения – постоянная);

              2) цепной способ, при котором каждый последующий уровень сравнивается с предыдущим уровнем (то есть база сравнения – переменная).

              Соответственно  различают:

                  - базисные показатели, обозначаемые надстрочным индексом б;

                  - цепные показатели, обозначаемые надстрочным индексом ц.

                Общеупотребительные обозначения уровней  ряда динамики:

                   yi – данный (текущий) уровень;

                   yi-1– предыдущий уровень;

                   y0 – базисный уровень;

                   yn – конечный уровень;

                К числу основных аналитических показателей рядов динамики, характеризующих изменения уровней ряда за отдельные промежутки времени, относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста, которые рассчитываются по следующим формулам:

                уiб = уi – уо,                                              уiц = уi – уi-1

                ,                              

                Тпрiрi-100 (%)                             

              Аналитические показатели годовых изменений уровней ряда приведены в табл.3.2.

           
                          Таблица 3.2
          Показатели  динамики выпуска продукции
          Годы Выпуск  продукции, млн. руб. Абсолютный  прирост,  
          млн. руб.
          Темп  роста, 
          %
          Темп  прироста, 
          %
          Абсолютное 
          значение 
          1% прироста
          цепной базисный цепной базисный цепной базисный
          1-й 3320,00              
          2-й 3560,00 240,00 240,00 107,23 107,23 7,23 7,23 33,20
          3-й 3950,00 390,00 630,00 110,96 118,98 10,96 18,98 35,60
          4-й 3830,00 -120,00 510,00 96,96 115,36 -3,04 15,36 39,50
          5-й 4065,00 235,00 745,00 106,14 122,44 6,14 22,44 38,30
          6-й 4437,00 372,00 1 117,00 109,15 133,64 9,15 33,64 40,65

                Вывод:

                Как показывают данные табл. 3.2, объем реализации произведенной продукции непостоянно повышался. В целом за исследуемый период объем реализации произведенной продукции повысился на 1117,00 млн. руб. (гр.4)  или на 33,64 % (гр.8). Рост объема реализации продукции носит скачкообразный характер, что подтверждается разнонаправленными значениями цепных абсолютных приростов (гр.3) и цепных темпов прироста (гр.7). Характер изменения объемов реализации продукции подтверждается также систематическим изменением величины абсолютного значения 1% прироста (гр.9).

                Задача 1.2.

                В табл.3.2 приведены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени необходимо рассчитать средние показатели динамики.

                В анализе динамики явления в зависимости  от вида исходного ряда динамики используются различные средние показатели динамики, характеризующие изменения ряда динамики в целом.

                Средний уровень ряда динамики ( ) характеризует типичную величину уровней ряда.

              Для интервального ряда динамики с равноотстоящими  уровнями средний уровень ряда определяется как простая арифметическая средняя из уровней ряда:

          ,

          где n- число уровней ряда.

                Средний абсолютный прирост ( ) является обобщающей характеристикой индивидуальных абсолютных приростов и определяется как простая арифметическая средняя из цепных абсолютных приростов:

                         

          где n- число уровней ряда.

                Средний темп роста ( ) – это обощающая характеристика интенсивности изменения уровней ряда, показывающая во сколько раз изменялись уровни ряда в среднем за единицу времени. Показатель может быть рассчитан по формуле

             

              

          где  n – число уровней ряда.

                Средний темп прироста ( ) рассчитывают с использованием среднего темпа роста по формуле:

                           

                Средние показатели ряда динамики выпуска продукции  представлены в табл.3.3.

           
                              Таблица 3.3

                

                Вывод.

                За  исследуемый период средний объем  реализации произведенной продукции  составил 3860,33 млн. руб. Выявлена положительная динамика реализации продукции: ежегодное увеличение объема реализации составляло в среднем 223,40 млн. руб. или 6,0 %.

                При среднем абсолютном приросте 223,40 млн. руб. отклонения по отдельным годам незначительны.

                Задание 2.

          Прогноз показателя выпуска  продукции на 7-ой год методом экстраполяции

                Применение  метода экстраполяции основано на инерционности развития социально-экономических явлений и заключается в предположении о том, что тенденция развития данного явления в будущем не будет претерпевать каких-либо существенных изменений. При этом с целью получения окончательного прогноза всегда следует учитывать все имеющиеся предпосылки и гипотезы дальнейшего развития рассматриваемого социально-экономического явления. Прогноз, сделанный на период экстраполяции (период упреждения), больший 1/3 рассмотренного периода развития явления, не может считаться научно обоснованным (например, по данным за 6 лет научно обоснованным будет прогноз лишь на 2 года вперед).

                Выполнение  Задания 2 заключается в решении двух задач:

          Задача 2.1. Прогнозирование выпуска продукции предприятием на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста.

          Задача 2.2. Прогнозирование выпуска продукции предприятием на год вперёд с использованием аналитического выравнивания ряда динамики по прямой, параболе и степенной функции.

                Задача 2.1.

                Прогнозирование уровня ряда динамики с использованием среднего абсолютного прироста и среднего темпа роста осуществляется соответственно по формулам:

          ,                                     (1),

                                                   (2),

           

          где: – прогнозируемый уровень;

                  t – период упреждения (число лет, кварталов и т.п.);

                  yi – базовый для прогноза уровень;

                  – средний за исследуемый период абсолютный прирост (среднегодовой, среднеквартальный и т.п.);

                 – средний за исследуемый период темп роста (среднегодовой, среднеквартальный и т.п.).

                Формула (1) применяется при относительно стабильных абсолютных приростах Δyц, что с некоторой степенью приближения соответствует линейной форме зависимости . Формула (2) используется при достаточно стабильных темпах ростах  ( ), что с некоторой степенью приближения соответствует показательной  форме зависимости .

                Прогнозные  оценки объема реализации продукции  на 7-ой год (по данным шестилетнего периода), рассмотренные с использованием среднего абсолютного прироста и среднего темпа роста (рассчитанные в задании 1), приведены в табл.3.4.

           
                              Таблица 3.4

                

                Вывод.

                Как показывают полученные прогнозные оценки, прогнозируемые объемы выпуска продукции на 7-ой год (по данным шестилетнего периода) достаточно близки между собой: 4660,40 и 4703,22 млн.руб. Расхождение полученных данных объясняется тем, что в основу прогнозирования положены разные методики экстраполяции рядов динамики.

                Задача 2.2.

                Прогнозирование выпуска продукции предприятием на год вперёд методом аналитического  выравнивания  ряда динамики по прямой, параболе и степенной функции выполнено с использованием средств инструмента МАСТЕР ДИАГРАММ. Результаты представлены на рис. 3.1 в виде уравнений регрессии и их графиков.

           

          Рис.3.1. График динамики выпуска продукции  за 6 лет и прогноз выпуска на год вперед

                Выбор наиболее адекватной трендовой модели определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

                Вывод:

                Максимальное  значение индекса детерминации R2 =0,9556. Следовательно, уравнение регрессии, наиболее адекватное данным о выпуске продукции за 6-летний период, имеет вид  23,426х3-245,26х2+937,03х+2578,7

                Рассчитанный  по данному уравнению прогноз  выпуска продукции на 7-ой год  составляет 5155,28 млн. руб., что существенно расходится с прогнозами, полученными в задаче 2.1.

          Задание 3.

          Выявление тенденции развития изучаемого явления (тренда) методами скользящей средней и аналитического выравнивания по данным о выпуске продукции  по месяцам за 6-ой год.

                Выполнение  Задания 3 заключается в решении двух задач:

          Задача 3.1. Расчет скользящей средней ряда, полученной на основе трёхзвенной скользящей суммы.

          Задача 3.2. Аналитическое выравнивание ряда динамики по прямой и параболе.

                Задача 3.1.

                Значения  скользящей средней, полученные на основе трёхзвенной скользящей суммы, представлены в табл. 3.5.

           
                              Таблица 3.5
          Выпуск  продукции за 6-ой год
          Месяцы Выпуск  продукции, млн. руб. Скользящее 
          среднее
          январь 205,00  
          февраль 271,00 268,67
          март 330,00 300,33
          апрель 300,00 330,00
          май 360,00 333,33
          июнь 340,00 365,33
          июль 396,00 369,00
          август 371,00 405,67
          сентябрь 450,00 430,67
          октябрь 471,00 468,00
          ноябрь 483,00 471,33
          декабрь 460,00  

                Вывод:

                Анализ  данных табл.3.5 показывает, что значения скользящей средней изменяются закономерно. Следовательно, можно установить основную тенденцию ряда – возрастание объемов  выпуска  продукции  по месяцам за 6-ой год.

                График  сглаживания ряда динамики выпуска продукции методом скользящей средней представлен на рис. 3.2.

           

          Рис.3.2. График сглаживания ряда динамики выпуска продукции за 6-ой год, сгенерированный в режиме «скользящее среднее» Пакета анализа

          Задача 3.2.

                Метод аналитического выравнивания позволяет  представить основную тенденцию (тренд) развития явления в виде функции  времени y=f(t).

                Для отображения трендов применяются  различные функции: линейные и нелинейные.

                Построение  графика выпуска продукции предприятием методом аналитического выравнивания ряда динамики по прямой и полиному 2-го порядка (параболе) выполнено с использованием средств инструмента МАСТЕР ДИАГРАММ и представлено на рис. 3.3.

           
           

              Рис. 3.3. График сглаживания по прямой и параболе ряда динамики выпуска продукции за 6-ой год

           

                Выбор наиболее адекватной трендовой модели определяется максимальным значением  индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

                Вывод:

                Максимальное  значение индекса детерминации R2 =0,9164. Следовательно, уравнение регрессии, наиболее адекватное данным о выпуске продукции за 6-ой год, имеет вид -0,8699х2+34,172х+194,75.

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel