Расчетно-графическая работа по математической статистике

Автор: Пользователь скрыл имя, 07 Декабря 2012 в 20:01, курсовая работа

Описание работы

Составление вариационных рядов рассмотрим на следующем примере. Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: урожайностью картофеля и удельным весом сортовых посевов.

Содержание

Глава 1. Построение и графическое изображение вариационных рядов...3
Порядок построения вариационных рядов и их графическое изображение………………………………………………….....3
Методика построения вариационных рядов и их графиков с помощью электронных таблиц Excel……………………....….5
Глава 2. Статистические характеристики рядов распределения………......8
2.1. Показатели центра распределения…………………………….....8
2.2. Показатели колеблемости признака……………………………...9
2.3. Показатели формы распределения……………...………..……..10
2.4. Расчет статистических характеристик рядов распределения с помощью Excel………………………………………………………..12
2.5. Статистические оценки параметров распределения…………...14
2.6. Проверка гипотезы о законе нормального распределения……15
2.7. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel…….17
Глава 3. Корреляционно-регрессионный анализ………………………….19
3.1. Определение параметров уравнения регрессии и показателей тесноты корреляционной связи……………………………….…….19
3.2. Оценка значимости уравнения регрессии и параметров тесноты связи…………………………………………………………………..23
3.3. Корреляционно-регрессионный анализ в Excel…………

Работа содержит 1 файл

Шевчук Ксения Б-ЭК-Б-301.doc

— 723.00 Кб (Скачать)

 

Рис.3. Хи тест

В данном примере (рис. 3.) есть неточность, поэтому результаты оценки являются смещёнными. При теоретических частотах меньше 5 необхадимо объединить соседние группы и провести тест заново.

Группа 
предприятий по бонитету почв

Фактические 
частоты 
ni

Середины 
интервалов

t

Теоретические частоты 
nt

17,5-21,5

9

19,5

-1,03

0,2347

18,57

4,36

21,5-23,5

12

22,5

-0,10

0,397

18,57

7,37

23,5-25,5

3

24,5

0,52

0,3485

18,57

6,47

6

27,5

1,44

0,1415

18,57

2,63

 

30

         

ХИ критическое

11,07

         

Значимость  ХИ

0,00285

<α Нулевая гипотеза принимается

ХИ фактическое

18,07561

         

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ГЛАВА 3. Корреляционно-регрессионный анализ

 

3.1. Определение  параметров уравнения регрессии и показателей тесноты корреляционной связи

 

 Социально-экономические явления находятся между собой в сложной взаимосвязи, зависимости. По характеру зависимости статистика различает два вида связей:

  1. функциональную;
  2. корреляционную.

Корреляционная связь  характеризуется тем, что между  изменением независимой переменной (факторного признака) и зависимой  переменной нет полного соответствия: каждому значению факторного признака может соответствовать распределение значений результативного.

Корреляционная связь проявляется  лишь в массе случаев – в  совокупности достаточно большого объема. При этом изменение независимой  величины ведет к изменению среднего значения зависимой переменной.

По направлению различают прямые и обратные связи. При прямой связи с увеличением факторного признака увеличивается результативный. При обратной связи с ростом факторного признака значения результативного уменьшаются.

По аналитическому выражению, связи делятся на прямолинейные (линейные) и криволинейные (нелинейные). Линейная связь выражается линейной функцией (уравнением прямой), нелинейная – криволинейной в виде параболы, гиперболы, показательной кривой и т.д.

Функция, отображающая корреляционную связь между признаками, называется уравнением регрессии. Уравнение регрессии выражается функцией .

Уравнения регрессии  могут иметь следующую форму.

Уравнение прямой:

Уравнение гиперболы:

Уравнение параболы второго порядка:

Степенное уравнение:

Показательное уравнение:

Многофакторная корреляционная связь чаще всего описывается  линейным уравнением множественной  регрессии:

Параметр  в уравнении прямой называется коэффициентом регрессии. Он показывает, насколько в среднем изменяется величина результативного признака при изменении факторного на единицу. При прямой корреляционной связи коэффициент регрессии имеет положительный знак, при обратной – отрицательный.

Количественная характеристика корреляционной связи дается с помощью  ряда статистических показателей –  коэффициентов корреляции, регрессии  и т.д.

Наиболее распространенным и совершенным методом изучения корреляционных связей является корреляционно-регрессионный анализ. В процессе корреляционно-регрессионного анализа (КРА) решаются следующие задачи:

    1. определение формы и направления связи, ее количественное выражение в виде уравнения регрессии;
    2. характеристика тесноты связи;
    3. определение значимости, существенности выборочных характеристик тесноты корреляционной связи.

Параметры уравнения  регрессии находятся способом наименьших квадратов. Сущность метода заключается  в нахождении параметров уравнения, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических, полученных по выбранному уравнению регрессии, минимальна. Он дает систему нормальных уравнений, решая которую определяют параметры уравнения регрессии.

Для уравнения парной регрессии  система нормальных уравнений следующая:

                                             


                                             

Для гиперболы:

                                              


                                              

Для параболы второго порядка:


                                              

                                              

                                              

Параметры уравнения  множественной регрессии при  большом числе факторов рассчитываются на ЭВМ.

Для характеристики тесноты  парной корреляционной связи используются в основном два показателя:

    • линейный коэффициент корреляции и соответствующий ему коэффициент детерминации;
    • корреляционной отношение и соответствующий ему индекс детерминации.

Для измерения тесноты  линейной связи вычисляется линейный коэффициент корреляции. Статистика разработала ряд формул линейного коэффициента корреляции:

,

где – среднее квадратическое отклонение по факторному признаку;

   
,

где – среднее квадратическое отклонение по результативному признаку.

Линейный коэффициент  корреляции может принимать значение от минус единицы до плюс единицы. Положительный коэффициент корреляции указывает на прямую корреляционную связь, отрицательный – на обратную. Знак при коэффициенте корреляции совпадает со знаком коэффициента регрессию Принята следующая условная градация коэффициента корреляции: r<0,3 – связь слабая, r=0,3 – 0,7 – связь средней силы, r>0,7 – связь тесная.

Квадрат коэффициента корреляции носит название коэффициента детерминации. Он показывает долю факторного признака в вариации результативного.

Коэффициент корреляции достаточно точно оценивает степень  тесноты связи лишь при линейной форме зависимости. Для характеристики тесноты связи любой формы используется корреляционное отношение. Теоретическое корреляционное отношение определяется по формуле:

,

где – факторная дисперсия – дисперсия теоретических значений результативного признака, т.е. рассчитанных по уравнению регрессии;           – дисперсия эмпирических (фактических) значений результативного признака.

Указанные дисперсии  исчисляются по формулам:

,
,

где – теоретическое значение результативного признака; – среднее значение результативного признака в совокупности; – фактические (эмпирические) значения результативного признака.

При линейной связи корреляционное отношение может принимать значения от нуля до единицы. Чем ближе данный показатель к единице, тем теснее связь между изучаемыми признаками.

Параметры уравнения  регрессии и коэффициент корреляции могут быть рассчитаны с помощью табличного процессора Excel.

Мы получим результаты вычисления параметров уравнения регрессии, коэффициента корреляции и другие показатели, позволяющие определить значимость коэффициента корреляции и параметров уравнения регрессии.

 

  • 3.2. Оценка значимости уравнения регрессии и параметров тесноты связи
  •  

  • Для оценки существенности, значимости коэффициента корреляции используется t-критерий Стьюдента.

    Находится средняя ошибка коэффициента корреляции по формуле:

    .

    На основе ошибки рассчитывается t-критерий:

    .

    Рассчитанное значение t-критерия сравнивают с табличным, найденным в таблице распределения Стьюдента при уровне значимости 0,05 или 0,01 и числе степеней свободы n-1. Если расчетное значение t-критерия больше табличного, то коэффициент корреляции признается значимым.

    При криволинейной связи  для оценки значимости корреляционного  отношения и уравнения регрессии  применяется F-критерий. Он вычисляется по формуле:

    ,

    или

    ,

    где – корреляционное отношение; n – число наблюдений; m – число параметров в уравнении регрессии.

    Рассчитанное значение F сравнивается с табличным для принятого уровня значимости (0,05 или 0,01) и чисел степени свободы и . Если расчетное значение F превышает табличное, связь признается существенной.

    Значимость коэффициента регрессии устанавливается с  помощью t-критерия Стьюдента, который вычисляется по формуле:

    ,

    где – дисперсия коэффициента регрессии.

    Она вычисляется по формуле:

    ,

    где k – число факторных признаков в уравнении регрессии.

    Коэффициент регрессии признается значимым, если . отыскивается в таблице критических точек распределения Стьюдента при принятом уровне значимости и числе степеней свободы .

     

    3.3. Корреляционно-регрессионный анализ в Excel

     

    Проведём корреляционно-регрессионный  анализ взаимосвязи урожайности зерновых и бонитета почв.

     

    ВЫВОД ИТОГОВ

                   
                     

    Регрессионная статистика

                 

    Множественный R

    0,56971

                 

    R-квадрат

    0,32457

                 

    Нормированный R-квадрат

    0,30045

                 

    Стандартная ошибка

    3,13013

                 

    Наблюдения

    30

                 
                     

    Дисперсионный анализ

                   
     

    df

    SS

    MS

    F

    Значимость F

         

    Регрессия

    1

    131,8307

    131,8307

    13,4553

    0,0010

         

    Остаток

    28

    274,3360

    9,7977

             

    Итого

    29

    406,1667

               
                     
     

    Коэффициенты

    Стандартная 
    ошибка

    t-статистика

    P-Значение

    Нижние 
    95%

    Верхние 
    95%

    Нижние 
    95,0%

    Верхние 
    95,0%

    Y-пересечение

    -3,5236

    4,1444

    -0,8502

    0,4024

    -12,0130

    4,9658

    -12,0130

    4,9658

    Переменная X 1

    0,6594

    0,1798

    3,6681

    0,0010

    0,2912

    1,0277

    0,2912

    1,0277

    Информация о работе Расчетно-графическая работа по математической статистике