Выборочное наблюдение

Автор: Пользователь скрыл имя, 03 Августа 2011 в 10:46, контрольная работа

Описание работы

Статистическое исследование может осуществляться по данным не сплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной её части. Одним из наиболее распространённых в статистике методов, применяющим не сплошное наблюдение, является выборочный метод.

Содержание

Выборочный метод…………………………………………...………….3-7
Основные понятия выборочного метода……………………………7-10
Понятие ошибки выборки……………………………...……………..11-18
Выборочные характеристики распределения………….……………19-22
Графический метод представления статистических данных……….23-26
Примеры и решение задач…………………………………………....27-48
Список литературы…………………………………………………….…….49

Работа содержит 1 файл

Статистика Наталья.doc

— 432.00 Кб (Скачать)
 

     d= Σ| x i- x ~ | f/ Σf= 38,667/30=1.289 (млрд. руб.) 

     Дисперсия представляет собой средний квадрат  отклонений индивидуальных

     значений  признака от их средней величины.

     

     б2= 72,167/30=2,406

     Среднее квадратическое отклонение определим  как корень квадратный из

     дисперсии:

      σ =    2,406 =1,551 (млрд. руб.)

     Определим коэффициент вариации по формуле:

     V= σ/ X *100%= 1,551/3,533=43,9% т.е. совокупность является количественно неоднородной, т.к. величина показателя превышает 33%.

     Рассчитаем  с вероятностью 0,954 возможные значения средней стоимости основных фондов. Вычислим предельную ошибку выборки с вероятностью 0,954 (t=2):

     

      Δx= 2* = 0.549   (млрд. руб.) 

     Определим пределы генеральной средней:

     x = x ± ΔX = 3.533±0.549

     Т.е. с вероятностью 0,954 можно утверждать, что возможные значения средней стоимости основных фондов магазинов находятся в пределах от 2,984 до 4,082 млрд. руб.

     Рассчитаем с вероятностью 0,997 возможные значения доли магазинов фирмы, имеющих стоимость основных фондов до 3,2 млрд. руб. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:

     σ2W =W(1-W)

     где M= - доля единиц, обладающим данным признаком в выборочной совокупности, в нашей задаче m = 15.

     w=

     σ2W=0.5(1-0.5)=0.25

     Предельная  ошибка выборки для доли определяется так:

       
Δx=3 *   

      Пределы доли признака в генеральной  совокупности выглядят следующим

     образом:

     w –ΔWp w + ΔW

     p = 0,5 ± 0,266

     0,234 ≤ p ≤ 0,766

     Т.е. возможные значения доли магазинов, имеющих стоимость основных фондов  до 3,2 млрд. руб., находятся в пределах от 23,4% до 76,6%. 
 

     Задача  №3 Найти уравнение корреляционной зависимости между признаками. Найти уравнение регрессии, коэффициент эластичности, ошибку аппроксимации. Рассчитать и проанализировать коэффициенты корреляции и детерминации. Сделать проверку. Зависимости между продолжительностью уборки озимой пшеницы и ее урожайностью.

     Решение:

№ п/п Продолжительность уборки озимой пшеницы, дни Урожайность озимой пшеницы ц/га
1 14 21
2 9 29
3 14 20
4 24 15
5 9 36
6 11 35
7 9 38
8 13 25
9 18 21
10 14 21
11 23 18
12 13 29
13 24 15
14 20 19
15 13 20
16 9 42
17 14 25
18 11 38
19 8 46
20 10 32
21 17 18
22 23 18
23 10 28
24 10 35
25 5 22
26 13 26
27 9 42
28 8 38
29 10 33
30 15 20
 
 

     Связь между всеми возможными значениями X и Y носит линейный характер.

       Линейное уравнение регрессии  имеет вид y = bx + a + ε

       Здесь ε - случайная ошибка (отклонение, возмущение).

       Причины существования случайной  ошибки:

      1. Невключение в регрессионную  модель значимых объясняющих  переменных;

      2. Агрегирование переменных. Например, функция суммарного потребления  – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.

      3. Неправильное описание структуры  модели;

      4. Неправильная функциональная спецификация;

      5. Ошибки измерения.

       Так как отклонения εi  для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:

      1) по наблюдениям xi и yi можно получить только оценки параметров α и β

      2) Оценками параметров α и β  регрессионной модели являются  соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;

       Тогда оценочное уравнение регрессии  (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где  ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.

       Для оценки параметров α и  β - используют МНК (метод наименьших  квадратов).

       Система нормальных уравнений. 

       Для наших данных система уравнений  имеет вид 

       Из первого уравнения выражаем  а и подставим во второе  уравнение

       Получаем b = -1.32, a = 45.09

       Уравнение регрессии:

      y = -1.32 x + 45.09

       Параметры уравнения регрессии.

       Выборочные средние. 
 
 

       Выборочные дисперсии. 
 

       Среднеквадратическое отклонение 
 

       Коэффициент корреляции

       Рассчитываем показатель тесноты  связи. Таким показателем является  выборочный линейный коэффициент корреляции, который рассчитывается по формуле: 

       Линейный коэффициент корреляции  принимает значения от –1 до +1.

       Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

      0.1 < rxy < 0.3: слабая;

      0.3 < rxy < 0.5: умеренная;

      0.5 < rxy < 0.7: заметная;

      0.7 < rxy < 0.9: высокая;

      0.9 < rxy < 1: весьма высокая;

       В нашем примере связь между признаком Y фактором X  высокая и обратная.

       Уравнение регрессии (оценка уравнения регрессии). 

       Линейное уравнение регрессии  имеет вид y = -1.32 x  + 45.09

       Коэффициент эластичности. 
 

       Ошибка аппроксимации.

       Оценим качество уравнения регрессии  с помощью ошибки абсолютной  аппроксимации. 
 

       Индекс корреляции (эмпирическое корреляционное отношение). 

       где

      Sy0 = 2329.5 + 981.2 = 3310.7

       Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

       Для любой формы зависимости  теснота связи определяется с  помощью множественного коэффициента корреляции: 

       Коэффициент детерминации.

       Чаще всего, давая интерпретацию  коэффициента детерминации, его  выражают в процентах.

      R2= -0.762 = 0.5788

 x  y  x 2  y 2  x • y  y(x)  (yi-ycp) 2  (y-y(x))2  (xi-xcp)2  |y - yx|:y
 14  21  196  441  294  26.62  42.25  31.59  0.4444  0.2676
 9  29  81  841  261  33.22  2.25  17.78  18.78  0.1454
 14  20  196  400  280  26.62  56.25  43.83  0.4444  0.331
 24  15  576  225  360  13.43  156.25  2.47  113.78  0.1048
 9  36  81  1296  324  33.22  72.25  7.75  18.78  0.0773
 11  35  121  1225  385  30.58  56.25  19.55  5.44  0.1263
 9  38  81  1444  342  33.22  110.25  22.88  18.78  0.1259
 13  25  169  625  325  27.94  6.25  8.64  0.1111  0.1176
 18  21  324  441  378  21.34  42.25  0.1179  21.78  0.0164
 14  21  196  441  294  26.62  42.25  31.59  0.4444  0.2676
 23  18  529  324  414  14.75  90.25  10.58  93.44  0.1807
 13  29  169  841  377  27.94  2.25  1.12  0.1111  0.0366
 24  15  576  225  360  13.43  156.25  2.47  113.78  0.1048
 20  19  400  361  380  18.7  72.25  0.0871  44.44  0.0155
 13  20  169  400  260  27.94  56.25  63.04  0.1111  0.397
 9  42  81  1764  378  33.22  210.25  77.14  18.78  0.2091
 14  25  196  625  350  26.62  6.25  2.63  0.4444  0.0648
 11  38  121  1444  418  30.58  110.25  55.08  5.44  0.1953
 8  46  64  2116  368  34.54  342.25  131.42  28.44  0.2492
 10  32  100  1024  320  31.9  20.25  0.0105  11.11  0.0032
 17  18  289  324  306  22.66  90.25  21.74  13.44  0.259
 23  18  529  324  414  14.75  90.25  10.58  93.44  0.1807
 10  28  100  784  280  31.9  0.25  15.19  11.11  0.1392
 10  35  100  1225  350  31.9  56.25  9.62  11.11  0.0886
 5  22  25  484  110  38.49  30.25  272.05  69.44  0.7497
 13  26  169  676  338  27.94  2.25  3.76  0.1111  0.0746
 9  42  81  1764  378  33.22  210.25  77.14  18.78  0.2091
 8  38  64  1444  304  34.54  110.25  12  28.44  0.0912
 10  33  100  1089  330  31.9  30.25  1.22  11.11  0.0334
 15  20  225  400  300  25.3  56.25  28.1  2.78  0.2651
 400  825  6108  25017  9978  825  2329.5  981.2  774.67  5.13

       Оценка параметров уравнения регрессии.

       Значимость коэффициента корреляции. 

       tкрит (n-m-1;α) = (28;0.01) = 2.467

       где m = 1 - количество объясняющих переменных.

       Интервальная оценка для коэффициента корреляции (доверительный интервал). 

       Доверительный интервал для коэффициента  корреляции 

       r(-0.9505;-0.5711)

       Анализ точности определения оценок коэффициентов регрессии.

       Несмещенной оценкой дисперсии  возмущений является величина: 
 

       S2y = 35.0428 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии). 

       Sy = 5.9197 - стандартная ошибка оценки (стандартная ошибка регрессии).

       Sa - стандартное отклонение случайной величины a. 
 

       Sb - стандартное отклонение случайной величины b. 
 

       Доверительные интервалы для зависимой переменной.

       (a + bxp ± ε)

       где 

       Рассчитаем границы интервала,  в котором будет сосредоточено  99% возможных значений Y при неограниченно большом числе наблюдений и Xp = 15 

      (45.09 + -1.32*15 ± 2.806)

      (22.5;28.11)

       Индивидуальные доверительные интервалы для Y при данном значении X.

       (a + bxi ± ε)

       где 
 

     
xi  y = 45.09 + -1.32xi  εi  ymin  ymax
 14  26.62  14.85  11.77  41.47
 9  33.22  15.02  18.2  48.24
 14  26.62  14.85  11.77  41.47
 24  13.43  15.87  -2.44  29.29
 9  33.22  15.02  18.2  48.24
 11  30.58  14.9  15.68  45.47
 9  33.22  15.02  18.2  48.24
 13  27.94  14.85  13.09  42.79
 18  21.34  15.05  6.3  36.39
 14  26.62  14.85  11.77  41.47
 23  14.75  15.69  -0.9409  30.43
 13  27.94  14.85  13.09  42.79
 24  13.43  15.87  -2.44  29.29
 20  18.7  15.25  3.45  33.96
 13  27.94  14.85  13.09  42.79
 9  33.22  15.02  18.2  48.24
 14  26.62  14.85  11.77  41.47
 11  30.58  14.9  15.68  45.47
 8  34.54  15.11  19.43  49.64
 10  31.9  14.95  16.95  46.85
 17  22.66  14.97  7.69  37.63
 23  14.75  15.69  -0.9409  30.43
 10  31.9  14.95  16.95  46.85
 10  31.9  14.95  16.95  46.85
 5  38.49  15.48  23.02  53.97
 13  27.94  14.85  13.09  42.79
 9  33.22  15.02  18.2  48.24
 8  34.54  15.11  19.43  49.64
 10  31.9  14.95  16.95  46.85
 15  25.3  14.87  10.43  40.17

Информация о работе Выборочное наблюдение