Автор: Пользователь скрыл имя, 03 Августа 2011 в 10:46, контрольная работа
Статистическое исследование может осуществляться по данным не сплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной её части. Одним из наиболее распространённых в статистике методов, применяющим не сплошное наблюдение, является выборочный метод.
Выборочный метод…………………………………………...………….3-7
Основные понятия выборочного метода……………………………7-10
Понятие ошибки выборки……………………………...……………..11-18
Выборочные характеристики распределения………….……………19-22
Графический метод представления статистических данных……….23-26
Примеры и решение задач…………………………………………....27-48
Список литературы…………………………………………………….…….49
d=
Σ| x i- x ~ | f/ Σf= 38,667/30=1.289 (млрд.
руб.)
Дисперсия представляет собой средний квадрат отклонений индивидуальных
значений признака от их средней величины.
б2= 72,167/30=2,406
Среднее квадратическое отклонение определим как корень квадратный из
дисперсии:
σ = 2,406 =1,551 (млрд. руб.)
Определим коэффициент вариации по формуле:
V= σ/ X *100%= 1,551/3,533=43,9% т.е. совокупность является количественно неоднородной, т.к. величина показателя превышает 33%.
Рассчитаем с вероятностью 0,954 возможные значения средней стоимости основных фондов. Вычислим предельную ошибку выборки с вероятностью 0,954 (t=2):
Δx= 2*
= 0.549 (млрд.
руб.)
Определим пределы генеральной средней:
x = x ± ΔX = 3.533±0.549
Т.е. с вероятностью 0,954 можно утверждать, что возможные значения средней стоимости основных фондов магазинов находятся в пределах от 2,984 до 4,082 млрд. руб.
Рассчитаем с вероятностью 0,997 возможные значения доли магазинов фирмы, имеющих стоимость основных фондов до 3,2 млрд. руб. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:
σ2W =W(1-W)
где M= - доля единиц, обладающим данным признаком в выборочной совокупности, в нашей задаче m = 15.
w=
σ2W=0.5(1-0.5)=0.25
Предельная ошибка выборки для доли определяется так:
Δx=3 *
Пределы доли признака в генеральной совокупности выглядят следующим
образом:
w –ΔW≤p ≤w + ΔW
p = 0,5 ± 0,266
0,234 ≤ p ≤ 0,766
Т.е.
возможные значения доли магазинов,
имеющих стоимость основных фондов
до 3,2 млрд. руб., находятся в пределах от
23,4% до 76,6%.
Задача №3 Найти уравнение корреляционной зависимости между признаками. Найти уравнение регрессии, коэффициент эластичности, ошибку аппроксимации. Рассчитать и проанализировать коэффициенты корреляции и детерминации. Сделать проверку. Зависимости между продолжительностью уборки озимой пшеницы и ее урожайностью.
Решение:
№ п/п | Продолжительность уборки озимой пшеницы, дни | Урожайность озимой пшеницы ц/га |
1 | 14 | 21 |
2 | 9 | 29 |
3 | 14 | 20 |
4 | 24 | 15 |
5 | 9 | 36 |
6 | 11 | 35 |
7 | 9 | 38 |
8 | 13 | 25 |
9 | 18 | 21 |
10 | 14 | 21 |
11 | 23 | 18 |
12 | 13 | 29 |
13 | 24 | 15 |
14 | 20 | 19 |
15 | 13 | 20 |
16 | 9 | 42 |
17 | 14 | 25 |
18 | 11 | 38 |
19 | 8 | 46 |
20 | 10 | 32 |
21 | 17 | 18 |
22 | 23 | 18 |
23 | 10 | 28 |
24 | 10 | 35 |
25 | 5 | 22 |
26 | 13 | 26 |
27 | 9 | 42 |
28 | 8 | 38 |
29 | 10 | 33 |
30 | 15 | 20 |
Связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Здесь ε - случайная ошибка (отклонение, возмущение).
Причины существования
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например,
функция суммарного
3. Неправильное описание
4. Неправильная функциональная
5. Ошибки измерения.
Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Тогда оценочное уравнение
Для оценки параметров α и
β - используют МНК (метод
Система нормальных уравнений.
Для наших данных система
Из первого уравнения выражаем а и подставим во второе уравнение
Получаем b = -1.32, a = 45.09
Уравнение регрессии:
y = -1.32 x + 45.09
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии.
Среднеквадратическое
Коэффициент корреляции
Рассчитываем показатель
Линейный коэффициент
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X высокая и обратная.
Уравнение регрессии (оценка уравнения
регрессии).
Линейное уравнение регрессии имеет вид y = -1.32 x + 45.09
Коэффициент эластичности.
Ошибка аппроксимации.
Оценим качество уравнения
Индекс корреляции (эмпирическое
корреляционное отношение).
где
Sy0 = 2329.5 + 981.2 = 3310.7
Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.
Для любой формы зависимости
теснота связи определяется с
помощью множественного
коэффициента корреляции:
Коэффициент детерминации.
Чаще всего, давая
R2= -0.762 = 0.5788
x | y | x 2 | y 2 | x • y | y(x) | (yi-ycp) 2 | (y-y(x))2 | (xi-xcp)2 | |y - yx|:y |
14 | 21 | 196 | 441 | 294 | 26.62 | 42.25 | 31.59 | 0.4444 | 0.2676 |
9 | 29 | 81 | 841 | 261 | 33.22 | 2.25 | 17.78 | 18.78 | 0.1454 |
14 | 20 | 196 | 400 | 280 | 26.62 | 56.25 | 43.83 | 0.4444 | 0.331 |
24 | 15 | 576 | 225 | 360 | 13.43 | 156.25 | 2.47 | 113.78 | 0.1048 |
9 | 36 | 81 | 1296 | 324 | 33.22 | 72.25 | 7.75 | 18.78 | 0.0773 |
11 | 35 | 121 | 1225 | 385 | 30.58 | 56.25 | 19.55 | 5.44 | 0.1263 |
9 | 38 | 81 | 1444 | 342 | 33.22 | 110.25 | 22.88 | 18.78 | 0.1259 |
13 | 25 | 169 | 625 | 325 | 27.94 | 6.25 | 8.64 | 0.1111 | 0.1176 |
18 | 21 | 324 | 441 | 378 | 21.34 | 42.25 | 0.1179 | 21.78 | 0.0164 |
14 | 21 | 196 | 441 | 294 | 26.62 | 42.25 | 31.59 | 0.4444 | 0.2676 |
23 | 18 | 529 | 324 | 414 | 14.75 | 90.25 | 10.58 | 93.44 | 0.1807 |
13 | 29 | 169 | 841 | 377 | 27.94 | 2.25 | 1.12 | 0.1111 | 0.0366 |
24 | 15 | 576 | 225 | 360 | 13.43 | 156.25 | 2.47 | 113.78 | 0.1048 |
20 | 19 | 400 | 361 | 380 | 18.7 | 72.25 | 0.0871 | 44.44 | 0.0155 |
13 | 20 | 169 | 400 | 260 | 27.94 | 56.25 | 63.04 | 0.1111 | 0.397 |
9 | 42 | 81 | 1764 | 378 | 33.22 | 210.25 | 77.14 | 18.78 | 0.2091 |
14 | 25 | 196 | 625 | 350 | 26.62 | 6.25 | 2.63 | 0.4444 | 0.0648 |
11 | 38 | 121 | 1444 | 418 | 30.58 | 110.25 | 55.08 | 5.44 | 0.1953 |
8 | 46 | 64 | 2116 | 368 | 34.54 | 342.25 | 131.42 | 28.44 | 0.2492 |
10 | 32 | 100 | 1024 | 320 | 31.9 | 20.25 | 0.0105 | 11.11 | 0.0032 |
17 | 18 | 289 | 324 | 306 | 22.66 | 90.25 | 21.74 | 13.44 | 0.259 |
23 | 18 | 529 | 324 | 414 | 14.75 | 90.25 | 10.58 | 93.44 | 0.1807 |
10 | 28 | 100 | 784 | 280 | 31.9 | 0.25 | 15.19 | 11.11 | 0.1392 |
10 | 35 | 100 | 1225 | 350 | 31.9 | 56.25 | 9.62 | 11.11 | 0.0886 |
5 | 22 | 25 | 484 | 110 | 38.49 | 30.25 | 272.05 | 69.44 | 0.7497 |
13 | 26 | 169 | 676 | 338 | 27.94 | 2.25 | 3.76 | 0.1111 | 0.0746 |
9 | 42 | 81 | 1764 | 378 | 33.22 | 210.25 | 77.14 | 18.78 | 0.2091 |
8 | 38 | 64 | 1444 | 304 | 34.54 | 110.25 | 12 | 28.44 | 0.0912 |
10 | 33 | 100 | 1089 | 330 | 31.9 | 30.25 | 1.22 | 11.11 | 0.0334 |
15 | 20 | 225 | 400 | 300 | 25.3 | 56.25 | 28.1 | 2.78 | 0.2651 |
400 | 825 | 6108 | 25017 | 9978 | 825 | 2329.5 | 981.2 | 774.67 | 5.13 |
Оценка параметров уравнения регрессии.
Значимость коэффициента
корреляции.
tкрит (n-m-1;α) = (28;0.01) = 2.467
где m = 1 - количество объясняющих переменных.
Интервальная оценка
для коэффициента корреляции (доверительный
интервал).
Доверительный интервал для
r(-0.9505;-0.5711)
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии
возмущений является величина:
S2y = 35.0428 - необъясненная дисперсия
(мера разброса зависимой переменной вокруг
линии регрессии).
Sy = 5.9197 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной
величины a.
Sb - стандартное отклонение случайной
величины b.
Доверительные интервалы для зависимой переменной.
(a + bxp ± ε)
где
Рассчитаем границы интервала,
в котором будет сосредоточено
99% возможных значений Y при неограниченно
большом числе наблюдений и Xp = 15
(45.09 + -1.32*15 ± 2.806)
(22.5;28.11)
Индивидуальные доверительные интервалы для Y при данном значении X.
(a + bxi ± ε)
где
xi | y = 45.09 + -1.32xi | εi | ymin | ymax |
14 | 26.62 | 14.85 | 11.77 | 41.47 |
9 | 33.22 | 15.02 | 18.2 | 48.24 |
14 | 26.62 | 14.85 | 11.77 | 41.47 |
24 | 13.43 | 15.87 | -2.44 | 29.29 |
9 | 33.22 | 15.02 | 18.2 | 48.24 |
11 | 30.58 | 14.9 | 15.68 | 45.47 |
9 | 33.22 | 15.02 | 18.2 | 48.24 |
13 | 27.94 | 14.85 | 13.09 | 42.79 |
18 | 21.34 | 15.05 | 6.3 | 36.39 |
14 | 26.62 | 14.85 | 11.77 | 41.47 |
23 | 14.75 | 15.69 | -0.9409 | 30.43 |
13 | 27.94 | 14.85 | 13.09 | 42.79 |
24 | 13.43 | 15.87 | -2.44 | 29.29 |
20 | 18.7 | 15.25 | 3.45 | 33.96 |
13 | 27.94 | 14.85 | 13.09 | 42.79 |
9 | 33.22 | 15.02 | 18.2 | 48.24 |
14 | 26.62 | 14.85 | 11.77 | 41.47 |
11 | 30.58 | 14.9 | 15.68 | 45.47 |
8 | 34.54 | 15.11 | 19.43 | 49.64 |
10 | 31.9 | 14.95 | 16.95 | 46.85 |
17 | 22.66 | 14.97 | 7.69 | 37.63 |
23 | 14.75 | 15.69 | -0.9409 | 30.43 |
10 | 31.9 | 14.95 | 16.95 | 46.85 |
10 | 31.9 | 14.95 | 16.95 | 46.85 |
5 | 38.49 | 15.48 | 23.02 | 53.97 |
13 | 27.94 | 14.85 | 13.09 | 42.79 |
9 | 33.22 | 15.02 | 18.2 | 48.24 |
8 | 34.54 | 15.11 | 19.43 | 49.64 |
10 | 31.9 | 14.95 | 16.95 | 46.85 |
15 | 25.3 | 14.87 | 10.43 | 40.17 |