Автор: Пользователь скрыл имя, 08 Ноября 2012 в 08:44, практическая работа
Имеются 15 предприятий региона. Их деятельность описывается двумя параметрами: х – производительностью труда и y – рентабельностью производства.
Проведение выборочного наблюдения.
Обосновать размер выборки (обеспечивающий необходимый уровень ошибки).
Всего в регионе насчитывается около 150 предприятий. Произведем из всей совокупности предприятий собственно-случайную бесповторную выборку, состоящую из 15 предприятий (то есть выберем каждое 10 предприятие).
Провести выборку одним из способов бесповторным или повторным методом.
Произведем выборку собственно-случайным бесповторным методом.
Квартили – это значения признака, делящие ранжированную совокупность на четыре равновеликие части. Выделяют нижний (Q1) и верхний (Q3) квартили. Нижний квартиль отделяет четвертую часть совокупности с наименьшими значениями признака, верхний – с наибольшими. Таким образом, 25 % единиц совокупности по величине будут меньше Q1; еще по 25 % будут заключены между Q1 и Q2, Q2 и Q3, а остальные 25 % – превосходить Q3.
,
?
где yQ1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25 %);
yQ3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75 %);
h – величина интервала;
SQ1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;
SQ3-1– накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;
fQ1 – частота интервала, содержащего нижний квартиль;
fQ3 – частота интервала, содержащего верхний квартиль.
Q2 = Me = 14,895
Квартили могут быть определены по кумуляте аналогично медианы – ось накопленных частот (ординат) делится на четыре 25-процентные равные части, и соответствующие отмеченным накопленным частотам на кумуляте варианты покажут значения квартилей.
Децили – это варианты, которые делят ранжированный ряд на десять равных частей.
ydi – нижняя граница интервала, содержащего i-ю часть разделенной на 10 равных частей совокупности;
h – величина интервала;
Sdi-1 – накопленная частота интервала, предшествующего интервалу, содержащему i-ю часть разделенной на 10 равных частей совокупности;
fdi – частота интервала, содержащего i-ю часть разделенной на 10 равных частей совокупности.
а) размах вариации, размах и полуразмах квартилей
Размах вариации – это разность между единицами совокупности с наибольшим и наименьшим значениями варьирующего признака.
R = ymax – ymin,
где ymax и ymin – наибольшее и наименьшее значения варьирующего признака.
R = 36,5 + 8,2 = 44,7
Размах квартилей – разность между значениями третьего и первого квартилей.
Q = Q3 – Q1 = 28,12 – 8,56 = 19,56
Полуразмах квартилей – разность между значениями второго и первого квартилей.
q = Q/2 = (Q3 – Q1)/2 = 19,56/2 = 9,78
б) Среднее линейное отклонение
Среднее линейное отклонение – определяется как средняя арифметическая из абсолютных значений отклонений вариант признака от их средней (взвешенная рассчитывается для сгруппированных данных).
Рассчитаем для рентабельности производства:
- простая
- взвешенная
в) Дисперсия и среднеквадратическ
Рассчитаем для рентабельности производства.
- простая
- взвешенная
Среднее квадратическое отклонение (стандартное отклонение) представляет собой корень квадратный из дисперсии. Оно является обобщающей характеристикой размеров вариации признака в совокупности и выражается в тех же единицах, что и сам признак.
- простая
- взвешенная
а) Коэффициент осцилляции
б) Линейный коэффициент вариации
в) Коэффициент вариации
Так как значение коэффициента вариации превышает 33%, то изучаемая совокупность не может считается однородной.
а) Средняя ошибка выборки
Под ошибкой выборочного наблюдения (ошибкой выборки) понимают разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяется по формуле:
Чем более однородна исследуемая совокупность (чем меньше вариация в выборке) и чем больше единиц входит в выборку, тем меньше величина средней ошибки, то есть тем точнее результат выборочного наблюдения.
б) Предельная ошибка выборки
Предельная ошибка выборки - величина, характеризующая возможное отклонение результата выборочного наблюдения от действительного значения.
где μ – средняя ошибка выборки,
t – коэффициент доверия, отражающий требуемый уровень доверительной вероятности.
При уровне доверительной вероятности 5% и объеме выборки равном 15 единиц, t(0,95;15) = 2,15.
в) Интервальная оценка выбранного показателя
Средняя генеральная совокупность может варьироваться в интервале от 15,322 до 16,548.
а) Расчет трех видов дисперсии.
Для расчета общей дисперсии можно использовать формулу простой дисперсии:
Для расчета межгрупповой дисперсии используют формулу:
,
где - среднее значение результата признака в j-той группе,
fj – количество единиц в j-той группе,
m – число групп.
Зная значения двух дисперсий, всегда можно найти значение третьей.
Средняя из внутригрупповых дисперсий будет равна:
б) Определение эмпирического корреляционного отношения и эмпирического коэффициента детерминации.
Эмпирическое корреляционное отношение:
Эмпирический коэффициент
По значению эмпирического коэффициента детерминации можно сделать вывод, какая доля вариации результативного признака объясняется действием факторного.
Так как эмпирический коэффициент детерминации равен 0,756 и лежит в интервале от 0,7 до 0,999, то связь между признаками сильная.
в) Проверка правила сложения.
185,95 = 140,666 + 45,284
185,95 = 185,95
Правило сложения выполнено.
а) Формирование альтернативных признаков и расчет коэффициентов ассоциации и контингенции.
Для вычисления коэффициентов ассоциации и контингенции составляется таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, то есть состоящим из двух качественно отличных друг от друга значений признака.
Таблица для вычисления коэффициентов ассоциации и контингенции
a |
b |
a + b |
c |
d |
c + d |
a+c |
b+d |
a + b + c + d |
Коэффициенты вычисляются по формулам: ассоциации: ; контингенции .
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ka > 0,5 или Kk > 0,3.
Предприятия |
Рентабельность предприятия, y |
Производительность труда, х |
Всего |
Промышленности |
11330,2 |
155,4 |
11485,6 |
Сельского хозяйства |
8991,8 |
79,3 |
9071,1 |
Итого: |
20322 |
234,7 |
20556,7 |
Тогда получим:
Связь не считается подтвержденной.
б) Расчет коэффициента взаимной сопряженности Пирсона - Чупрова по альтернативным признакам.
Важно получить обобщающий показатель, характеризующий тесноту связи между признаками и позволяющий сравнивать проявление связи в разных совокупностях. Для этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К):
где φ2 - показатель средней квадратичной сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:
,
К1, К2 – число групп по каждому из признаков.
Величина первого коэффициента
свидетельствует о наличии
а) Расчет линейного коэффициента корреляции и определение параметров линии регрессии.
Так как в выборке небольшое значение числа единиц (до тридцати), то можно воспользоваться формулой:
Для вычисления линейного коэффициента корреляции составим таблицу.
№ |
x |
y |
xy |
x2 |
y2 |
1 |
1960,6 |
16,9 |
33134,14 |
3843952 |
285,61 |
2 |
708,5 |
3,1 |
2196,35 |
501972,3 |
9,61 |
3 |
2464,4 |
39,5 |
97343,8 |
6073267 |
1560,25 |
4 |
1788,5 |
32,8 |
58662,8 |
3198732 |
1075,84 |
5 |
948,3 |
10,8 |
10241,64 |
899272,9 |
116,64 |
6 |
1196,6 |
15,8 |
18906,28 |
1431852 |
249,64 |
7 |
2263,3 |
36,5 |
82610,45 |
5122527 |
1332,25 |
8 |
1352,7 |
19,8 |
26783,46 |
1829797 |
392,04 |
9 |
1182,1 |
9,9 |
11702,79 |
1397360 |
98,01 |
10 |
1400,7 |
13,8 |
19329,66 |
1961960 |
190,44 |
11 |
547,2 |
-3,9 |
-2134,08 |
299427,8 |
15,21 |
12 |
982,4 |
-8,2 |
-8055,68 |
965109,8 |
67,24 |
13 |
1265,3 |
12,7 |
16069,31 |
1600984 |
161,29 |
14 |
655,8 |
5,6 |
3672,48 |
430073,6 |
31,36 |
15 |
1605,6 |
29,6 |
47525,76 |
2577951 |
876,16 |
Итого: |
20322 |
234,7 |
417989,2 |
32134240 |
6461,59 |
Среднее |
1354,8 |
15,64667 |
27865,94 |
2142283 |
430,7727 |
Информация о работе Статистическое исследование фактических данных