Автор: Пользователь скрыл имя, 19 Ноября 2011 в 14:50, контрольная работа
Статистика - наука, имеющая целью сбор, упорядочивание, анализ и сопоставление числового представления фактов, относящихся к самым разнообразным массовым явлениям. Это вместе с тем учение о системе показателей, т. е. количественных характеристик, дающих всестороннее представление об общественных явлениях, о национальном хозяйстве в целом и отдельных его отраслях. Статистика - это эффективное орудие, инструмент познания, используемый в естественных и общественных науках для установления тех специфических закономерностей, которые действуют в конкретных массовых явлениях, изучаемых данной наукой.
Введение………………………………………………………………………...3
Задача 1………………………………………………………………………….5
Задача 2…………………………………………………………………………15
Задача 3…………………………………………………………………………22
Задача 4…………………………………………………………………………35
Задача 5…………………………………………………………………………39
Заключение……………………………………………………………………..42
Список использованной литературы……………………………………….46
Изобразим графически построенные ряды распределения:
2)
Оценим однородность
Из вариационного ряда таблицы 1 видно, в каких пределах колеблется выпуск продукции (нарастание выпуска продукции до 166 млн. руб.). Число предприятий постепенно увеличивается, а затем уменьшается. Наиболее часто встречается выпуск продукции в интервале от 161 до 181 млн. руб. ( группы 3 и 4) со средним значением 171 млн. руб. Из вариационного ряда таблицы 2 видно в каких пределах колеблется потеря рабочего времени и как с нарастанием потери времени до 47,8 тыс. чел. - дней увеличивается число предприятий, а затем наблюдается постепенное их уменьшение. Наиболее часто встречается потеря рабочего времени, находящаяся в пределах от 39,5 до 56 тыс. чел. - дней (группа 2).
3) Оценим характер распределения совокупности исходных данных с помощью средней, моды, медианы, показателей вариации.
Определим средний выпуск продукции и среднюю стоимость основных производственных фондов по формуле средней арифметической взвешенной:
где f - частота варианта, X - среднее значение вариации.
Пользуясь таблицей 1, определим среднее значение выпуска продукции:
= 171,00 млн. руб.
Пользуясь таблицей, 2 определим среднее значение потерн рабочего времени:
= 60,40 тыс. чел. - дней
Вывод: по данным предприятиям средний выпуск продукции равен 171 млн. руб.. а средние потери рабочего времени равны 60.4 тыс. чел.-дней
Мода (Мо) - значение случайной величины, встречающееся с наибольшей вероятностью в вариационном ряду - вариант, имеющий наибольшую частоту. В интервальных рядах распределения с равными интервалами мода вычисляется по формуле:
где Xмо - нижняя граница модального интервала:
fмо,
fмо-1, fмо+1 - частоты в модальном,
предыдущем и следующем за модальным интервалом
(соответственно).
Найдём моду для выпуска продукции:
млн. руб.
Найдём моду для потери рабочего времени:
Мо = 49.81 тыс. чел. - дней
Таким образом, наибольшее количество предприятий имеют выпуск продукции, равный 171 млн. руб. и потери рабочего времени 49,81 тыс. чел. - дней.
Медиана (Ме) - это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части. В интервальных рядах распределения медианное значение оказывается в интервале, который характерен тем, что его кумулятивная частота равна или превышает полусумму всех частот ряда и вычисляется по формуле:
где Xме - нижняя граница медианного интервала;
SМе-1 - сумма наблюдений, накопленная до начала медианного интервала
fМе – число наблюдений в медианном интервале.
f/2 - половина от общего числа наблюдений
Найдём медиану по выпуску продукции:
Ме = 171,0 млн. руб.
Найдём медиану по стоимости основных производственных фондов:
Mе = 56,0 тыс. чел.-дней
Следовательно, 50% или 15 предприятий имеют выпуск продукции более чем 171 млн. руб. и потери рабочего времени более чем 56 тыс. чел. – дней, а 15 предприятий соответственно менее 171 млн. руб. и менее 56 тыс. чел. - дней.
Вычислим
дисперсию. Дисперсия признака представляет
собой средний квадрат
По выпуску продукции вычислим дисперсию, пользуясь таблицей 1:
По потере рабочего времени вычислим дисперсию, пользуясь таблицей 2:
Среднее квадратическое отклонение равно корню квадратному из дисперсии:
По выпуску продукции вычислим среднее квадратическое отклонение:
= 14,08 млн. руб.
По потери рабочего времени вычислим среднее квадратическое отклонение:
= 22,01 тыс. чел-дней
Получили обобщающую характеристику выпуска по данной продукции, она показывает, что в среднем конкретные варианты выпуска продукции отклоняются от её средней величины (171 млн. руб.) на 14,08 млн. pyб. Значит, средний выпуск продукции колеблется в пределах от 156,92 млн. руб. до 185,08 млн. руб., а средняя потеря рабочего времени колеблется в пределах от 38,39 до 82,41 тыс. чел.-дней.
Вычислим коэффициент вариации, который определяет сравнительную оценку вариации единиц совокупности и характеристику однородности совокупности:
Коэффициент вариации по выпуску продукции:
так как вариация рассматриваемого признака не превосходят 33%, то данная совокупность по выпуску продукции можно считать количественно однородной. Коэффициент вариации по потери рабочего времени:
так как
вариация рассматриваемого признака превосходит
33%, то совокупность можно считать количественно
неоднородной.
4) Проверим данные на основе критерия Пирсона
С помощью критерия Пирсона проверим гипотезу о нормальном распределении величины X. Вычислим теоретические частоты по формуле:
, где функция φ(ui) - табулированная функция
Далее
сравнивая теоретические
По таблице
критических точек
х 2кр= хкр2 (0,05;3) = 7,81
Для распределения предприятий по выпуску продукции
Объём выборки N = 30 длина интервала h = 10
среднее квадратическое отклонение = 14,08 млн. руб, среднее значение X = 171,00 млн. руб.
Если учесть вычисленные величины получим формулу:
Составим
расчётную таблицу для
Таблица 3 Нахождение хи-квадрата расчётного для величины выпуска продукции
№ | Xi | Хi +1 | Xi* | fi | ti | φ(ti) | fi* | (fi - fi*)2 | (fi - fi*)2/ fi* |
1 | 141 | 151 | 146 | 3 | -1,775 | 0,0833 | 1,774 | 1.502 | 0,846 |
2 | 151 | 161 | 156 | 4 | -1,065 | 0.2275 | 4,846 | 0.716 | 0.148 |
3 | 161 | 171 | 166 | 8 | -0,355 | 0,3752 | 7,993 | 0,000 | 0,000 |
4 | 171 | 181 | 176 | 8 | 0,355 | 0.3752 | 7,993 | 0,000 | 0,000 |
5 | 181 | 191 | 186 | 4 | 1.065 | 0,2275 | 4,846 | 0,716 | 0,148 |
6 | 191 | 201 | 196 | 3 | 1,775 | 0,0833 | 1,774 | 1,502 | 0,846 |
Итого | 30 | ... | ... | 29,227 | ... | 1,988 |
Определили наблюдаемое значение критерия x2набл = 1 ,988
Сравниваем полученное значение с критическим получим, что x2набл < хкрит2 так как 1,988 < 7,81, то нет основания отклонить гипотезу о нормальном распределении. Т.е эмпирические и теоретические частоты различаются незначительно. Можно считать, что распределение предприятий по выпуску продукции является нормальным.
Для распределения предприятий по потери рабочего времени:
Объём
выборки N = 30 длина интервала h = 16,5
Среднее квадратическое отклонение = 22,01 тыс. чел. – дней среднее значение X = 60,40 тыс. чел.-дней.
Учитывая вычисленные величины, получим формулу:
Составим
расчётную таблицу для
Таблица 4 Нахождение хи-квадрата расчётного для величины потери рабочего времени
Xi | Xi+1 | Xi* | fi | ti | φ(ti) | fi* | (fi - fi*)2 | (fi - fi*)2/ fi* | |
1 | 23 | 39,5 | 31.25 | 5 | -1,325 | 0.1669 | 3,754 | 1,552 | 0.414 |
2 | 39,5 | 56 | 47.75 | 10 | -0,575 | 0,3391 | 7,627 | 5.629 | 0,738 |
3 | 56 | 72,5 | 64,25 | 7 | 0,175 | 0.3932 | 8,844 | 3,401 | 0,385 |
4 | 72,5 | 89 | 80,75 | 4 | 0,925 | 0,2613 | 5.877 | 3,525 | 0,600 |
5 | 89 | 105,5 | 97,25 | 3 | 1,674 | 0,0989 | 2,225 | 0,601 | 0.270 |
6 | 105.5 | 122 | 113,75 | 1 | 2,424 | 0.0213 | 0.479 | 0,271 | 0,566 |
Итого | 30 | --- | --- | 28,807 | --- | 2,972 |
Информация о работе Статистический анализ, статистический прогноз