Статистическое исследование фактических данных

Автор: Пользователь скрыл имя, 08 Ноября 2012 в 08:44, практическая работа

Описание работы

Имеются 15 предприятий региона. Их деятельность описывается двумя параметрами: х – производительностью труда и y – рентабельностью производства.
Проведение выборочного наблюдения.
Обосновать размер выборки (обеспечивающий необходимый уровень ошибки).
Всего в регионе насчитывается около 150 предприятий. Произведем из всей совокупности предприятий собственно-случайную бесповторную выборку, состоящую из 15 предприятий (то есть выберем каждое 10 предприятие).
Провести выборку одним из способов бесповторным или повторным методом.
Произведем выборку собственно-случайным бесповторным методом.

Работа содержит 1 файл

Статистика.doc

— 680.00 Кб (Скачать)

Квартили – это значения признака, делящие ранжированную совокупность на четыре равновеликие части. Выделяют нижний (Q1) и верхний (Q3) квартили. Нижний квартиль отделяет четвертую часть совокупности с наименьшими значениями признака, верхний – с наибольшими. Таким образом, 25 % единиц совокупности по величине будут меньше Q1; еще по 25 % будут заключены между Q1 и Q2, Q2 и Q3, а остальные 25 % – превосходить Q3.

,

?

где yQ1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25 %);

yQ3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75 %);

h – величина интервала;

SQ1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

SQ3-1– накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;

fQ1 – частота интервала, содержащего нижний квартиль;

fQ3 – частота интервала, содержащего верхний квартиль.

Q2 = Me = 14,895

Квартили могут быть определены по кумуляте аналогично медианы – ось накопленных частот (ординат) делится на четыре 25-процентные равные части, и соответствующие отмеченным накопленным частотам на кумуляте варианты покажут значения квартилей.

Децили – это варианты, которые делят ранжированный ряд на десять равных частей.

ydi – нижняя граница интервала, содержащего i-ю часть разделенной на 10 равных частей совокупности;

h – величина интервала;

Sdi-1 – накопленная частота интервала, предшествующего интервалу, содержащему i-ю часть разделенной на 10 равных частей совокупности;

fdi – частота интервала, содержащего i-ю часть разделенной на 10 равных частей совокупности.

 

  • Абсолютные показатели вариации (по исходным данным).
  • а) размах вариации, размах и полуразмах квартилей

    Размах вариации – это разность между единицами совокупности с наибольшим и наименьшим значениями варьирующего признака.

    R = ymax – ymin,

    где ymax и ymin – наибольшее и наименьшее значения варьирующего признака.

    R = 36,5 + 8,2 = 44,7

    Размах квартилей  – разность между значениями третьего и первого квартилей.

    Q = Q3 – Q1 = 28,12 – 8,56 = 19,56

    Полуразмах квартилей – разность между значениями второго и первого квартилей.

    q = Q/2 = (Q3 – Q1)/2 = 19,56/2 = 9,78

    б) Среднее линейное отклонение

    Среднее линейное отклонение – определяется как средняя арифметическая из абсолютных значений отклонений вариант признака от их средней (взвешенная рассчитывается для сгруппированных данных).

    Рассчитаем для рентабельности производства:

    - простая

    - взвешенная

    в) Дисперсия и среднеквадратическое отклонение

    Рассчитаем для рентабельности производства.

    - простая

    - взвешенная

    Среднее квадратическое отклонение (стандартное отклонение) представляет собой корень квадратный из дисперсии. Оно является обобщающей характеристикой размеров вариации признака в совокупности и выражается в тех же единицах, что и сам признак.

    - простая

    - взвешенная

     

  • Относительные показатели вариации (по исходным данным).
  • а) Коэффициент осцилляции

    б) Линейный коэффициент  вариации

    в) Коэффициент вариации

    Так как значение коэффициента вариации превышает 33%, то изучаемая  совокупность не может считается  однородной.

     

    1. Расчет ошибок выборки.

    а) Средняя ошибка выборки

    Под ошибкой выборочного наблюдения (ошибкой выборки) понимают разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяется по формуле:

    Чем более однородна  исследуемая совокупность (чем меньше вариация в выборке) и чем больше единиц входит в выборку, тем меньше величина средней ошибки, то есть тем точнее результат выборочного наблюдения.

    б) Предельная ошибка выборки

    Предельная ошибка выборки - величина, характеризующая возможное  отклонение результата выборочного  наблюдения от действительного значения.

    где μ – средняя ошибка выборки,

    t – коэффициент доверия, отражающий требуемый уровень доверительной вероятности.

    При уровне доверительной  вероятности 5% и объеме выборки равном 15 единиц, t(0,95;15) = 2,15.

    в) Интервальная оценка выбранного показателя

    Средняя генеральная  совокупность может варьироваться  в интервале от 15,322 до 16,548.

     

    1. Анализ взаимосвязей.
    2. Дисперсионный анализ

    а) Расчет трех видов дисперсии.

    Для расчета общей  дисперсии можно использовать формулу простой дисперсии:

    Для расчета межгрупповой дисперсии  используют формулу:

    ,

    где - среднее значение результата признака в j-той группе,

    fj – количество единиц в j-той группе,

    m – число групп.

    Зная значения двух дисперсий, всегда можно найти значение третьей.

    Средняя из внутригрупповых дисперсий  будет равна:

    б) Определение эмпирического корреляционного отношения и эмпирического коэффициента детерминации.

    Эмпирическое корреляционное отношение:

    Эмпирический коэффициент детерминации:

    По значению эмпирического коэффициента детерминации можно сделать вывод, какая доля вариации результативного признака объясняется действием факторного.

    Так как эмпирический коэффициент  детерминации равен 0,756 и лежит в  интервале от 0,7 до 0,999, то связь между  признаками сильная.

    в) Проверка правила сложения.

    185,95 = 140,666 + 45,284

    185,95 = 185,95               

    Правило сложения выполнено.

  • Корреляционный анализ атрибутивных признаков.
  • а) Формирование альтернативных признаков и расчет коэффициентов ассоциации и контингенции.

    Для вычисления коэффициентов  ассоциации и контингенции составляется таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, то есть состоящим из двух качественно отличных друг от друга значений признака.

    Таблица для вычисления коэффициентов ассоциации и контингенции

    a

    b

    a + b

    c

    d

    c + d

    a+c

    b+d

    a + b + c + d


     

    Коэффициенты вычисляются  по формулам: ассоциации: ; контингенции .

    Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ka > 0,5 или Kk > 0,3.

    Предприятия

    Рентабельность предприятия, y

    Производительность труда, х

    Всего

    Промышленности

    11330,2

    155,4

    11485,6

    Сельского хозяйства

    8991,8

    79,3

    9071,1

    Итого:

    20322

    234,7

    20556,7


     

    Тогда получим:

    Связь не считается подтвержденной.

    б) Расчет коэффициента взаимной сопряженности Пирсона - Чупрова  по альтернативным признакам.

    Важно получить обобщающий показатель, характеризующий тесноту  связи между признаками и позволяющий сравнивать проявление связи в разных совокупностях. Для этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К):

    где φ2 - показатель средней квадратичной сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:

    ,

    К1, К2 – число групп по каждому из признаков.

    Величина первого коэффициента свидетельствует о наличии достаточно заметной связи между изучаемыми признаками. Коэффициент Чупрова  обычно дает более осторожную оценку связи.

  • Корреляционный анализ количественных признаков.
  • а) Расчет линейного коэффициента корреляции и определение параметров линии регрессии.

    Так как в выборке небольшое значение числа единиц (до тридцати), то можно воспользоваться формулой:

    Для вычисления линейного  коэффициента корреляции составим таблицу.

    x

    y

    xy

    x2

    y2

    1

    1960,6

    16,9

    33134,14

    3843952

    285,61

    2

    708,5

    3,1

    2196,35

    501972,3

    9,61

    3

    2464,4

    39,5

    97343,8

    6073267

    1560,25

    4

    1788,5

    32,8

    58662,8

    3198732

    1075,84

    5

    948,3

    10,8

    10241,64

    899272,9

    116,64

    6

    1196,6

    15,8

    18906,28

    1431852

    249,64

    7

    2263,3

    36,5

    82610,45

    5122527

    1332,25

    8

    1352,7

    19,8

    26783,46

    1829797

    392,04

    9

    1182,1

    9,9

    11702,79

    1397360

    98,01

    10

    1400,7

    13,8

    19329,66

    1961960

    190,44

    11

    547,2

    -3,9

    -2134,08

    299427,8

    15,21

    12

    982,4

    -8,2

    -8055,68

    965109,8

    67,24

    13

    1265,3

    12,7

    16069,31

    1600984

    161,29

    14

    655,8

    5,6

    3672,48

    430073,6

    31,36

    15

    1605,6

    29,6

    47525,76

    2577951

    876,16

    Итого:

    20322

    234,7

    417989,2

    32134240

    6461,59

    Среднее

    1354,8

    15,64667

    27865,94

    2142283

    430,7727

    Информация о работе Статистическое исследование фактических данных