Задачи на "Корреляционную связь"

Автор: Пользователь скрыл имя, 15 Февраля 2012 в 18:17, задача

Описание работы

Определите уровень согласованности между спросом на книжную продукцию и структурой оборота издательства с помощью коэффициентов корреляции Спирмена и Фихнера.

Работа содержит 1 файл

Задачи на корреляционную связь. и вариацию на семинарdoc.doc

— 286.50 Кб (Скачать)

Задачи на корреляционную связь

Задача  № 4.

Имеются данные о спросе на книжную продукцию  и структуре оборота книжного издательства в отчетном году:

Стратегическая  единица Спрос на продукцию, тыс. экз. Доля в общем  обороте издательства, %
Классика  20 0
Детская литература 100 1,0
Зарубежный  детектив 60 49,5
Российский  детектив 120 20,5
Женский роман 90 6,8
Фантастика  50 0
Приключения 30 1,0
Специальная литература 110 14,3
Рекламная продукция 60 4,9
Прочая  литература 80 2,0

Определите уровень  согласованности между спросом на книжную продукцию и структурой оборота издательства с помощью коэффициентов корреляции Спирмена и Фихнера.

РЕШЕНИЕ:

Представим в  расчетной таблице все данные, необходимые для расчета ранговых показателей связи:

Спрос на продукцию, X Доля  в общем обороте издательства, Y  
 
Знак  отклонения от среднего ранга
тыс. экз. Ранг Х % Ранг Y
20 9 0 8 1 + +
100 3 1,0 7 16 - +
60 6 49,5 1 25 + -
120 1 20,5 2 1 - -
90 4 6,8 4 0 - -
50 7 0 8 1 + +
30 8 1,0 7 1 + +
110 2 14,3 3 1 - -
60 6 4,9 5 1 + +
80 5 2,0 6 1 + +
Итого Х     48    

= = , при =0 берется знак «+»

1. Коэффициент корреляции Спирмена

= =0,6 
 

2. Коэффициент корреляции  рангов Фихнера:

 

=0,6

Полученные оценки коэффициентов корреляции Спирмена и Фихнера позволяют сделать вывод о не сильной – выше средней прямой зависимости между спросом на книжную продукцию и структурой оборота издательства 
 

1-й  вариант

Имеются следующие данные о месячном заработке  группы студентов Xi= 1500, 100, 4000, 2500, 100, 3000, 2000, 2700, 400, 1000, 800, 700,1500, 2200, 700, 500, 800, 500, 800,100,6000,2500, 3000, 1000 руб.

Определить  средний заработок и установить его типичность или не типичность с помощью линейного и квадратического  коэффициентов вариации.

2-й  вариант

Имеются следующие данные о затратах времени студентами на дорогу к месту обучения Xi = 40, 35, 15, 20, 25, 60, 45, 50, 35, 20, 25, 40, 18,65,70, 15, 32,38,20,25, 15, 35,40,22, 30 мин.

Определить  средние затраты времени на дорогу и установить их типичность или не типичность с помощью линейного и квадратического коэффициентов.

3-й  вариант

Имеются следующие данные о чистой прибыли  предприятий района Xi = 4, 6, 9, 4, 7, 6, 8, 12, 8, 9, 6, 5, 7, 7, 8, 10,11, 5, 6, 3, 7, 8, 7, 5, 4 млн. руб.

Определить  среднюю чистую прибыль и установить ее типичность или не типичность с помощью линейного и квадратического коэффициентов.

4-й  вариант

Имеются следующие данные о среднесписочной  численности акционерных обществ Xi = 250, 320, 410, 380, 450, 500, 540, 580, 650, 720, 830,1000,1100,380,450, 800, 650,450, 800, 750, 450, 450, 800 чел.

Определить  среднесписочную численность и  установить ее типичность или не типичность с помощью линейного и квадратического коэффициентов вариации.

5-й  вариант

Имеются  следующие  данные  о   недельной   выручке   магазинов Хi = 20, 35, 60, 80, 72, 68, 96, 105, 112, 124, 20, 60, 80, 45, 56, 130, 45, 60, 80,45, 50, 80,96, 72,75,45, 50,60, 120, 100 тыс. руб.

Определить  среднюю выручку и установить ее типичность или не типичность с  помощью линейного и квадратического коэффициентов вариации.

     2.10. Методические указания  по теме

     Методику  расчета средних величин и  коэффициентов вариации рассмотрим на примере группы студентов или слушателей из 21 чел. (N =21), каждый из которых имеет возраст X = 28, 36, 30, 22, 22, 40, 29, 27, 21, 23, 35, 30, 32, 33, 29, 37, 29, 39, 23, 22, 22 лет. Требуется определить средний возраст и установить его типичность или не типичность с помощью линейного и квадратического коэффициентов вариации.

     Поскольку данные не упорядочены, то средний возраст определяем по формуле (1.13) как простую среднюю арифметическую величину

   = (28+36+30+…+23+22+22)/21 = 29 лет.

     Для применения формулы средней арифметической взвешенной выполним первичную (дискретную) группировку данных, расположив их в порядке увеличения возраста и определяя повторяемость, встречаемость или частоту одинакового возраста, как показано в табл. 1.1.

Таблица 1.1

Первичная или дискретная группировка данных

Xi 21 22 23 27 28 29 30 32 33 35 36 37 39 40
fi 1 4 2 1 1 3 2 1 1 1 1 1 1 1 21

Тогда по формуле (1.14) средний возраст будет  равен

     = (21*1+22*4+23*2+…+37*1+39*1+40*1)/21 = 29 (лет).

     Хотя  результат и оказался одинаковым, но первичная группировка дает более четкое представление о структуре статистической совокупности. В данном примере это возрастная структура группы студентов. К тому же, она позволяет перейти к определению линейного коэффициента вариации.

Так, по формуле (1.23) среднее линейное отклонение взвешенное равно

Л = 4,857 лет

а линейный коэффициент вариации по формуле (1.28) равняется

= 4,857/29 = 0,168

     Вывод: средний возраст 29 лет является типичным для рассмотренной группы студентов, т.к. расчетный коэффициент вариации оказался меньше его критериального значения (0,168 0,333).

     Дополнительно определяется коэффициент осцилляции, для чего предварительно по формуле (1.31) находим размах вариации

     R = 40-21 = 19 (лет).

     Значит, по формуле (1.30) коэффициент осцилляции равняется

     Кос = 19/29 = 0,655.

     Для нахождения квадратического коэффициента вариации выполним вторичную (интервальную) группировку данных, используя  формулу Стерджесса для определения оптимального количества интервалов п. Эта формула имеет вид

      n = 1 +3,322 lg N, (1.33)

позволяя  затем находить необходимый размах интервала как отношение

       Xи = R / n.  (1.34)

     Подставляя  данные примера в эти формулы, находим количество интервалов n =1+ 3,322 lg 21 = 1+3,322*1,322 = 5,4. Так как количество интервалов не может быть дробным, то его нужно округлить до ближайшего целого числа (по правилам округления). То есть нужно принять 5 интервалов.

     По  формуле (1.32) размах интервала будет  равен 19/5 = 3,8, то есть 3,8 года. Интервальная группировка данных приведена в первом столбце табл. 1.2, которая содержит также алгоритм и промежуточные расчеты.

     Таблица 1.2 Промежуточные расчеты по интервальной группировке данных

Xi , лет fi ХИ XИfi ХИ-
И-
)2
И-
)2 fi
до 24,8 7 22,9 160,3 -6,333 40,111 280,7778
24,8-28,6 2 26,7 53,4 -2,533 6,418 12,83556
28,6-32,4 6 30,5 183 1,267 1,604 9,626667
32,4-36,2 3 34,3 102,9 5,067 25,671 77,01333
36,2-40 3 38,1 114,3 8,867 78,618 235,8533
Итого 21 613,9 616,1067

     В табл. 1.2 первый и последний интервалы открытые, не имея нижней или верхней границы диапазона, а промежуточные интервалы закрытые, имея обе границы. Нахождение середин закрытых интервалов затруднений не вызывает, а с открытыми интервалами поступают следующим образом: к открытому интервалу применяют размах соседнего (смежного), но так как размах всех интервалов в нашем примере одинаков и равен 3,8 года, то и здесь затруднений не должно быть.

     У первого интервала отсутствует  нижняя граница и находят ее путем вычитания размаха смежного интервала из имеющейся верхней границы, получая тем самым закрытый интервал, середина которого определяется легко. В данном примере имеем 24,8–3,8 = 21 год, значит, середина этого интервала будет равна (21+24,8)/2 = 22,9 года.

     У последнего интервала отсутствует  верхняя граница и находят  ее путем прибавления размаха  смежного интервала к имеющейся нижней границе, получая тем самым также закрытый интервал. В данном примере имеем 36,2+3,8 = 40 (лет), значит, середина интервала 36,2-40 будет 38,1 лет.

     По  итогам табл. 1.2 определяются такие  характеристики, как средний возраст  по формуле (1.14)

= 613,9/21 = 29,2333 (лет).

     Как видим, результат несколько отличается от предыдущего, что вызвано неизбежным округлением расчетного количества интервалов. Чем больше количество интервалов и меньше их размах, тем меньше будет разница в результатах.

     Затем по формуле (1.25) определяется взвешенная дисперсия отклонений

Д = 616,1067/21=29,3384 лет2.

     Далее по формуле (1.26) находится среднее  квадратическое отклонение

= = 5,4165 лет.

     И, наконец, по формуле (1.29) рассчитывается квадратический коэффициент вариации

= 5,4165 /29,2333 = 0,185.

     По  значению этого коэффициента делается вывод о типичности среднего возраста 29,23 лет для рассмотренной группы студентов, т.к. расчетное значение коэффициента вариации не превышает критериального (0,185 < 0,333).

      Рассмотренный пример подтвердил возможность одинаковых выводов о типичности или не типичности средней величины с помощью линейного и квадратического коэффициентов вариации и показал, что приход к конкретному выводу осуществляется значительно проще и быстрее с помощью линейного коэффициента. 
 
 
 
 

Информация о работе Задачи на "Корреляционную связь"