Автор: Пользователь скрыл имя, 17 Января 2011 в 14:19, контрольная работа
Требуется:
1. Выяснить, существует ли корреляционная зависимость объема продаж Y от величины расходов на рекламу X. Для этого необходимо:
а) построить поле корреляции; вычислить групповые средние — средние объемы продаж для указанных в корреляционной таблице интервалов расходов на рекламу; на том же графике построить линию групповых средних — линию, соединяющую точки (x’; ) где - центр соответствующего интервала значений расходов на рекламу x;
Данные об объемах продаж сгруппируем по пяти интервалам вложенных в рекламу средств и введем в рабочий лист Microsoft Excel,
отождествив каждый интервал с его серединой.
Задача.
Исследуется связь между расходами дилеров некоторой компании на рекламу продукции (X, тыс. ден. ед.) и их объемами продаж (Y, сотни тыс. ден. ед.) и зависимость объема продаж Y от расходов на рекламу X. Сведения по 60 случайно отобранным дилерам сгруппированы в корреляционную таблицу (табл. 1).
Таблица 1
Y X | [0; 0,3) | [0,3;0,6) | [0,6;0,9) | [0,9;1,2) | [1,2;1,5) | ||
Y X | 0,15 | 0,45 | 0,75 | 1,05 | 1,35 | n | |
[0,9; 1,8) | 1,35 | 2 | 2 | 4 | |||
[1,8; 2,7) | 2,25 | 10 | 8 | 1 | 19 | ||
[2,7; 3,6) | 3,15 | 7 | 17 | 2 | 26 | ||
[3,6; 4,5) | 4,05 | 4 | 5 | 9 | |||
[4,5; 5,4) | 4,95 | 1 | 1 | ||||
[5,4; 6,3) | 5,85 | 1 | 1 | ||||
n | 2 | 11 | 32 | 12 | 3 | 60 |
Требуется:
1. Выяснить, существует ли корреляционная зависимость объема продаж Y от величины расходов на рекламу X. Для этого необходимо:
а) построить поле корреляции; вычислить групповые средние — средние объемы продаж для указанных в корреляционной таблице интервалов расходов на рекламу; на том же графике построить линию групповых средних — линию, соединяющую точки (x’; ) где - центр соответствующего интервала значений расходов на рекламу x;
Данные об объемах продаж сгруппируем по пяти интервалам вложенных в рекламу средств и введем в рабочий лист Microsoft Excel,
отождествив каждый интервал с его серединой (рис. 1).
Рис 1. Числовые данные для программы
«Однофакторный дисперсионный анализ»
Воспользуемся программой « Однофакторный дисперсионный анализ».
Для этого выберем соответствующий пункт меню надстройки «Анализ данных». В появившемся окне ввода данных (рис. 2) укажем входной интервал A1:E33, в который мы ввели исходные данные (с заголовками столбцов — серединами интервалов X, поэтому отметим флажок «Метки в первой строке»). Зададим уровень значимости «Альфа» (по условию α = 0,05). Укажем, что данные сгруппированы по столбцам, а результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы программы представлены на рис. 3.
Групповые средние
средние объемы продаж для каждого интервала вложенных средств ( — количество наблюдений (X; Y), у которых x принадлежит интервалу X, y принадлежит интервалу Y) рассчитаны программой (средние). Построим на рис. 9 поле корреляции — прямоугольную сетку, в каждом прямоугольнике которой проставляется точек. Здесь же построим линию групповых средних, т. е. ломаную, отрезки которой соединяют точки с координатами (x’; ).
Рис.
2. Окно ввода данных
программы «Однофакторный
дисперсионный анализ»
Рис. 3. Результаты работы программы «Однофакторный дисперсионный анализ»
б) используя случайную модель однофакторного дисперсионного анализа, проверить гипотезу об отсутствии влияния интервала вложенных в рекламу средств на объем продаж;
Используя случайную модель однофакторного дисперсионного анализа:
где , проверим гипотезу об отсутствии влияния интервала вложенных в рекламу средств на объем продаж.
Расшифровка дисперсионной таблицы, полученной с помощью программы «Однофакторный дисперсионный анализ», представлена в табл.2.
Таблица 2
Источник вариации результативного признака Y |
Показатель вариации (SS) |
Число степеней свободы (df) | Оценка диссперсии (MS) |
P-значение | ||
Расходы на рекламу X | SSx=26,12 | ν – 1= 4 | S2x=6,53 | 20,22 | 2,73849E-10 | 2,54 |
Остаточные факторы | SSост= 17,76 | n – ν = 55 | S2ост=0,32 | |||
Общая вариация | SS=43,89 | n – 1 = 59 |
Проверка гипотезы H0 производится на основе анализа статистики , имеющей (в предположении справедливости H0) распределение Фишера — Снедекора с ν – 1 = 4 и n – ν = 55 степенями свободы (здесь ν = 5 — число интервалов x). В данном случае наблюдаемое значение статистики F 4;55 оказалось равным 20, 22 [в результатах работы программы (рис. 3, рис.2) оно приводится в таблице « Дисперсионный анализ» в столбце «F»], а критическая точка f0,05; 4; 55 = 2,54 (F критическое), откуда следует, что гипотеза H0 об отсутствии влияния вложений в рекламу на объем продаж отвергается на 5%-ном уровне значимости.
Гипотезу H0 можно проверить и так: если P-значение оказывается не меньше принятого уровня значимости α (в данном случае α = 0,05), гипотезу H0
принимают, а если P-значение оказывается меньше α, гипотезу H0 отвергают. В данном случае P-значение равно P = P{F4; 55> 2,54} = 2,73849E-10 [оно приводится в результатах работы программы (рис.3, рис.2)], значит, гипотезу H0 следует отвергнуть на 5%-ном уровне значимости.
в) при отклонении гипотезы оценить влияние величины вложенных в рекламу средств на объем продаж, используя корреляционное отношение и коэффициент детерминации .
Оценим
влияние величины расходов на рекламу
на объем продаж с помощью коэффициента
детерминации
такова (60%) доля общей вариации (дисперсии,
разброса, различий) объема продаж
Y, обусловленная влиянием на него расходов
на рекламу X. Корреляционное отношение
0,77
2. Исследовать правомерность предположения о линейности корреляционной связи между X и Y. Для этого:
а) вычислить оценку коэффициента корреляции и оценку коэффициента линейной детерминации ; предположив нормальность распределения случайной величины (X, Y), на 5%-ном уровне значимости проверить гипотезу при альтернативной гипотезе ; при отклонении H0 дать содержательную интерпретацию и ;
Наблюдения, сгруппированные в табл.1, представим в обычной форме: пару (0,15; 4,95) выпишем 1 раз, пару (0,15; 5,85) — 1 раз и т. д. Введем эти данные в рабочий лист Microsoft Excel (рис. 4). Воспользуемся программой «Корреляция». Для этого выберем соответствующий пункт меню надстройки «Анализ данных». В появившемся окне ввода данных (рис. 5) укажем входной интервал A1:B61, в который мы ввели исходные данные (с заголовками столбцов — названиями признаков, поэтому отметим флажок «Метки в первой строке»). Укажем, что данные сгруппированы по столбцам, а результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы программы представлены на рис. 6.
В результате работы этой программы рассчитана оценка 0,86 коэффициента корреляции . Проверим на 5%-ном уровне значимости гипотезу при альтернативной гипотезе .
Наблюдаемое числовое значение статистики
равно
При
α= 0,05 значение критической точки
. Поскольку |12,8| >
, есть основания отвергнуть проверяемую
гипотезу Hо. При этом оценка
коэффициента линейной детерминации
= 0,74 означает, что 74% общей вариации
объема продаж Y обусловлены линейным
влиянием на него расходов на рекламу
X (сравним это значение с коэффициентом
детерминации
= 0,6 — долей вариации объема продаж, связанной
с влиянием расходов на рекламу). Положительное
и близкое к единице значение оценки
коэффициента корреляции означает,
что наблюдается прямая и достаточно
тесная корреляционная связь между
X и Y.
Рис. 4. Числовые данные для программ «Корреляция» и «Регрессия»
Рис. 5.
Окно ввода данных
программы «Корреляция»
Рис. 6.
Результаты работы программы
«Корреляция»
б) найти оценки параметров одели линейной регрессии и прямой линией «выровнять» линию групповых средних ;
Предположив, что корреляционная зависимость Y от x линейна (функция регрессии Y на x линейна), оценим степень близости связи между Y и x к линейной функциональной. Модель парного линейного регрессионного анализа признака Y записывается следующим образом:
где все случайные величины εi (случайные эффекты влияния на результативный признак неконтролируемых факторов) независимы и имеют одинаковое нормальное распределение или, иначе, все наблюдения Yi независимы и имеют нормальное распределение . Функция называется линейной функцией регрессии.
Рассчитаем оценки параметров модели линейной регрессии. Для этого воспользуемся программой «Регрессия», выбрав соответствующий пункт меню надстройки «Анализ данных» Microsoft Excel.
В окне ввода исходных данных программы «Регрессия» (рис. 7) укажем входные интервалы результативного признака Y (B1:B61) и факторного признака x (A1:A61). Установим флажок «Метки» (указав, что в первой строке находятся названия переменных), очистим флажок «Константа — ноль» (чтобы в уравнении присутствовал свободный член a0), уровень надежности (1 – α) указывать не будем (по умолчанию он равен 95%). Укажем, что результаты работы программы необходимо вывести на новый рабочий лист. Результаты работы программы «Регрессия» представлены на рис. 8.
Модуль коэффициента корреляции =0,86 выведен в результатах работы программы «Регрессия» (рис. 7) в таблице «Регрессионная статистика» под заголовком «Множественный R»; коэффициент линейной детерминации =0,74 выведен под заголовком «R-квадрат».
Оценки параметров содержатся в результатах работы программы « Регрессия» (рис. 8) в нижней таблице в столбце «Коэффициенты» под заголовками «Y-пересечение» и «X» соответственно. Таким образом, оценка линейной функции регрессии такова: 0,72+2,92х. График этой функции построен на рис. 9.
Информация о работе Контрольная работа по "Экономико-матемаическое моделирование"