Автор: Пользователь скрыл имя, 10 Марта 2013 в 10:59, контрольная работа
Задание 1. Построить все возможные двухфакторные таблицы сопряженности и провести предварительную обработку результатов анкетирования;
Задание 2. Для всех пар признаков проверить гипотезу об отсутствии связи между ними;
Задание 3. Провести точечное и интервальное оценивание коэффициентов парной связи между признаками. Сделать вывод о тесноте и направлении связи;
Задание 4. С помощью логлинейного анализа исследовать структуру взаимосвязей между тремя дихотомическими признаками:
1. Построение и предварительный анализ выборочных таблиц сопряженности………………………………………………………………….....4
2. Проверка гипотезы о независимости признаков и характеристика связи………………………………………………………………………………..7
2.1. Анализ и исследование связи в таблицах сопряженности 2×2……………7
2.2. Анализ и исследование связи в таблицах сопряженности r×s…………...11
3. Анализ 3-х факторной таблицы сопряженности…………………………..24
3.1. Построение и анализ насыщенной логлинейной модели...………………24
3.2. Построение и анализ ненасыщенных и иерархических логлинейных моделей…………………………………………………………………………...27
По данным таблицы можно увидеть, что по 2% из респондентов в возрасте 25-40 лет и после 40 лет положительно относятся к курению.
2. Проверка гипотезы о независимости признаков и характеристика связи
2.1. Анализ и исследование
связи в таблицах
Проведен опрос на тему «Ваше отношение к курению». Объем выборки составил n=50.
1)Фиксированы значения двух признаков: х – Ваш пол (х1 – мужской, х2 – женский), у – Курите ли Вы? ( у1 – да, у2 – нет).
Результаты опроса представлены в виде двухфакторной таблицы сопряженности:
уj) Курите ли Вы? xi) Пол |
у1) Да |
у2)Нет |
ni* |
х1) Мужской |
6 |
10 |
16 |
х2) Женский |
9 |
25 |
34 |
n*j |
15 |
35 |
50 |
Исследование связи между признаками х и у
Проверка гипотезы о независимости признаков х и у.
Для решения этой связи формируются следующие гипотезы:
H0: pij = pi* * p*j , i=1;2. j=1;2 (признаки х и у независимы, т.е. связь отсутствует)
H1: ij: pij = pi* * p*j , i=1;2. j=1;2 (между признаками существует значимая связь)
Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий Пирсона Х2. Статистика критерия имеет вид: Х2 =
Статистика Х2 при справедливости H0 распределяется по закону
V = (r-1)(s-1)=1
Рассчитаем теоретические
=
=
=
=
Рассчитаем наблюдаемое значение статистики Х2
= = +0,14+0,06=0,63
Пусть уравнение значимости =0,05
По таблице 100 %-ых точек распределения Х2 находится значение статистики
Вывод: Так как (0,63<3,8), то гипотеза H0 подтверждается, следовательно, можно сделать вывод, что пол не оказывает значимого влияния на то, курит человек или не курит.
Проверка всех вычислений проводилась в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.
2) Фиксированы значения двух признаков: х – пол (х1 –мужской, х2 – женский), у – Считаете ли Вы, что курение вредит здоровью? ( у1 – да, у2 – нет).
Результаты опроса представлены в виде двухфакторной таблицы сопряженности:
уj) Вредит ли курение? xi) Пол |
у1) Да |
у2)Нет |
ni* |
х1) Мужской |
13 |
3 |
16 |
х2) Женский |
30 |
4 |
34 |
n*j |
43 |
7 |
50 |
Исследование связи между признаками х и у
Проверка гипотезы о независимости признаков х и у.
Для решения этой связи формируются следующие гипотезы:
H0: pij = pi* * p*j , i=1;2. j=1;2 (признаки х и у независимы, т.е. связь отсутствует)
H1: ij: pij = pi* * p*j , i=1;2. j=1;2 (между признаками существует значимая связь)
Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий Пирсона Х2. Статистика критерия имеет вид: Х2 =
Статистика Х2 при справедливости H0 распределяется по закону
V = (r-1)(s-1)=1
Рассчитаем теоретические
=
=
=
=
Рассчитаем наблюдаемое
= =
Пусть уравнение значимости =0,05
По таблице 100 %-ых точек распределения Х2 находится значение статистики
= 3,8
Вывод: Так как > (3,8>0,44), то гипотеза H0 подтверждается, следовательно, можно сделать вывод, что пол не оказывает значимого влияния на то, вредит ли курение здоровью или нет.
Проверка всех вычислений проводилась в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.
3) Фиксированы значения двух признаков: х – Курите ли Вы? ( х1 – да, х2 – нет), у – Считаете ли Вы, что курение вредит здоровью? ( у1 – да, у2 – нет).
Результаты опроса представлены в виде двухфакторной таблицы сопряженности:
уj) Вредит ли курение? xi) Курите ли Вы? |
у1) Да |
у2)Нет |
ni* |
х1)да |
10 |
5 |
15 |
х2)нет |
33 |
2 |
35 |
n*j |
43 |
7 |
50 |
Исследование связи между признаками х и у
Проверка гипотезы о независимости признаков х и у.
Для решения этой связи формируются следующие гипотезы:
H0: pij = pi* * p*j , i=1;2. j=1;2 (признаки х и у независимы, т.е. связь отсутствует)
H1: ij: pij = pi* * p*j , i=1;2. j=1;2 (между признаками существует значимая связь)
Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий Пирсона Х2. Статистика критерия имеет вид: Х2 =
Статистика Х2 при справедливости H0 распределяется по закону
V = (r-1)(s-1)=1
Рассчитаем теоретические
=
=
=
=
Рассчитаем наблюдаемое значение статистики Х2
= =
Пусть уравнение значимости =0,05
По таблице 100 %-ых точек распределения Х2 находится значение статистики
= 3,8
Вывод: Так как < (3,8<6,65), то гипотеза H0 отвергается, следовательно, можно сделать вывод, что в зависимости от того, курит человек или нет, он формирует свое мнение о влиянии курения на его здоровье.
Проверка всех вычислений проводилась в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.
Перейдем к интерпретации связи.
Рассчитаем коэффициенты связи х – Курите ли Вы? ( х1 – да, х2 – нет), у – Считаете ли Вы, что курение вредит здоровью? ( у1 – да, у2 – нет).
Меры связи, основанные на статистике :
а) Фи-коэффициент
- связь умеренная;
б) Коэффициент сопряженности Пирс
- связь умеренная;
в) Коэффициент контингенции
- связь умеренная,
г) Тао-коэффициент Гудмана и Краскала
- связь слабая
Меры связи, основанные на отношении шансов:
а) Коэффициент ассоциации
- связь тесная, отрицательная
Рассчитаем доверительные интервалы для коэффициентов связи. Для таблиц сопряженности 2 2 доверительные интервалы рассчитываются только для коэффициента Юла (ассоциации):
, где , следовательно, с вероятностью коэффициент Юла принадлежит интервалу (-3,38; -0,023);
б) Коэффициент поллигации
- связь умеренная, отрицательная
в) Отношение шансов
<1 – связь отрицательная
Вывод: в результате проверки гипотезы о независимости признака х – Курите ли Вы? ( х1 – да, х2 – нет) и признака у – Считаете ли Вы, что курение вредит здоровью? ( у1 – да, у2 – нет) доказано наличие значимой связи между признаками. По большинству коэффициентов связи можно сделать вывод, что эта связь – умеренной силы, отрицательная, т.е. если человек считает, что курение вредит здоровью, то, скорее всего, он не курит.
2.2. Анализ и исследование связи в таблицах сопряженности r×s
4) Рассмотрим 2 категоризованных номинальных признака: х – Ваш пол (х1-мужской, х2- женский), у – Ваш возраст (у1-до 25 лет, у2-25-40 лет, у3-после 40 лет).
Результаты опроса представлены в виде таблицы сопряженности 2 3:
уj) Ваш возраст xi) Ваш пол |
у1) до 25 лет |
у2)25-40лет |
у3)после 40 лет |
ni* |
х1)муж. |
8 |
4 |
4 |
16 |
х2)жен. |
15 |
12 |
7 |
34 |
n*j |
23 |
16 |
11 |
50 |
Исследование связи между признаками х и у
Проверка гипотезы о независимости признаков х и у.
Для решения этой связи формируются следующие гипотезы:
H0: pij = pi* * p*j , i=1;2. j=1;2 (признаки х и у независимы, т.е. связь отсутствует)
H1: ij: pij = pi* * p*j , i=1;2. j=1;2 (между признаками существует значимая связь)
Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий максимального правдоподобия . Статистика критерия имеет вид: .
Статистика критерия при справедливости H0 распределяется по закону V = (r-1)(s-1)=2
Рассчитаем теоретические
= ,36
= ,12
=
=
Рассчитаем критерий максимального правдоподобия статистики
= + +…+ =0,55
Пусть уравнение значимости =0,05
По таблице 100 %-ых точек распределения Х2 находится значение статистики
Вывод: Так как (6>0,55), то гипотеза H0 подтверждается, а следовательно, между признаками х и у не существует связи, то есть пол человека не зависит от его возраста и наоборот.
Проверка всех вычислений проводилась в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.
5) Рассмотрим 2 категоризованных номинальных признака: х – Ваш пол (х1-мужской, х2- женский), у – Как вы относитесь к курению? (у1-положительно, у2-отрицательно, у3-безразлично).
Результаты опроса представлены в виде таблицы сопряженности 2 3:
уj) Отношение к курению xi) Ваш пол |
у1)полож. |
у2)отриц. |
у3)безразл. |
ni* |
х1)муж. |
1 |
13 |
2 |
16 |
х2)жен. |
4 |
25 |
5 |
34 |
n*j |
5 |
38 |
7 |
50 |
Исследование связи между признаками х и у
Проверка гипотезы о независимости признаков х и у.
Для решения этой связи формируются следующие гипотезы:
H0: pij = pi* * p*j , i=1;2. j=1;2 (признаки х и у независимы, т.е. связь отсутствует)
H1: ij: pij = pi* * p*j , i=1;2. j=1;2 (между признаками существует значимая связь)
Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий максимального правдоподобия . Статистика критерия имеет вид: .
Статистика критерия при справедливости H0 распределяется по закону V = (r-1)(s-1)=2
Рассчитаем теоретические частоты
=
=
=
=
Рассчитаем критерий максимального правдоподобия статистики
= + +…+ =0,483
Пусть уравнение значимости =0,05
По таблице 100 %-ых точек распределения Х2 находится значение статистики
Вывод: Так как (6>0,483), то гипотеза H0 подтверждается, а следовательно, между признаками х и у не существует значимой связи, то есть от пола человека не зависит его отношение к курению.
Проверка всех вычислений проводилась в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.
6) Рассмотрим 2 категоризованных номинальных признака: х – Курите ли Вы? (х1-да, х2- нет), у – Как Вы относитесь к курению? (у1-положительно, у2-отрицательно, у3-безразлично).
Результаты опроса представлены в виде таблицы сопряженности 2 3:
уj) Отношение к курению xi)Курите ли Вы? |
у1)полож. |
у2)отриц. |
у3)безразл. |
ni* |
х1)да |
5 |
6 |
4 |
15 |
х2)нет |
- |
32 |
3 |
35 |
n*j |
5 |
38 |
7 |
50 |
Информация о работе Контрольная работа по «Статистический анализ нечисловой информации»