Контрольная работа по «Статистический анализ нечисловой информации»

Автор: Пользователь скрыл имя, 10 Марта 2013 в 10:59, контрольная работа

Описание работы

Задание 1. Построить все возможные двухфакторные таблицы сопряженности и провести предварительную обработку результатов анкетирования;
Задание 2. Для всех пар признаков проверить гипотезу об отсутствии связи между ними;
Задание 3. Провести точечное и интервальное оценивание коэффициентов парной связи между признаками. Сделать вывод о тесноте и направлении связи;
Задание 4. С помощью логлинейного анализа исследовать структуру взаимосвязей между тремя дихотомическими признаками:

Содержание

1. Построение и предварительный анализ выборочных таблиц сопряженности………………………………………………………………….....4
2. Проверка гипотезы о независимости признаков и характеристика связи………………………………………………………………………………..7
2.1. Анализ и исследование связи в таблицах сопряженности 2×2……………7
2.2. Анализ и исследование связи в таблицах сопряженности r×s…………...11
3. Анализ 3-х факторной таблицы сопряженности…………………………..24
3.1. Построение и анализ насыщенной логлинейной модели...………………24
3.2. Построение и анализ ненасыщенных и иерархических логлинейных моделей…………………………………………………………………………...27

Работа содержит 1 файл

САНИ отчет.doc

— 2.10 Мб (Скачать)

По данным таблицы можно увидеть, что по 2% из респондентов в возрасте 25-40 лет и после 40 лет положительно относятся к курению.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Проверка гипотезы о независимости признаков и характеристика связи

 

2.1. Анализ и исследование  связи в таблицах сопряженности  2×2

 

Проведен опрос на тему «Ваше  отношение к курению». Объем выборки  составил n=50.

 

1)Фиксированы значения двух признаков: х – Ваш пол (х1 – мужской, х2 – женский), у – Курите ли Вы? ( у1 – да, у2 – нет).

 

Результаты  опроса представлены в виде двухфакторной таблицы сопряженности:

                             уj) Курите ли Вы?

                                                            

xi)  Пол

у1) Да

у2)Нет

ni*

х1) Мужской

6

10

16

х2) Женский

9

25

34

n*j

15

35

50


 

Исследование  связи между признаками х и  у

Проверка гипотезы о независимости  признаков х и у.

 

Для решения этой связи формируются следующие гипотезы:

H0: pij = pi* * p*j , i=1;2. j=1;2  (признаки х и у независимы, т.е. связь отсутствует)

H1: ij: pij = pi* * p*j , i=1;2. j=1;2  (между признаками существует значимая связь)

Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий Пирсона Х2. Статистика критерия имеет вид: Х2 =

Статистика Х2 при справедливости H0 распределяется по закону

V = (r-1)(s-1)=1

 

Рассчитаем теоретические частоты 

=

=

=

=

 

Рассчитаем наблюдаемое  значение статистики Х2

= = +0,14+0,06=0,63

Пусть уравнение значимости =0,05

По таблице 100 %-ых точек распределения Х2 находится значение статистики

Вывод: Так как (0,63<3,8), то гипотеза H0 подтверждается, следовательно, можно сделать вывод, что пол не оказывает значимого влияния на то, курит человек или не курит.

Проверка всех вычислений проводилась  в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.

 

2) Фиксированы значения двух признаков: х – пол (х1 –мужской, х2 – женский), у – Считаете ли Вы, что курение вредит здоровью? ( у1 – да, у2 – нет).

 

Результаты  опроса представлены в виде двухфакторной таблицы сопряженности:

                             уj) Вредит ли курение?

xi)  Пол

у1) Да

у2)Нет

ni*

х1) Мужской

13

3

16

х2) Женский

30

4

34

n*j

43

7

50


 

Исследование  связи между признаками х и  у

Проверка гипотезы о независимости  признаков х и у.

 

Для решения этой связи формируются  следующие гипотезы:

H0: pij = pi* * p*j , i=1;2. j=1;2  (признаки х и у независимы, т.е. связь отсутствует)

H1: ij: pij = pi* * p*j , i=1;2. j=1;2  (между признаками существует значимая связь)

Так как  объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий Пирсона Х2. Статистика критерия имеет вид: Х2 =

Статистика  Х2 при справедливости H0 распределяется по закону

V = (r-1)(s-1)=1

Рассчитаем теоретические частоты 

=

=

=

=

Рассчитаем наблюдаемое значение статистики Х2

= =

Пусть уравнение  значимости =0,05

По таблице 100 %-ых точек распределения Х2 находится значение статистики

= 3,8

 

Вывод: Так как > (3,8>0,44), то гипотеза H0 подтверждается, следовательно, можно сделать вывод, что пол не оказывает значимого влияния на то, вредит ли курение здоровью или нет.

Проверка всех вычислений проводилась  в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.

 

3) Фиксированы значения двух признаков: х – Курите ли Вы? ( х1 – да, х2 – нет), у – Считаете ли Вы, что курение вредит здоровью?  ( у1 – да, у2 – нет).

 

Результаты  опроса представлены в виде двухфакторной таблицы сопряженности:

                             уj) Вредит ли курение?      

xi)  Курите ли Вы?

у1) Да

у2)Нет

ni*

х1)да

10

5

15

х2)нет

33

2

35

n*j

43

7

50


 

Исследование  связи между признаками х и  у

Проверка гипотезы о независимости  признаков х и у.

 

Для решения этой связи формируются  следующие гипотезы:

H0: pij = pi* * p*j , i=1;2. j=1;2  (признаки х и у независимы, т.е. связь отсутствует)

H1: ij: pij = pi* * p*j , i=1;2. j=1;2  (между признаками существует значимая связь)

Так как объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий Пирсона Х2. Статистика критерия имеет вид: Х2 =

Статистика Х2 при справедливости H0 распределяется по закону

V = (r-1)(s-1)=1

 

Рассчитаем теоретические частоты 

=

=

=

=

 

Рассчитаем наблюдаемое  значение статистики Х2

= =

Пусть уравнение значимости =0,05

По таблице 100 %-ых точек распределения Х2 находится значение статистики

= 3,8

Вывод: Так как < (3,8<6,65), то гипотеза H0 отвергается, следовательно, можно сделать вывод, что в зависимости от того, курит человек или нет, он формирует свое мнение о влиянии курения на его здоровье.

Проверка всех вычислений проводилась  в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.

 

Перейдем к интерпретации  связи.

Рассчитаем коэффициенты связи  х – Курите ли Вы? ( х1 – да, х2 – нет), у – Считаете ли Вы, что курение вредит здоровью?  ( у1 – да, у2 – нет).

 

Меры связи, основанные на статистике :

а) Фи-коэффициент

- связь умеренная;

б) Коэффициент сопряженности Пирсона

- связь умеренная;

в) Коэффициент контингенции

- связь умеренная, отрицательная;

г) Тао-коэффициент  Гудмана и Краскала

- связь слабая

 

Меры связи, основанные на отношении  шансов:

а) Коэффициент  ассоциации

- связь тесная, отрицательная

Рассчитаем доверительные интервалы для коэффициентов связи. Для таблиц сопряженности 2 2 доверительные интервалы рассчитываются только для коэффициента Юла (ассоциации):

, где  , следовательно, с вероятностью коэффициент Юла принадлежит интервалу (-3,38; -0,023);

б) Коэффициент  поллигации

- связь умеренная, отрицательная

в) Отношение  шансов

<1 – связь отрицательная

 

Вывод: в результате проверки гипотезы о независимости признака х – Курите ли Вы? ( х1 – да, х2 – нет) и признака у – Считаете ли Вы, что курение вредит здоровью?  ( у1 – да, у2 – нет) доказано наличие значимой связи между признаками. По большинству коэффициентов связи можно сделать вывод, что эта связь – умеренной силы, отрицательная, т.е. если человек считает, что курение вредит здоровью, то, скорее всего, он не курит.

 

2.2. Анализ и  исследование связи в таблицах  сопряженности r×s

 

4) Рассмотрим 2 категоризованных номинальных признака: х – Ваш пол (х1-мужской, х2- женский), у – Ваш возраст (у1-до 25 лет, у2-25-40 лет, у3-после 40 лет).

 

Результаты опроса представлены в  виде таблицы сопряженности 2 3:

                             уj) Ваш возраст

xi)  Ваш пол

у1) до 25 лет

у2)25-40лет

у3)после 40 лет

ni*

х1)муж.

8

4

4

16

х2)жен.

15

12

7

34

n*j

23

16

11

50


 

Исследование связи между признаками х и у

Проверка гипотезы о независимости  признаков х и у.

 

Для решения  этой связи формируются следующие  гипотезы:

H0: pij = pi* * p*j , i=1;2. j=1;2  (признаки х и у независимы, т.е. связь отсутствует)

H1: ij: pij = pi* * p*j , i=1;2. j=1;2  (между признаками существует значимая связь)

Так как  объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий максимального правдоподобия . Статистика критерия имеет вид: .

Статистика критерия при справедливости H0 распределяется по закону V = (r-1)(s-1)=2

 

Рассчитаем теоретические частоты 

= ,36

= ,12

=

=

 

Рассчитаем критерий максимального правдоподобия статистики

= + +…+ =0,55

 

Пусть уравнение значимости =0,05

По таблице 100 %-ых точек распределения Х2 находится значение статистики

Вывод: Так как (6>0,55), то гипотеза H0 подтверждается, а следовательно, между признаками х и у не существует связи, то есть пол человека не зависит от его возраста и наоборот.

Проверка всех вычислений проводилась  в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.

 

5) Рассмотрим 2 категоризованных номинальных признака: х – Ваш пол (х1-мужской, х2- женский), у – Как вы относитесь к курению? (у1-положительно, у2-отрицательно, у3-безразлично).

 

Результаты опроса представлены в  виде таблицы сопряженности 2 3:

                             уj) Отношение к курению

xi)  Ваш пол

у1)полож.

у2)отриц.

у3)безразл.

ni*

х1)муж.

1

13

2

16

х2)жен.

4

25

5

34

n*j

5

38

7

50


 

Исследование  связи между признаками х и  у

Проверка гипотезы о независимости  признаков х и у.

 

Для решения  этой связи формируются следующие  гипотезы:

H0: pij = pi* * p*j , i=1;2. j=1;2  (признаки х и у независимы, т.е. связь отсутствует)

H1: ij: pij = pi* * p*j , i=1;2. j=1;2  (между признаками существует значимая связь)

Так как  объем выборки n больше 30, то для проверки гипотезы H0 используется Критерий максимального правдоподобия . Статистика критерия имеет вид: .

Статистика  критерия при справедливости H0 распределяется по закону V = (r-1)(s-1)=2

 

Рассчитаем теоретические частоты

=

=

=

=

 

Рассчитаем критерий максимального правдоподобия статистики

= + +…+ =0,483

 

Пусть уравнение значимости =0,05

По таблице 100 %-ых точек распределения Х2 находится значение статистики

Вывод: Так как (6>0,483), то гипотеза H0 подтверждается, а следовательно, между признаками х и у не существует значимой связи, то есть от пола человека не зависит его отношение к курению.

Проверка всех вычислений проводилась  в компьютерной программе STATICTICA 8. Результаты проверки представлены в Приложении В.

 

6) Рассмотрим 2 категоризованных номинальных признака: х – Курите ли Вы? (х1-да, х2- нет), у – Как Вы относитесь к курению? (у1-положительно, у2-отрицательно, у3-безразлично).

 

 

 

 

 

Результаты опроса представлены в  виде таблицы сопряженности 2 3:

                             уj) Отношение к курению

xi)Курите ли Вы?

у1)полож.

у2)отриц.

у3)безразл.

ni*

х1)да

5

6

4

15

х2)нет

-

32

3

35

n*j

5

38

7

50

Информация о работе Контрольная работа по «Статистический анализ нечисловой информации»