Процес політичного дослідження

Автор: Пользователь скрыл имя, 13 Октября 2011 в 12:35, контрольная работа

Описание работы

Чотири основні етапи статистичного аналізу даних
Планування збору даних
Попереднього дослідження
Оцінки невідомої величини
Перевірки гіпотези

Содержание

Етапи
Формулювання теорії
Операціоналізація теорії
Вибір адекватних методів дослідження
Спостереження за поведінкою
Аналіз данних
Інтерпретація отриманих результатів

Работа содержит 1 файл

KOD.doc

— 429.50 Кб (Скачать)

      P – частка у вибірці

      α - частка в генеральній вибірці

      P -?

      P(p-a)≤0.01 - ?

      Δ = 0.01

      tкритичне =  

      df = 1067-1=1066

      x=0.76 

      Отримуємо P            two tailed

      P дов = 0,55 = 55%

      на  наступних виборах Чер. отримає 24,9% +-2,6 з імовірністю 0,55

      Перевірка статистичної гіпотизи

      Статистична гіпотеза – будь-яке припущення про вид або параметри невідомого закону розподілу генеральної сукупності.

    1. Статистична гіпотиза – це твердження про якусь сукупність
    2. Твердження про параметр або про вид

      Гіпотеза  яка перевіряється – це нульова гіпотеза. (Н0)

      Альтернативна або конкуруюча гіпотиза є логічним заперечення нульової гіпотизи Н1 

      Н0 – це певне твердження, яке приймається тоді, коли немає переконаних аргументів для його відхилення.

      Н1 – приймається тоді, коли є переконуючі докази, які відкидаються тожливість прийняття гіпотизи Н0 

    • Відхили Н0 означається прийняття Н1
    • Якщо приймаємо Н0, то маємо слабкий висновок і відсутній значимий резульат.
    • Якщо відхиляємо Н1, то маємо сильний висновок і значимий результат.
    • Правило за якими відхиляємо або приймаємо Н0 називається статистичним критерієм.

      Множина можливих значень статистики критерію розбивається на 2 області, які не перетинаються між собою – критичною областю та областю допустимих значень/область прийняття гіпотизи.

    • Якщо фактичне значення статистики критерію поратипло в область допустимих значень – приймаємо Н0
    • Якщо потрпило в критичну область, то ми відхиляємо Н0
 
H0 приймаємо відхиляємо
вірна правильне рішення помилка першого  роду
невірна помилка другого  роду правильне рішення
 
    • Імовірність альфа допустити помилку першого  роду називається - рівнем значимості критерію. - коли у нас ймовірність правильного рішення 95%, то рівень значимоссті 5%. 1 - АЛЬФА = Рдовірча
    • Імовірність допустити помилку другого роду БЕТТА. 1 - БЕТТА = потужність критерію.
 

      Для опису результатів перевірки  гіпотизи будемо використовувати такі треміни.

    • Результат перевірки незначемий - відсутність значимість на рівні 5%
    • Результат перевірки значемий - значимість на рівні 5%
    • Результат перевірки високо значемий - значимість на рівні 1%
    • Результат перевірки дуже високозначемий - значимість на рівні 0,1%

      Чим менший рівень значимості, тим більш сильний результат отримаємо. Потрібно завжди вказувати найменший рівень значимості, на яку відхиляємо основні гіпотезу.

      Дуже  високозначимий результат  повинен бути значими  на всіх рівнях.

р>0,05 результат незначимий Н0 приймаємо
р<0,05 результат значимий Н0 відхиляємо та приймаємо Н1
р<0,01 результат сильнозначимий більш сильний результат  – маємо більше доказів, щоб відхили  Н0
  результат дуже сильнозначемий Н0 відхиляємо

      Н1   0,05    Н0

        

      Якщо  α = 0,05, то Рдовірче=1 – α = 1 – 0,05 = 0,95

      Якщо  підтверджується Н0 або спростовується, то результат будемо гарантувати з достовірністю Р = 0,95

      В статистиці рахуємо і дивимось в  який інтервал вона потрапить число.

      Зліва від 0,05 відхиляємо, справа – приймаємо.

      Загальні етапи  перевірки статистичної гіпотези:

  1. формулюємо 
  2. обчислюємо фактичне значення статичтики критерію
  3. знаходимо критичне значення. для чого задаємо рівень значимості перевірки гіпотизи,
  4. Порівнюємо фактичне та критичне значення.
    1. Якщо фактичне менше за критичне – приймаємо Н0
    2. Якщо фактичне більше критичного, то Н1
  5. формулюємо висновок.

      Перевірка гіпотизи про закон розподілу

      Розглядаємо задачу про встановлення теоретичного закону розподілу випадкової величини за еміричним розподілом

      Теоритичний закон розподілення буває:

    • нормальний
    • student

      Перевіряємо чи відповідає емпіричний розподіл теоритичному нормальному розподілу.

      Критерій узгодженості χ2 Пірсона

      Статистичний  критерій:

      

      nwi – емпіричн частота (змінну представляємо у вигляді інтевалів, від 0 до 10, від 10 до 20 і скільки з них сюди потрапить)

      npi – теоритична частота

      n – кількість інтервалів для  значень змінної формулювання  гіпотези. 

      Перевіряємо якщо змінна має менш 30 значень, обов’язково  чи є розподіл нормальни

      Н0 – розподіл значень змінної відповідає теоретичному нормальному розподілу

      Н1 – розподіл значень знмінної не відповідає теоритичному нормальному розподілу.

      Перевірка гіпотези про середнє значення

      Всі значення підпорядковуються нормальному  закону розподілу.

      Припускаємо, що значення розподілу за нормальним законом.

      Якщо  значень більше 30, то автоматично  вважається, що розподіл є нормальним.

    1. Порівнюємо за середнім значенням 2 вибірки, використовуючи t-тест для незалежних вибірок
    2. Порівнюємо 2 вибірки (однофакторинй дисперсійний аналіз)
    3. Для однієї вибірки використовуємо простий (одиничниний t-тест)

      При формулюванні гіпотези ми формулюємо твердження про всю вибірку.

      Загальний огляд  параметричних та непараметричних  методів

      Всі критерії розподіляються на 3 групи.

    1. Критерії відмінності між незалежними вибірками
    2. Відмінність між залежними вибірками
    3. Критерії оцінки залежності між змінними

      При порівняння 2-х вибірок (і більше) один з основних критеріїв – залежність вибірок. Якщо елементу з 1-ї вибірки  відповідає один і тільки один елемент  з 2-ої вибірки, то така вибірка називається залежною. (столиця-країна) Якщо взаємозв’язок відсутній, то така вибірка називається незалежною.

      Критерії відмінності  між незалежними групами

 
2 вибірки більше 2 вибірок
параметричні непараметричні параметричні непараметричні
t - student критерій Манна Уітні дисперсійний  аналіз ранговий критерій Краскела Уоліса
  Калмогарова - Смірнова   медіанний тест

      Критерії відмінності  між залежними групами

2 вибірки більше 2 вибірок
параметричні непараметричні параметричні непараметричні
t – student для залежних вибірок критерій значення (знаків) дисперсійний  аналіз з повторюванням дисперсійний  аналіз Фрідмана

      Залежність між  змінними

      2 вибріки

      Параметрчині

    • коефіцієнт кореляції Пірсона (сила взамомзв’яку між двома змінними)

      Непараметричні

    • коефіцієнт Спірмена
    • коефіцієнт Гамма
    • статистика Кендела
 

      Непараметричні  методи - це такі статистичні процедури для перевірки гіпотиз, які не потребують нормального розподілу значень змінної. 

      Параметричні  методи - це статистичні процедури, які вимагають нормального розподілу.

      Переваги непараметричних  методів

    • не потрібно припущення про нормальний розподіл
    • непотрібно перетворювати дані у форму з нормальни розподілом
    • можна використовувати порядкові дані
    • якщо розподіл відрізняється від нормального розподілу, то непараметричні методи мають більшу ефективність в порівнянні з параметричними.

      Недоліки непараметричних  методів

    • якщо розподіл відповідає нормальному, то маємо меншу  ефективність методу в порівнянні з  параметричним
 

      Ефективність - показує наскільки повністю використовуються дані, які використовуються для аналізу

      Що  б визначити чи до параметричних  чи не до параметричних, то треба це робити за допомогою критерію хі квадрат  Пірсона. Якщо відповідає нормальному, то звератємось до параметричних.

      Якщо  розмір вибірки 30 елементів, то нормальний розподіл вважається вже наявним

      Метод Манна Уітні

      Маємо дві вибірки, і хочемо їх порівняти.

      Непараметричний статистичний метод який використовується для оцінки розходжень між двома  вибірками за рівнем певної ознаки. (кількісної)

      Цей метод визначає зону розходжень між двома вибірками та зону перехресних значень між двома вибірками.

      Чим менше значення критерію тим більша імовірність, що розходження між  значеннями параметра у вибірках достовірні. 

Информация о работе Процес політичного дослідження