Автор: Пользователь скрыл имя, 13 Октября 2011 в 12:35, контрольная работа
Чотири основні етапи статистичного аналізу даних
Планування збору даних
Попереднього дослідження
Оцінки невідомої величини
Перевірки гіпотези
Етапи
Формулювання теорії
Операціоналізація теорії
Вибір адекватних методів дослідження
Спостереження за поведінкою
Аналіз данних
Інтерпретація отриманих результатів
Обмеження на використання критерію:
Алгоритм:
Формула за якою знаходимо фактичне значення:
n1 – розмір одної вибірки
n2 – розмір іншої вибірки
nmax – кількість значень у тій вибірці, де сума рангів (які ми рахували на попердньому етапі) вища
Tmax – ось ця максимальна сума рангів.
Критичне значення – дивимось за таблицею
Однофакторний дисперсійний аналіз використовується для перевірки значимої відмінності у випадку більше двох вибірок.
Для перевірки гіпотизи в дисперсійному аналізі використовується F-тест, який базується на F-статистиці.
Це відношення двох дисперсій
Початкові
дані для дисперсійного каналізу
це кількість незалежний одновимірних
вибірок.
Вимоги для коректного використання дисперсійного аналізу:
гіпотизи Нноль - а1 = а2 = ..... аК
а – середнє значення генеральної сукупності.
Н1 а1 не доврінює а2. треба щоб хоч одна пара відрізнялась.
Міжгрупова
варіація показує наскільки
Вимірюється наскільки неоднорідне кожна з вибірок.
Значення
вище коли вища неоднорідна всердині.
Підготувати 3 рекламні акції для здійснення. Оцінити ефективність
середній бал | 30,5 | 40,8 | 35,2 |
стандартне відхилення | 4,7 | 5.3 | 2,2 |
розмір вибірки | 100 | 95 | 102 |
Н0 а1=а2=а3, тобто ефектвність однакова.
n – загальна кількість
n = n1+n2+n3=100+95+102=297
загальна середня ефективність 3-х акцій
Міжгрупова варіація (наскільки дані неоднорідні)
k = 3 – кількість вибірок.
Внутрішня варіація (неоднорідність всередниі кожної групи)
df1 = k-1 = 2
df 2= n – k = 294
F =
Міжгрупове >внутрішнього в 143.12 раз
Неоднакові оцінки між різними рекламними роликами в 143 більша за неоднорідність в середині кожного ролика.
В імовірнісний калькулятор – розподіл Фішера (вносимо df1 i df2)
Для рівня значимості
Отже, фактичне 143,12 вийшло більше за критичне 3,026, тому відхиляємо гіпотизу Н0 на користь Н1
Порівнює
розподіл значень вибірок при
цьому використовуються ранги і
альтернативні гапотези F1(x) =
F2(x)=...=Fn(x)
Для дослідження впливу регіонів України на кількість голосів отриманих переможцем 1-ого туру вибрів:
Ранжуємо все разом, виходить
середній ранг по всім рівням
Рахуємо загальне середнє
Критичне значення в ймовірнісному калькуляторі з розподілом Х2 від k-1 = 5 – 1 =4
Порвінюємо фактичне і критичне 21,32>9.48
Відхиляємо гіпотезу Н0 на користь Н1
2
вибріки – голосування за
N1 = 1000
N2 = 1500
H0 = F1=F2
вік | кількість голосів (квітень) | кількість голосів (травень) | накопичена частота |
менше 20 | 220 | 300 | 220 |
20-30 | 150 | 250 | 370 |
30-40 | 100 | 250 | 470 |
40-50 | 350 | 400 | 820 |
50-60 | 100 | 160 | 920 |
більше 60 | 80 | 140 | 1000 |
1000 | 1500 |
критичне значення tкр = 1,36
Fn1 | Fn2 | F(Fn1 – Fn2) |
220/1000 | 300/1500 | 0.02 |
370/1000 | 550/1500 | 0.01 |
470/1000 | 800/1500 | -0.06 |
820/1000 | 1200/1500 | 0.02 |
920/1000 | 1360/1500 | 0.02 |
1000/1000 | 1500/1500 | 0 |
Знаходимо макимум F по модулю = 0,06
tфакт = 1,47
tкрит = 1,36
Фактичне більше. значить основну гіпотизу відкидаємо, приймаємо альтернативну.
Дослідження
взаємозв’язку між двома
Чи впливає і як сильно зміна значень однієї змінної (незалежної змінної) на зміну значень іншої зміної (залежної змінної)
Визначення форми і напрямку зв’язку.
Можливість
того, що будь-який взаємозв’язок, що існує
між показниками представленими
вибірками значень з більш
великих сукупностей дійсно є
характеристикою цих
Зв’язок
- це співвідношення 2 або більше змінних
по якому вони поваріюють.
Поваріаційне відношення - це залежність при якій 2 або більше змінні виявляють тенденцію змінюватись одночасно.
Дослідження взаємозв’язку між змінними вивчають кореляційний аналіз і регресійний аналіз.
Основна задача кореляційного аналізу - це виявлення зв’язку між змінними та оцінка сили цього зв’язку.
Основна задача регресійного аналізу - це встановлення форми та вивчення залежності між змінними.
Корреляційна залежність - це залежність між двома випадковими змінними яка виражається функціонально як залежність значень однієї змінної від математичного очікування іншої змінної.
В корреляційному аналізі існує дуже багато взаємозв’язків і визначаємо чи є він чи ні.
Цей коефіцієнт показує взаємозв’язок між двома змінними. Цей коефіцієнт тільки для лінійного взаємозв’яку.
Значення, які приймає показник лежить в діапазоні від -1 до 1.
За
напрямком взаємозв’язок