Автор: Пользователь скрыл имя, 13 Октября 2011 в 12:35, контрольная работа
Чотири основні етапи статистичного аналізу даних
Планування збору даних
Попереднього дослідження
Оцінки невідомої величини
Перевірки гіпотези
Етапи
Формулювання теорії
Операціоналізація теорії
Вибір адекватних методів дослідження
Спостереження за поведінкою
Аналіз данних
Інтерпретація отриманих результатів
Якщо кількість значень парна, то медіана як середньоарифметична двох центральних значень.
5 4 5 2 3 4 5 3 – Медіана 2,5
Для
кількісних неперервних знаходимо
медіальний інтервал, а потім визначаємо
значення медіани.
Середнє значення (“х” з горизональної палочкою зверху) – найбільш поширена центральна тенденція для кількісної змінної. Сума всіх значень ділиться на кількість
4 2 3 – Середнє значення 3,33
3 5 7 9 – середнє значення 24/4= 6
3 – 6 = -3
5 – 6 = -1
7 – 6 = 1
9 – 6 = 3
(-3) + (-1) + 1 + 3 = 0
До вибору міри центральної тенденції
Розмір варіації дає уявлення про діапазаон
R = max – min
Квантові варіації поділяють весь діапазон значень змінної певної групи з відповідним пропорціями
Лінія
- впорядкований кількісний розподіл
вибірки (1,1,2,3,4,5,6,7,8,8,9,10...)
Median
|---------------||------
min Q1 Q2 max
25% 75%
<-----------------------
<--------Q-range----------->
Q1- upper quartile (верхній квартиль)
Q1- lower quartile (нижній квартиль)
range (розмах; повний діапазон) = max - min
quartile range (квартильний розмах) = Q2-Q1 -тобто, 50% вибірки навколо медіани
percentile (перцентиль; "відсоткове значення") - будь-який відсоток на лінії, і відповідно значення яке в цьому "місці" (напр, Q1=Percentile-25%, Q2=Percentile-75%, Median=Percentile-50% і т.д.)
Дисперсія – описує неоднорідність всіх значень вибірки. Показує наскільки розсіяними є дані віднос середнього арифметичного.
n ≥100
n<100
Стандартне відхилення вимірює в тих самих одиницях, що ми вимиріюємо змінну.
Сигма = усереднене відхилення від середнього значення
σ
мала – згутрування навколо
σ
велика – неоднорідні дані і тим
сильніше розкидані.
Використання стандартного відхилення можна порівняти міри розсіювання різних змінних, або однієї змінної для різних сукупностей
Показник за допомогою якого ми будмео вимірювати – коефіцієнт варіації
Приклад
Нехай ми обчислюємо середнє значення та стандартне відхилення тривалості ситрат часу на вачання
Соціологія | Х=6 | σ = 2 (однор) |
Політологія | Х =3,5 | σ = 4 |
Психологія | Х = 4,5 | σ = 4 |
Історичний | Х = 6 | σ = 6 (неодн) |
Порівняти всі чотири групи за формулою σ/х×100%
Соціологія = 2/6 100% = 33%
Політологія= 4/3,5 100% = 114%
Психологія = 4/4,5 100% = 88%
Історичний 6/6 100% = 100%
Чим нище значення – однорідне
Чим
вище значення – неоднорідне
А- коефіцієнт асиметрії (симетрчний розподіл значень знмінних)
А = 0 – розподіл симетричний, Медіана=Моді=Середньому значенню
А > 0 - правостороння ассиметрія (Медіана<Моди<Середнього значення)
А<0
– лівостороння ассиметрія (Медіана>Моди>Середнього
значення)
Е – коефіцієнт крутизни розподілу
Е = 0 – розподівл співпадає з нормальний
Е>0 – більш гострий розподіл
Е<0
– більш пологий розподіл
Задача оцінки невідомих величин
Теоритичні криві розподілу
відмінно | 10 | 10/70 |
добре | 35 | 35/70 = 0,5 = 50% найбільша ймовірність |
плохо | 15 | 15/70 |
оч плохо | 10 | 10/70 |
70 |
Функція розподілу ймовірності
(вибачте, але тут графік. Будується за наступним принципом. На осі Х у нас оцінки від 2 до 5, на осі У у нас ймовірність потрапляння. Відповідно до табличних даних будуємо лінію)
Не можливо визначити ймовірність певного значення, лише визначається ймовірність того, що потрапить в певний інтевал.
-∞ до х1 = 0
х2 до +∞ = 0
S
= x1 + x2
Наприклад, х – час виступу, змінна яка описує час доповіді на ВР. Зазвичай доповідь від 8 до 12 хвилин. Рівна ймовіність потапити на інтевали рівної довжини.
Якщо від точки середнього значення відкласти праворуч або ліворчу 2 або 3 стандартних відхилення, то площа під графіком функції цільності ймовірності обчислена за цим інтевалом буе дорівнювати
2σ = 94,45
3σ = 99,73
(не
питайте як)
68%
спотережнень в межах +-1 стандартне
відхилення від середнього
За межами 32% спостережнь
95% потрапить в +-3 стандартного відхилення від стандартного значення.
Якщо середнє значення = 0, а середнє відхилення = 1 – це стандартне нормально розподілення
Якщо
узагальтати отриманий для
Все,
до цього дискритивна статистика
– дослідження вибіркового
Перехід від числових характеристик вибірки до числових характеристик генеральної сукупності.
Інтервальна оцінка – числовий інтевал, який з заданого імовірністю потрапляє в невідоме значення параметру.
Довірчий інтервал – числовий інтрвал.
Довірча імовірність – імовірність, з якою потрапить в цей інтервал.
Довірчий інтервал залежить від 2 параметрів:
Довірчий інтервал зменшується зі збільшенням розміру вибірки.
Величина збільшується, коли значення довірчої імовірності найближається до 1.
За
вибіркою визначили точне значення
середнього вибіркового, а оцінити
треба середнє генеральної
Граничні точки позначаємо Z та –Z
Те, що знаходиться в середині між Z та –Z називається область допустимих значень
Область після Z та –Z - називається критичною областю (α)
Довірча імовірність = 0,9454
S
= 1 (загальна Площа всього
α = 1 – 0,9454 = 0,465
α – рівень значимості/критична область
1
= Рдовірча + α – Рдовірча –
імовірніст потрапити в довірчий інтервал.
Статистика – імовірнісний калькулятор – для знаходження Z α/2 та -Z α/2 вводимо середнє значення стандартного відхилення та Р
Рдовірче ( ) = 0,95
Р(10,5≤α≤12,7)
= 0,97
Розподіл Стьюдента використовуємо для знаходження граничних значень. Розподіл Стьюдента залежить від (Т):
За результатами телеопитування 1064 мешкаців у віці від 18 і більше років проведеного центром Разумкова, 19-20 березня 2008 року. Кандидати у мери Черновецького підтримують 24.9%