Процес політичного дослідження

Автор: Пользователь скрыл имя, 13 Октября 2011 в 12:35, контрольная работа

Описание работы

Чотири основні етапи статистичного аналізу даних
Планування збору даних
Попереднього дослідження
Оцінки невідомої величини
Перевірки гіпотези

Содержание

Етапи
Формулювання теорії
Операціоналізація теорії
Вибір адекватних методів дослідження
Спостереження за поведінкою
Аналіз данних
Інтерпретація отриманих результатів

Работа содержит 1 файл

KOD.doc

— 429.50 Кб (Скачать)

      Якщо  кількість значень парна, то медіана  як середньоарифметична двох центральних  значень.

      5 4 5 2 3 4 5 3 – Медіана 2,5

      Для кількісних неперервних знаходимо  медіальний інтервал, а потім визначаємо значення медіани. 

      Середнє значення (“х” з  горизональної палочкою зверху) – найбільш поширена центральна тенденція для кількісної змінної. Сума всіх значень ділиться на кількість

      4 2 3 – Середнє значення 3,33

      Властивості

    • Якщо скласти  результат віднімання від відхилень  середнього арифмитичного, то сума = 0.

              3 5 7 9 – середнє  значення 24/4= 6

              3 – 6 = -3

              5 – 6 = -1

              7 – 6 = 1

              9 – 6 = 3

              (-3) + (-1) + 1 + 3 = 0

    • Сума квадратів відхиленн всіх змінних від середнього менша суми квардатів відхилення від будь-якого іншого значення. Помилка обумовлена як сума квадратів відхилень, завжди мінімальна.

      Зауваження

      До  вибору міри центральної тенденції

    • Якщо розподіл – унімодальний і симетричний, то медіана, мода і середнє значення співпадають
    • На медіану не впливає дуже великі та дуже малі значення змінної
    • На середнє значення впливають всі значення
    • У випадку бімодального розподілу центральної тенденції може не існувати взагалі
    • У певних вибірках значення моди не стабільне.
 

      Розмір  варіації дає уявлення про діапазаон

      R = max – min

      Квантові  варіації поділяють весь діапазон значень змінної певної групи з відповідним пропорціями

    • Квартиль
    • Квітель
    • Децель
    • Перцептель

      Лінія - впорядкований кількісний розподіл вибірки (1,1,2,3,4,5,6,7,8,8,9,10...)  

                                      Median  

      |---------------||---------------|---------------||----------------|

      min            Q1                                 Q2               max 

                       25%                               75%

      <--------------------------------range------------------------>  

                         <--------Q-range-----------> 

      Q1- upper quartile (верхній квартиль)

      Q1- lower quartile (нижній квартиль)

      range (розмах; повний діапазон) = max - min

      quartile range (квартильний розмах) = Q2-Q1 -тобто, 50% вибірки навколо медіани

      percentile (перцентиль; "відсоткове значення") - будь-який відсоток на лінії,  і відповідно значення яке  в цьому "місці" (напр, Q1=Percentile-25%, Q2=Percentile-75%, Median=Percentile-50% і т.д.)

      Дисперсія – описує неоднорідність всіх значень вибірки. Показує наскільки розсіяними є дані віднос середнього арифметичного.

        

       n ≥100

       n<100

      Стандартне  відхилення вимірює в тих самих одиницях, що ми вимиріюємо змінну.

      Сигма = усереднене відхилення від середнього значення

      σ мала – згутрування навколо середного  значення

      σ велика – неоднорідні дані і тим  сильніше розкидані. 

      Використання  стандартного відхилення можна порівняти міри розсіювання різних змінних, або однієї змінної для різних сукупностей

      Показник  за допомогою якого ми будмео вимірювати – коефіцієнт варіації

        

      Приклад

      Нехай ми обчислюємо середнє значення та стандартне відхилення тривалості ситрат часу на вачання

Соціологія Х=6 σ = 2 (однор)
Політологія Х =3,5 σ = 4
Психологія Х = 4,5 σ = 4
Історичний Х = 6 σ = 6 (неодн)
 

      Порівняти всі чотири групи за формулою σ/х×100%

      Соціологія = 2/6 100% = 33%

      Політологія= 4/3,5 100% = 114%

      Психологія = 4/4,5 100% = 88%

      Історичний 6/6 100% = 100%

      Чим нище значення – однорідне

      Чим вище значення – неоднорідне 

      А- коефіцієнт асиметрії (симетрчний розподіл значень знмінних)

      А = 0 – розподіл симетричний, Медіана=Моді=Середньому значенню

      А > 0 - правостороння ассиметрія (Медіана<Моди<Середнього значення)

      А<0 – лівостороння ассиметрія (Медіана>Моди>Середнього значення) 

      Е – коефіцієнт крутизни розподілу

      Е = 0 – розподівл співпадає з  нормальний

      Е>0 – більш гострий розподіл

      Е<0 – більш пологий розподіл 

      Задача оцінки невідомих величин

      Теоритичні  криві розподілу

відмінно 10 10/70
добре 35 35/70 = 0,5 = 50% найбільша  ймовірність
плохо 15 15/70
оч  плохо 10 10/70
  70  

      Функція розподілу ймовірності

      (вибачте,  але тут графік. Будується за  наступним принципом. На осі Х у нас оцінки від 2 до 5, на осі У у нас ймовірність потрапляння. Відповідно до табличних даних будуємо лінію)

      Неперервні змінні

      Не  можливо визначити ймовірність  певного значення, лише визначається ймовірність того, що потрапить в  певний інтевал.

      Щільність ймовірності

      

      -∞  до х1 = 0

      х2 до +∞ = 0

      S = x1 + x2 

      Наприклад, х – час виступу, змінна яка  описує час доповіді на ВР. Зазвичай доповідь від 8 до 12 хвилин. Рівна ймовіність потапити на інтевали рівної довжини.

      

      Правило 2 або 3 сігм

      Якщо  від точки середнього значення відкласти  праворуч або ліворчу 2 або 3 стандартних  відхилення, то площа під графіком функції цільності ймовірності  обчислена за цим інтевалом буе  дорівнювати

      2σ  = 94,45

      3σ  = 99,73

      (не  питайте як) 

      68% спотережнень в межах +-1 стандартне  відхилення від середнього значення

      За  межами 32% спостережнь

      95% потрапить в +-3 стандартного відхилення  від стандартного значення.

      Якщо  середнє значення = 0, а середнє  відхилення = 1 – це стандартне нормально розподілення

      Якщо  узагальтати отриманий для вибірки  для всієї генеральної сукупності, то викорстовуємо метод індуктивної  статистики.

      Все, до цього дискритивна статистика – дослідження вибіркового значення.

      Оцінювання

      Перехід від числових характеристик вибірки до числових характеристик генеральної сукупності.

      Інтервальна оцінка – числовий інтевал, який з заданого імовірністю потрапляє в невідоме значення параметру.

      Довірчий  інтервал – числовий інтрвал.

      Довірча імовірність – імовірність, з  якою потрапить в цей інтервал.

      Довірчий  інтервал залежить від 2 параметрів:

    • Величина вибірки
    • Значення довірчої імовріності

      Довірчий  інтервал зменшується зі збільшенням  розміру вибірки.

      Величина  збільшується, коли значення довірчої імовірності найближається до 1.

      Алгорит побудови довірчого інтевалу

    1. Випадок. Дисперсія (σ2) – генеральної сукупності відома.
    2. Випадок. Дисперсія не відома.
 
    1. Перевторюємо  змінну Х у випадкову величину з стандартним нормальни розподілом. – Z – нормальна величина з нормальним розподілом.

                       

      За  вибіркою визначили точне значення середнього вибіркового, а оцінити  треба середнє генеральної сукупності (а), тобто середню кількість голосів  по Україні

        

        

      Граничні  точки позначаємо Z та –Z

      Те, що знаходиться в середині між Z та –Z називається область допустимих значень

      Область після Z та –Z  - називається критичною  областю (α)

      Довірча імовірність = 0,9454

      S = 1 (загальна Площа всього графіку)

      α = 1 – 0,9454 = 0,465

      α – рівень значимості/критична область

      1 = Рдовірча + α – Рдовірча – імовірніст потрапити в довірчий інтервал. 

      Статистика  – імовірнісний калькулятор –  для знаходження Z α/2 та -Z α/2 вводимо  середнє значення стандартного відхилення та Р

      Рдовірче ( ) = 0,95

      Р(10,5≤α≤12,7) = 0,97 

    1. Дисперсія не відома

    Розподіл  Стьюдента використовуємо для знаходження  граничних значень. Розподіл Стьюдента  залежить від (Т):

    • кількості степенів свободи – df= n-1

      За  результатами телеопитування 1064 мешкаців у віці від 18  і більше років  проведеного центром Разумкова, 19-20 березня 2008 року. Кандидати у  мери Черновецького підтримують 24.9%

    1. Знайти границі в яких з .... 0,95% потрапить рейтинг Черновецького при голосуванні всіх мешканців міста
    2. Визначити скільки респондентів потрбіно опитати щоб отримати надійність 0,99%

Информация о работе Процес політичного дослідження