Шпаргалка по "Статистике"

Автор: Пользователь скрыл имя, 30 Марта 2013 в 22:38, шпаргалка

Описание работы

1. Особливості статистики як самостійної суспільної науки.
2. Завдання і предмет статистики. Основні категорії статистики.
4. Суть, джерела та організаційні форми статистичного спостереження.
5. Програмно-методологічні та організаційні питання як основа плану статистичного спостереження.
6.Види і способи проведення статистичного спостереження.

Работа содержит 1 файл

Сатистика.docx

— 455.40 Кб (Скачать)

Рис. 7.2. Узгодженість варіації взаємозв'язаних ознак

Коефіцієнт кореляції визначається  відношенням зазначених сум:

 

Очевидно, що в разі функціонального зв'язку фактична сума відхилень дорівнює граничній, а коефіцієнт кореляції r = ±1; при кореляційному зв'язку абсолютне його значення буде тим більшим, чим щільніший зв'язок.

Коефіцієнт кореляції, оцінюючи щільність зв'язку, указує також на його напрям: коли зв'язок прямий, г — величина додатна, а коли він зворотний — від'ємна. Знаки коефіцієнтів кореляції і регресії однакові, величини їх взаємозв'язані функціонально:

Вимірювання щільності  нелінійного зв'язку ґрунтується  на співвідношенні варіацій теоретичних та емпіричних (фактичних) значень результативної ознаки у.

 

44. Регресійний аналіз взаємозв’язку, оцінювання щільності та перевірка істинності кореляційного зв’язку на основі рівняння регресії.

Важливою характеристикою кореляційного  зв'язку є лінія регресії— емпірична в моделі аналітичного групування і теоретична в моделі регресійного аналізу. Емпірична лінія регресії представлена груповими середніми результативної ознаки уJ, кожна з

яких належить до відповідного інтервалу  значень групувального фактора Xj. Теоретична лінія регресії описується певною функцією Y = f(x), яку називають рівнянням регресії, а Y— теоретичним рівнем результативної ознаки.

На відміну від емпіричної, теоретична лінія регресії неперервна. Так, уважають, що маса дорослої людини в кілограмах має бути на 100 одиниць менша за її зріст у сантиметрах. Співвідношення між масою і зростом можна записати у вигляді рівняння: Y = -100 + х, де y — маса; х — зріст.

Безперечно, така форма зв'язку між  масою та зростом людини надто  спрощена. Насправді збільшення маси не жорстко пропорційне до збільшення зросту. Люди одного зросту мають різну масу, проте в середньому зі збільшенням зросту маса зростає. Для точнішого відображення зв'язку між цими ознаками в рівняння слід увести другий параметр, який був би коефіцієнтом пропорційності при х, тобто Y=- 100 + bx.

Рівняння регресії в такому вигляді  описує числове співвідношення варіації ознак х і у в середньому. Коефіцієнт пропорційності при цьому відіграє визначальну роль. Він показує, на скільки одиниць у середньому змінюється у зі зміною х на одиницю. У разі прямого зв'язку b — величина додатна, у разі оберненого — від'ємна.

Подаючи у як функцію х, тим самим абстрагуються від множинності причин, штучно спрощуючи механізм формування варіації у. Аналіз причинних комплексів здійснюється за допомогою множинної регресії.

Різні явища по-різному реагують на зміну факторів. Для того щоб відобразити характерні особливості зв'язку конкретних явищ, статистика використовує різні за функціональним видом регресійні рівняння. Якщо зі зміною фактора х результату змінюється більш-менш рівномірно, такий зв'язок описується лінійною функцією Y - а + bх. Коли йдеться про нерівномірне співвідношення варіацій взаємозв'язаних ознак (наприклад, коли прирости значень у зі зміною х прискорені чи сповільнені або напрям зв'язку змінюється), застосовують нелінійні регресії, зокрема:

степеневу                              Y = ахb ;

гіперболічну

параболічну                           Y = а + bх + сх2 тощо.

Вибір та обґрунтування функціонального  виду регресії ґрунтується на теоретичному аналізі суті зв'язку. Нехай вивчається зв'язок між урожайністю та кількістю опадів. Надто мала і надто велика кількість опадів спричинюють зниження врожайності, максимальний її рівень можливий за умови оптимальної кількості опадів, тобто зі збільшенням факторної ознаки (опади) урожайність спершу зростає, а потім зменшується. Залежність такого роду описується параболою Y = а + bх + сх2.

Вивчаючи зв'язок між собівартістю у та обсягом продукції х,

використовують рівняння гіперболи де a — пропорційні

витрати на одиницю продукції, b — постійні витрати на весь випуск.

Зауважимо, що теоретичний аналіз суті зв'язку, хоча й дуже важливий, лише окреслює особливості форми  регресії і не може точно визначити  її функціонального виду. До того ж  у конкретних умовах простору і часу межі варіації взаємозв'язаних ознак х і у значно вужчі за теоретично можливі. І якщо кривина регресії невелика, то в межах фактичної варіації ознак зв'язок між ними досить точно описується лінійною функцією. Цим значною мірою пояснюється широке застосування лінійних рівнянь регресії:

Y = а + bх.

Параметр b (коефіцієнт регресії) — величина іменована, має розмірність результативної ознаки і розглядається як ефект впливу х на у. Параметр а — вільний член рівняння регресії, це значення у при х = 0. Якщо межі варіації х не містять нуля, то цей параметр має лише розрахункове значення.

Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого — мінімізація суми квадратів відхилень емпіричних значень у від теоретичних Y:

 

 

 

 

 

 

 

 

47. Вибіркові оцінки і  похибки репрезентативності.

Якщо генеральна сукупність містить N елементів, а для обстеження потрібно вибрати з них частину п, то число можливих вибірок

Усі вони мають однакову ймовірність але кожна з них несе в собі певну похибку, що відбиває факт випадковості вибору. Оскільки вибіркова сукупність не точно відтворює склад генеральної сукупності, то й вибіркові оцінки не збігаються з відповідними характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності: для середньої — це різниця між генеральною та вибірковою середніми, для частки — різниця між генеральною d0 і вибірковою р частками, для дисперсії— відношення генеральної та вибіркової дисперсій тощо.

За причинами виникнення похибки  репрезентативності поділяються на тенденційні (систематичні) та випадкові. Тенденційні похибки виникають, коли при формуванні вибіркової сукупності порушений принцип випадковості (упереджений вибір елементів, недосконала основа вибірки тощо). Ці похибки для всіх елементів сукупності однонапрямлені і призводять до зсунення результатів обстеження.

Випадкові похибки — це наслідок випадковості вибору елементів для дослідження і пов'язаних з цим розбіжностей між структурами вибіркової та генеральної сукупностей щодо ознак, які вивчаються.

45. Непараметричні методи  дослідження взаємозв’язків між  ознаками.

Якщо ж характер розподілу досліджуваної сукупності навіть передбачувано невідомий, то тісноту зв'язку можна обчислити за допомогою непарамет-ричних критеріїв визначення тісноти зв'язку.

Особливістю цих критеріїв  є те, що тіснота зв'язку між ознаками визначається не за кількісними значеннями варіантів, а за допомогою порівняння їх рангів. Під рангом розуміють порядковий номер одиниці сукупності в ранжированому ряду розподілу. Чим менші розбіжності між рангами, тим тісніший зв'язок між ознаками.

До непараметричних  критеріїв показників тісноти зв'язку відносяться коефіцієнти: кореляції рангів, знаків Фехиера, асоціації, контин-генції та ін.

Коефіцієнт кореляції  рангів - це один з найпростіших показників тісноти зв'язку (його ще називають ранговим коефіцієнтом кореляції Спірмена). Суть його розрахунку полягає в такому. Парні спостереження двох взаємопов'язаних ознак (результативної і факторної) ран-жируються, а потім відповідно величині ознаки їм надається ранг від 1 до п. Тіснота зв'язку визначається на основі близькості рангів, і формула коефіцієнта кореляції рангів буде мати вигляд:

де d - різниці між величинами рангів в порівнюваних рядах; п - число спостережень.

Смисл  його  такий  самий, як  і лінійного  коефіцієнта  кореляції.

Коефіцієнт кореляції  рангів, як і лінійний коефіцієнт кореляції, може приймати значення від - 1 до + 1.

Коефіцієнт кореляції  рангів може бути також використаний для визначення тісноти зв'язку між якісними (атрибутивними) ознаками, яким може бути надана рангова оцінка.

Коефіцієнт  Фехнера застосовується для оцінки тісноти зв'язку на основі порівнянь знаків відхилень значень результативної і факторної ознак від їх середніх, його обчислюють за формулою

де  - сума збігів знаків; - сума незбігів знаків.

Коефіцієнт Фехнера змінюється від 0 до ±1. Якщо знаки всіх відхилень збігаються, то = 0, а коефіцієнт Фехнера дорівнює одиниці, що свідчить про наявність прямого зв'язку. Якщо і знаки всіх відхилень будуть різними, то = 0, а коефіцієнт Фехнера дорівнює - 1, що вказує на наявність оберненого зв'язку.

Знак мінус означає, що значення ознаки менше середньої, знак плюс - більше середньої. Збіг знаків по обох ознаках означає узгоджену варіацію, незбіг - порушення узгодженості.

Слід мати на увазі, що коефіцієнт Фехнера тільки констатує наявність і напрям кореляційного зв'язку і не залежить від величини відхилень результативної і факторної ознак від відповідних середніх, у зв'язку з чим оцінка тісноти зв'язку є наближеною. Коефіцієнт Фехнера може бути деяким орієнтиром в оцінці інтенсивності зв'язку.

Тісноту зв'язку між атрибутивними (якісними) ознаками можна виміряти за допомогою спеціальних коефіцієнтів асоціації і континген-ції. запропонованих відповідно Д.Юлом і К.Пірсоном.

Для їх обчислення будується  чотириклітинна таблиця, яка показує зв'язок між двома ознаками, кожна з яких повинна бути альтернативною, тобто такою, що складається з двох якісно відмінних один від одного значень (наприклад, стан посівів задовільний або незадовільний, землі удобрені або не удобрені та ін.).

Загальна  схема чотириклітинної таблиці має вигляд (табл. 9.7).

Таблиця 9.7

Чотириклітинна таблиця для розрахунку коефіцієнтів асоціації і контингенції

 

Ознаки

А

Не А

IB

В Не В

ЕА

а с а + с

b d b + d

a + b c + d

N


В цій таблиці А і В ознаки, між якими вивчається зв'язок; не А і не В - протилежні (альтернативні) ознаки; а, b, с, d - частоти відповідних комбінацій ознак; N - загальне число спостережень.

 

48. Довірчі межі середньої  і частки.

У статистиці використовують два типи оцінок параметрів генеральної сукупності — точкові та інтервальні. Точкова оцінка— це значення параметра за даними вибірки: вибіркова середня та вибіркова частка р. Інтервальною оцінкою називають інтервал значень параметра, розрахований за даними вибірки для певної ймовірності, тобто довірчий інтервал. Чим менший довірчий інтервал, тим точніша вибіркова оцінка.

Межі довірчого інтервалу визначаються на основі точкової оцінки та граничної  похибки вибірки

для середньої

для частки

де — стандартна (середня) похибка вибірки; t — квантиль розподілу ймовірностей (довірче число).

 

46. Сутність та переваги  вибіркового методу спостереження,  причини й умови його застосування.

При статистичному обстеженні різних явищ суспільного життя часто  доводиться зустрічатися з прикладами недоцільності або неможливості проведення суцільного спостереження, тобто вивчення всіх одиниць сукупності. Так, недоцільно проводити обстеження бюджетів сімей в обсязі всієї країни, так як це було б зв'язане із залученням тисяч статистиків та значними матеріальними витратами. Практично неможливо на підприємстві для контролю якості хлібобулочних виробів, консервів тощо проводити суцільний контроль, так як це приведе до пошкодження або знищення всій партії продуктів. Тому у випадках, коли суцільне спостереження неможливо або недоцільно, використовують несуцільне спостереження, різновидом якого є вибіркове (вибірка). Цей вид спостереження широко використовується в соціологічних дослідженнях бюджетів сімей, обстеженні якості продуктів харчування, обстеженні домогосподарств, маркетингових дослідженнях, аудиторських перевірках тощо. Крім того, вибірковий метод використовується для прискорення обробки матеріалів суцільного спостереження, перевірки правильності даних переписів, проведення спостережень.

При вибірковому спостереженні  обстежуються не всі одиниці вивчаємого явища, а лише частина їх, за якими можна робити висновки про все явище в цілому.

Використання вибіркового методу замість суцільного спостереження  дає можливість зберігати трудові  ресурси і кошти, провести спостереження в стислі строки та отримати кінцеві результати в більш коротші терміни часу.

Информация о работе Шпаргалка по "Статистике"