Автор: Пользователь скрыл имя, 22 Ноября 2011 в 18:47, курсовая работа
Від розвитку сільського господарства значною мірою залежить життєвий рівень населення і продовольча безпека країни . Ситуацію,що нині склалася в агропромисловому комплексі,без перебільшення можна назвати небезпечною. Нечіткі і мінливі повідомлення зі столиці,з яких важко дізнатися,чи є резерв зерна,чи комори держави порожні,невтішна інформація стосовно майбутніх урожаїв,подальше зубожіння селянських господарств-усе викликає занепокоєння,адже під загрозою опинилася продовольча безпека населення країни.
Передмова
Розділ 1. Аналіз простої лінійної кореляції
Теоретичні основи аналізу простої лінійної кореляції
Аналіз регресії
Оцінка тісноти зв’язку
Розділ 2. Аналіз простої нелінійної кореляції
2.1. Теоретичні основи аналізу нелінійної кореляції
Аналіз регресії
Оцінка тісноти зв’язку
Розділ 3. Аналіз множинної лінійної кореляції
3.1. Теоретичні основи множинного лінійного кореляційного аналізу
3.2. Аналіз регресії
3.3. Оцінка тісноти зв’язку
3.4. Перевірка статистичної гіпотези
Висновки
Список літератури
Методологія множинної кореляції ґрунтується на загальних принципах кореляційного аналізу. Водночас в ній ускладнюється змістовний аналіз, зростає складність математичного апарату.
При формуванні множинної кореляційної моделі необхідно враховувати ряд обмежень, пов'язаних з відбором, кількістю і взаємозв'язком факторів, вибором форми зв'язку (рівняння регресії).
Відбір найістотніших факторів до кореляційної моделі є одним з найважливіших і принципових завдань багатофакторного кореляційно-регресійного аналізу. Природно, що всі фактори, які впливають на досліджувану результативну ознаку, до рівняння регресії включити не можна. З усього комплексу таких факторів необхідно відібрати найбільш важливі, істотні. Захоплення великою кількістю факторів при відносно невеликій чисельності сукупності може призвести до неякісних результатів. Крім того, із збільшенням в рівнянні регресії кількості параметрів значно утруднюється інтерпретація одержаних результатів.
Велику роль у відборі факторів відіграють завчасно побудовані і проаналізовані факторні групування. Дуже важливого значення тут набувають комбінаційні групування, які дозволяють визначити вплив на результативну ознаку фактора, що цікавить дослідника, при фіксованих значеннях інших факторів.
Можна зробити безперечний висновок про те, що статистичні групування становлять основу длякореляційного і дисперсійного аналізу і найбільшої ефективності останні досягають в поєднанні з методом групувань.
Практичні розрахунки показують, що для забезпечення стійкості параметрів рівняння зв'язку кількість факторів, включених до моделі, має бути в 6-8 разів меншою від чисельності досліджуваної сукупності. При цьому сукупність, з якої відбирають фактори, повинна бути якісно однорідною.
Відбираючи фактори, потрібно виключати ті, що взаємно дублюють один одного і перебувають у функціональному зв'язку. Функціональний або близький до нього зв'язок між самими факторами вказує на мультико-лінеарність (для двох - колінеарність). Наявність мультико-лінеарності свідчить про те, що ці фактори відображають ту саму сторону впливу на результативну ознаку.
При високій корельованості факторів (тіснота зв'язку між двома факторами перевищує г > 0,8) вплив одного з них акумулює і вплив другого. Одержані при цьому кореляційні моделі стають нестійкими.
При формуванні кореляційної моделі до неї потрібно включити один з цих факторів, який істотніше впливає на результативну ознаку. При мультиколінеарності включення до кореляційної моделі взаємопов'язаних факторів можливе тоді, коли тіснота зв'язку між ними менша, ніж тіснота зв'язку результативної ознаки з кожним фактором. Потрібно, щоб кореляційна модель містила незалежні і такі, що не дублюють один одного, фактори. Небажаним є включення до однієї моделі часткових і загальних факторів. Повністю слід виключити фактори, функціонально пов'язані з результативною ознакою.
Важкою і складною проблемою побудови рівняння множинної регресії є також вибір функції зв'язку, тобто вибір математичного рівняння, яке найповніше проявляє характер взаємозв'язку між результативною ознакою і включеними до рівняння регресії факторами.
Одна із складностей полягає у взаємозв'язку і взаємодії факторів між собою та з результативною ознакою. Тому звичайні прийоми, використовувані при виборі форми зв'язку при парній кореляції (графічний та ін.), тут малоприйнятні.
Вибір рівняння регресії може спиратися на положення теорії досліджуваного явища або практичний досвід попередніх досліджень. Якщо таких даних немає, то допомогти у вирішенні цього питання може побудова комбінаційних групувань, таблиць розподілу чисельностей, експертні оцінки, вивчення парних зв'язків між результативною ознакою і кожним фактором, графіки, перебирання функцій різних типів (при розв'язанні задач на ЕОМ), послідовний перехід від лінійних рівнянь зв'язку до більш складних видів тощо.
Виконання усіх цих прийомів пов'язане із значною кількістю зайвих підрахунків. Тому приймаючи до уваги, що кореляційні зв'язки в більшості випадків відображаються функціями лінійного типу або степеневими, які шляхом логарифмування або заміни змінних можна звести до лінійного вигляду, рівняння множинної регресії можна будувати у лінійній формі:
Параметри наведеного рівняння знаходять, розв'язавши систему нормальних рівнянь:
3.2.Аналіз регресії
Таблиця 4. Розрахунки до множинної лінійної кореляції:
№ п/п | У | Х1 | Х2 | Х1Х2 | Х12 | X22 | УХ1 | YX2 | У2 |
1 | 18 | 55 | 52 | 2860 | 3025 | 2704 | 990 | 936 | 324 |
2 | 16 | 50 | 60 | 3000 | 2500 | 3600 | 800 | 960 | 256 |
3 | 19 | 68 | 50 | 3400 | 4624 | 2500 | 1292 | 950 | 361 |
4 | 20 | 75 | 88 | 6600 | 5625 | 7744 | 1500 | 1760 | 400 |
5 | 17 | 60 | 47 | 2820 | 3600 | 2209 | 1020 | 799 | 289 |
6 | 27 | 74 | 66 | 4884 | 5476 | 4356 | 1998 | 1782 | 729 |
7 | 17 | 65 | 51 | 3315 | 4225 | 2601 | 1105 | 867 | 289 |
8 | 16 | 53 | 62 | 3286 | 2809 | 3844 | 848 | 992 | 256 |
9 | 18 | 58 | 74 | 4292 | 3364 | 5476 | 1044 | 1332 | 324 |
10 | 20 | 63 | 51 | 3213 | 3969 | 2601 | 1260 | 1020 | 400 |
11 | 19 | 58 | 59 | 3422 | 3364 | 3481 | 1102 | 1121 | 361 |
12 | 24 | 65 | 83 | 5395 | 4225 | 6889 | 1560 | 1992 | 576 |
13 | 20 | 68 | 69 | 4692 | 4624 | 4761 | 1360 | 1380 | 400 |
14 | 19 | 54 | 73 | 3942 | 2916 | 5329 | 1026 | 1387 | 361 |
15 | 21 | 78 | 68 | 5304 | 6084 | 4624 | 1638 | 1428 | 441 |
16 | 20 | 77 | 56 | 4312 | 5929 | 3136 | 1540 | 1120 | 400 |
17 | 27 | 80 | 79 | 6320 | 6400 | 6241 | 2160 | 2133 | 729 |
18 | 25 | 80 | 66 | 5280 | 6400 | 4356 | 2000 | 1650 | 625 |
19 | 22 | 79 | 78 | 6162 | 6241 | 6084 | 1738 | 1716 | 484 |
20 | 21 | 66 | 64 | 4224 | 4356 | 4096 | 1386 | 1344 | 441 |
сума | 406 | 1326 | 1296 | 86723 | 89756 | 86632 | 27367 | 26669 | 8446 |
При вивченні множинного кореляційного зв'язку результативної ознаки, наприклад, із двома факторними аналітичне рівняння регресії має вигляд: .
Параметри a0, a1 і a2 розраховують розв’язуючи систему нормальних рівнянь:
Складемо систему для нашого випадку:
20а0 +1326а1+1296а2=406
1326а0+89756а1+86713а2=
1296а0+86723а1+86632а2=
Розв’язавши дане рівняння методом Крамера отримаємо:
Ух1х2=1,54274 + 0, 21272х1+0,07181х2
З рівняння робимо висновок: збільшення мінеральних добрив на 1 кг/га обумовлює підвищення урожайності овесу в середньому на 0,212 ц/га незалежно від якості грунту; покращення якості грунту обумовлює підвищення урожайності овесу в середньому на 0,0781 ц/га незалежно від внесення мінеральних добрив.
Підставивши в рівняння значення х1 та х2, дістанемо відповідні значення змінної середньої. Це свідчить про правильний добір форми татематичногоо вираження кореляційного зв’язку між досліджуваними ознаками.
3.3. Оцінка тісноти зв’язку
Множинне кореляційне рівняння встановлює зв'язок між досліджуваними ознаками і дає змогу вирахувати очікувані значення результативної ознаки під дією включених в аналіз ознак - факторів, пов'язаних із даним рівнянням. У вузькому розумінні рішення кореляційних моделей охоплює операції по знаходженню числових значень параметрів досліджуваних залежностей.
Обчислимо параметри, які необхідні для визначення показників тісноти зв’язку :
Середнє значення урожайності:Yc==406/20=20,3
Середнє значення досліджуваної ознаки: Х1=66,3
Середнє значення досліджуваної ознаки :Х2=64,4
Середнє значення У2=422,3
Середнє значення Х21=4487,8
Середнє значення Х22=4331,6
Середнє значення ух1=1368,35
Середнє значення ух2=1333,45
Середнє значення х1х2=4336,15
Дисперсії:
у2=10,21
х12=92,11
х22=132,56
Середні квадратичні відхилення:
у=3,2
х1=9,6
х2=11,52
Визначимо парні коефіцієнти (тіснота ):
; ; .
rух1=0,76 ryx2=0,49
Визначимо частинні коефіцієнти:
;
= 0,75
Перша з наведених формул характеризує ступінь тісноти зв'язку результативної ознаки із факторною х1 при виключенні впливу фактора х2, друга - аналогічну залежність при виключенні впливу фактора х1.
Для оцінки ступеня впливу тісноти звя'зку між результативною і сукупністю кількох факторних ознак обчислюють коефіцієнт множинної (сукупної) кореляції.
Загальний математичний вираз коефіцієнта множинної кореляції має вигляд:
;
R=0,77.
Коефіцієнти детермінації:
Частинні:
d1=56,25%
d2=3,6%;
D=59,85%
Перевіримо правило мажорантності:
Тепер висновки про тісноту зв’язку:
Варіація урожайності овесу на 59,85% обумовлена впливом двох факторів.З них на 56,25% - впливом фактора мінеральних добрив і на 3,6% - якістю грунту.
Розрахуємо F-критерій Фішера за формулою:
F= - ;де к =3, n =20
F=:=12,37937.
F>Fтабл., отже R2 cуттєвий!Робимо висновок, що між х та у існує тісний зв'язок.
Щоб поглибити економічний аналіз, необхідно збільшити кількість суттєвих факторів, які треба ввести у модель досліджуваного показника і побудувати багатофакторні рівняння регресії, використовуючи сучасні методи і засоби обчислювальної техніки.