Статистичний аналіз даних за допомогою середовища MS Exsel. Варіант №12

Автор: Пользователь скрыл имя, 18 Марта 2013 в 22:37, курсовая работа

Описание работы

Однією з основних задач математичної статистики є проведення економічного аналізу з метою вивчення результатів діяльності підприємств і господарських організацій з визначенням впливу факторів на показники їх роботи для виявлення в подальшому недоліків і резервів. При цьому припускається розробка заходів, спрямованих на відновлення і збільшення обсягів виробництва та обсягів реалізації, підвищення ефективності їх діяльності.

Содержание

Вступ………………………………………………………………………………4
1. Теоретичні відомості…………………………………………………………...7
1.1 Контроль вхідної інформації на наявність грубих помилок і викидів …………………………..……………..…………………….7
1.2 Перевірка відповідності досліджуваних ознак нормальному закону розподілу та статистична обробка багатовимірної вибірки…………9
1.3 Методи прогнозування……………………………………………….9
1.3.1 Прогнозування з використанням «Ковзкого середнього»…9
1.3.2 «Експоненціальне згладжування»…………………..……10
1.4 Основи кореляційного аналізу……………………………………….11
1.5 Кореляційний аналіз статичних даних………………...…………….12
1.6 Регресійний аналіз статичних даних………………………………14
1.6.1 Парний лінійний регресійний аналіз…………………..15
1.6.2 Критерій оцінки якості моделі регресії…………………17
1.6.3 Парний нелінійний регресивний аналіз……………….19
1.6.4 Багатовимірний регресійний аналіз…………………..20
3 Завдання до виконання курсової роботи………………………………….…
4 Практична частина……………………………………………………………
Висновки…………………………………………………………….…….…..…29
Перелік посилань……………………………………………………….….….....30

Работа содержит 1 файл

курсач.docx

— 292.41 Кб (Скачать)

 

Міністерство освіти і  науки, молоді та спорту України


Дніпродзержинський  державний технічний університет

Кафедра «Прикладна математика»

 

 

 

КУРСОВА РОБОТА

«Статистичний аналіз даних за допомогою  середовища MS Exsel. Варіант №12»

 

 

 

 

Виконав                                     _______                          \

 

 

 

Перевірив                                  _______                        

              

 

 

 

Дніпродзержинськ

2012

Реферат

 

Курсова робота містить:

Мета  роботи:

      1. Повести кореляційний аналіз підприємств

 

 

 

Метод дослідження: середовища MS Exsel.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зміст

 

 Вступ………………………………………………………………………………4

1. Теоретичні відомості…………………………………………………………...7

1.1 Контроль вхідної інформації на наявність грубих помилок і                викидів …………………………..……………..…………………….7

          1.2 Перевірка відповідності досліджуваних ознак нормальному закону    розподілу та статистична обробка багатовимірної вибірки…………9

          1.3 Методи прогнозування……………………………………………….9

                      1.3.1 Прогнозування з використанням «Ковзкого середнього»…9

                       1.3.2 «Експоненціальне згладжування»…………………..……10

         1.4 Основи кореляційного аналізу……………………………………….11

          1.5 Кореляційний аналіз статичних даних………………...…………….12

         1.6 Регресійний аналіз статичних даних………………………………14

1.6.1 Парний лінійний регресійний аналіз…………………..15

1.6.2 Критерій оцінки якості моделі регресії…………………17

1.6.3 Парний нелінійний регресивний аналіз……………….19

1.6.4 Багатовимірний регресійний аналіз…………………..20

3 Завдання до виконання курсової роботи………………………………….…

4 Практична частина……………………………………………………………

Висновки…………………………………………………………….…….…..…29

Перелік посилань……………………………………………………….….….....30

 

 

 

 

Вступ

     Однією з  основних задач математичної  статистики є проведення економічного  аналізу з метою вивчення результатів  діяльності підприємств і господарських  організацій з визначенням впливу  факторів на показники їх роботи  для виявлення в подальшому  недоліків і резервів. При цьому  припускається розробка заходів,  спрямованих на відновлення і  збільшення обсягів виробництва  та обсягів реалізації, підвищення  ефективності їх діяльності.

     Під час  статичних спостережень для кожного  об’єкту часто можна вимірювати (одержувати) значення декількох  ознак,тоді в підсумку виходить  багатовимірна вибірка. Для вивчення  взаємозв’язку,ознаки поділяються  на два класи :факторні і  результативні. Факторна ознака викликає зміни інших, пов’язаних з ними ознак. Результативна ознака змінюється під дією факторних ознак. Зміст обробки багатовимірних вибірок полягає у встановленні зв’язку між ознаками. Зв'язок може бути функціональним,при якому певному значенню факторної ознаки відповідає одне и тільки одне значення результативної ознаки. Якщо залежність проявляється не в кожному випадку, а в середньому при великій кількості спостережень, то вона називається статичною(стохастичною). Окремим випадком статичного зв’язку є кореляційний зв'язок,при якому досліджується залежність середнього значення результативної ознаки від факторних ознак.

     В даній  курсовій роботі використовується  методика проведення кореляційно-регресивного  аналізу на основі прогнозування з використанням «ковзкого середнього», прогнозування шляхом «експоненціального середнього» тощо із застосуванням реалізації цих методів в середовищі електронних таблиць Excel.

 

 

 

 

 

 

 

1 ТЕОРЕТИЧНІ ВІДОМОСТІ

1.1 Контроль  вхідної інформації на наявність грубих помилок і викидів

     Методика, що включає логічну перевірку даних, тобто виключення «нелогічних» даних и арифметичну погодженість. Враховуючи, що рівняння регресії звичайно використовують для прогнозу, то для їх одержання необхідно мати достовірну інформацію. Із цією метою необхідно виконати аналіз вихідних даних і виключити з багатовимірної вибірки рядки,що містять сумнівну інформацію, або провести додаткове уточнення інформації. Можливо, що фахівці різних підприємств використовують при цьому різні формули для розрахунку показників виробничо-господарської діяльності, наприклад, індексу зниження собівартості продукції (діапазон значень цього показника від 13.6 до 598.1) або допускають арифметичні помилки в розрахунках. Крім того,можуть бути просто описки,тобто грубі помилки. Тому після введення інформації в пам'ять комп’ютера необхідно порядково переглянути багатовимірну вибірку й видалити рядки з грубими помилками й викидами (викид – занадто велике й занадто мале значення ознаки).

     Процедуру  перевірки екстремальних значень  на наявність їхнього виключення  з вибірки  як викидів можна  здійснити наступним чином :

  • Переглянути багатовимірну вибірку й скопіювати ознаки з екстремальним значенням і вільний стовпець поруч з вибіркою.
  • Значення скопійованої ознаки вибірки впорядкувати в порядку зростання або убування.
  • Екстремальне значення позначити – х1.
  • Для вибірки малого об’єму по формулі визначити розрахункове значення критерію М-Мрозр і зрівняти його з критичним значенням М.
  • Для вибірки , що містить більше 25 елементів необхідно використовувати S критерій.

Таблиця 1- Критичні значення М критерію.

Об’єм вибірки

Рівень значимості

Мрозр

α=0,1

α=0,05

α=0,01

3

0,886

0,941

0,988

 

4

0,679

0,765

0,889

5

0,557

0,642

0,780

6

0,482

0,560

0,698

7

0,434

0,507

0,637

8

0,479

0,554

0,683

 

9

0,441

0,523

0,635

10

0,409

0,477

0,597

11

0,517

0,576

0,679

 

12

0,490

0,546

0,612

13

0,467

0,512

0,615

14

0,492

0,546

0,641

 

15

0,472

0,525

0,616

16

0,454

0,507

0,595

17

0,438

0,490

0,577

 

18

0,424

0,475

0,561

19

0,412

0,462

0,547

20

0,401

0,450

0,535

21

0,391

0,440

0,524

22

0,382

0,430

0,514

23

0,374

0,421

0,505

24

0,367

0,413

0,497

25

0,360

0,406

0,489


 

     Якщо Мрозр<М, то екстремальне значення х1 з ймовірністю 1-α не є викидом, тобто його не можна виключати з вибірки. Якщо Мрозр>М, то виключається з багатовимірної вибірки рядок з екстремальним значенням ознаки.     

     При об’ємі вибірки n>25 екстремальні значення можуть бути перевірені за критерієм S: ,де - вибіркове середнє й σ*- стандартне відхилення, що визначені для всієї вибірки,х1-пербачуваний викид. Критичне значення критерію S визначається по таблиці 2.

     Якщо Sрозр<S то екстремальне значення х1 не є викидом. При Sрозр>S з багатовимірної вибірки виключається рядок з екстремальним значенням.

Таблиця  2. Критерій значення критерію S

Об’єм вибірки

Рівень значимості

α=0,05

α=0,01

30

2,929

3,402

50

3,082

3,539

100

3,283

3,718

1000

3,884

4,264


 

 

 

 

1.2 Перевірка відповідності досліджуваних ознак нормальному закону розподілу та статистична обробка багатовимірної вибірки.

     Всі основні  положення теорії кореляції й  регресії розроблені з урахуванням  припущення про нормальний закон  розподілу досліджуваних ознак.  Якщо яка-небудь ознака не підкоряється  нормальному закону розподілу,  то вона не включається в  математичну модель.

     Основою для висунення гіпотези про те, що випадкова величина підкоряється нормальному закону розподілу, можна одержати по гістограмі й числових характеристиках:

  1. близькі за значенням оцінки вибіркового середнього, моди й медіани.
  2. оцінки асиметричності й ексцесу незначно відрізняються від нуля.

     Після того, як будуть видалені рядки із  грубими помилками й викидами  потрібно виконати аналіз досліджуваних  ознак на підпорядкування їхньому  нормальному закону розподілу.

 

1.3 Методи прогнозування

     Розглянемо дві методики прогнозування «ковзке середнє» ,та прогнозування шляхом «експоненціального згладжування» з їх реалізацією в середовищі електронних таблиць Excel.

1.3.1 Прогнозування з використанням «Ковзкого середнього»

     При використанні  цієї методики основне припущення  полягає в тому, що часовий  ряд є стійким у тому розумінні,  що його члени у1 є реалізаціями наступного випадкового процесу:

 

де b-невідомий постійний параметр, що оцінюється  на основі представленої інформації, εt – випадковий компонент(або шум) у момент часу t. Передбачається , що випадкова помилка εt має нульове математичне очікування й постійну дисперсію. Крім того,передбачається, що дані для різних періодів часу не корельовані.

     Метод використання  «ковзкого середнього» припускає,  що останні n  спостережень є рівнозначно важливими для оцінки параметра b. Інакше кажучи, якщо в даний момент часу t останніми n спостереженнями є , тоді оцінюване значення для моменту t+1 обчислюється за формулою

 

     Не існує чіткого правилу для вибору числа n – бази методу, що використовує «ковзке середнє». Якщо є вагомі підстави вважати,що спостереження протягом досить тривалого часу задовольняють моделі , то рекомендується вибирати більші значення n. Якщо ж спостережувані значення задовольняють наведеній моделі протягом коротких періодів часу, то може бути прийнято і мале значення  n . На практиці величина n звичайно приймається в межах від 2 до 10.

1.3.2 «Експоненціальне згладжування»

     Прогнозування  шляхом експоненціального згладжування  припускає, що ймовірний процес  визначається моделлю  , це припущення використовується й при розгляді методу «ковзкого середнього». Метод «експоненціального згладжування» розробленій для того, щоб уникнути недолік методу «ковзкого середнього», який полягає у тому,що всі дані, що використовуються при обчисленні середнього,мають однакову вагу. Зокрема, метод «експоненціального згладжування» приписує більший ваговий коефіцієнт самому останньому спостереженню.

     Визначимо  величину α(0<α<1) як константу згладжування, і припустимо, що відомі значення тимчасового ряду минулих t моментів часу .Тоді оцінка для моменту часу t+1 обчислюється за формулою

Коефіцієнти при  поступово зменшуються, тим самим ця процедура приписує більшу вагу останнім (за часом) даним.

     Формулу обчислення  можна привести до наступного(більш простого) виду:

 

     Таким чином,  значення  можна обчислити рекурентно на підставі значення .  Обчислення по цих рекурентних рівняннях починаючи з того , що припускається оцінка для t=1 і як оцінка для t=2 приймається спостережена величина для t=1,тобто . Насправді, для початку розрахунку можна використати будь-яку процедуру. Наприклад, часто за оцінку береться усереднене значення yt по прийнятому числу періодів на початку тимчасового ряду.

Информация о работе Статистичний аналіз даних за допомогою середовища MS Exsel. Варіант №12