Корреляционный и регрессионный анализ влияния факторных признаков фотографического объектива

Автор: Пользователь скрыл имя, 08 Июня 2012 в 00:37, курсовая работа

Описание работы

В настоящее время все больше обычных пользователей фототехники, а конкретнее любителей, задумываются о том, чтобы превратить свое хобби в профессиональную деятельность, которая будет приносить им некоторый доход. Те, кто хоть раз связывался с фототехникой, хотя бы примерно представляют, сколько стоит это увлечение в денежном эквиваленте, и знают, что это очень дорого для тех, кому и без того не хватает денег на проживание. Есть еще такая шутка в народе: «Хочешь разорить друга – подари ему фотоаппарат». Ведь для того, чтобы заниматься фотографией необходим не только сам фотоаппарат, но и большое множество аксессуаров и дополнительных элементов к нему, которые стоят, скажем так, не очень уж и дешево. Тем более современные ведущие производители фототехники

Содержание

Содержание 1
Введение 2
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ УСТРОЙСТВА ОБЪЕКТИВА 2
1.1 Основные понятия и определения 2
1.2 Классификация объективов по фокусному расстоянию 2
1.3 Выбор факторных признаков 2
ГЛАВА 2. ПРАКТИЧЕСКАЯ ЧАСТЬ. КОРРЕЛЯЦИОНЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ 2
2.1 Подготовка данных для исследования 2
2.2 Корреляционный анализ показателей 2
2.3 Регрессионный анализ показателей 2
Заключение 2
Список использованной литературы и источников 2

Работа содержит 1 файл

Курсовая работа Сумкин.docx

— 605.36 Кб (Скачать)

 

Теперь  необходимо проверить значимость полученных коэффициентов корреляции, то есть гипотезу H0: ρ=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

                                        

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij   (таблица 5).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости  α=0,05  и числа степеней свободы ν=n-2. Для этого используем встроенную функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность  α=0,05 и число степеней свободы   ν=n-2=100-2=48.

Можно найти значения tкр  по таблицам математической статистики. Получаем   tкр= 1,983495205.

 

 

 

 

 

 

Таблица 5

Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых показателей

 

Y

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

Y

 

2,0620

0,3069

-0,2817

1,8938

4,2870

4,0221

4,4887

8,3447

3,2485

1,0209

X1

2,0620

 

4,6482

4,0547

15,6865

3,6222

0,7026

1,1701

10,5904

0,3065

1,5147

X2

0,3069

4,6482

 

8,9078

1,7844

-2,2333

3,0048

3,2924

2,7313

0,0385

0,1074

X3

-0,2817

4,0547

8,9078

 

0,6271

-1,2308

3,3576

3,4992

2,2786

-1,0413

0,5309

X4

1,8938

15,6865

1,7844

0,6271

 

2,9298

-1,7575

-1,4291

6,6312

0,6466

-0,1518

X5

4,2870

3,6222

-2,2333

-1,2308

2,9298

 

0,5531

0,6643

5,1370

0,0000

-0,3933

X6

4,0221

0,7026

3,0048

3,3576

-1,7575

0,5531

 

24,1075

5,1031

-1,6389

3,1495

X7

4,4887

1,1701

3,2924

3,4992

-1,4291

0,6643

24,1075

 

6,0503

-1,5458

3,1857

X8

8,3447

10,5904

2,7313

2,2786

6,6312

5,1370

5,1031

6,0503

 

0,0100

2,2047

X9

3,2485

0,3065

0,0385

-1,0413

0,6466

0,0000

-1,6389

-1,5458

0,0100

 

-1,0925

X10

1,0209

1,5147

0,1074

0,5309

-0,1518

-0,3933

3,1495

3,1857

2,2047

-1,0925

 

 

По  результатам, представленным в таблице 3, наблюдаемое значение   t-статистики больше критического tкр по модулю для парных коэффициентов корреляции

 

 

Следовательно, гипотеза о равенстве нулю этих коэффициентов  отвергается с вероятностью ошибки, равной 0,05,  то есть соответствующие  коэффициенты значимы.

Для остальных коэффициентов наблюдаемое  значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, и это значит, что все остальные коэффициенты незначимы.

 

 

 

 

 

 

 

Таблица 6

Матрица парных коэффициентов корреляции исследуемых  показателей с выделением значимых коэффициентов (при α=0,05)

 

Y

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

Y

 

0,2000

0,0304

-0,0279

0,1843

0,3907

0,3700

0,4061

0,6370

0,3062

0,1006

X1

0,2000

 

0,4181

0,3726

0,8408

0,3376

0,0694

0,1151

0,7237

0,0303

0,1483

X2

0,0304

0,4181

 

0,6615

0,1740

-0,2159

0,2852

0,3099

0,2611

0,0038

0,0106

X3

-0,0279

0,3726

0,6615

 

0,0620

-0,1210

0,3155

0,3274

0,2201

-0,1026

0,0525

X4

0,1843

0,8408

0,1740

0,0620

 

0,2786

-0,1714

-0,1401

0,5489

0,0639

-0,0150

X5

0,3907

0,3376

-0,2159

-0,1210

0,2786

 

0,0547

0,0656

0,4534

0,0000

-0,0389

X6

0,3700

0,0694

0,2852

0,3155

-0,1714

0,0547

 

0,9223

0,4510

-0,1602

0,2977

X7

0,4061

0,1151

0,3099

0,3274

-0,1401

0,0656

0,9223

 

0,5139

-0,1513

0,3008

X8

0,6370

0,7237

0,2611

0,2201

0,5489

0,4534

0,4510

0,5139

 

0,0010

0,2133

X9

0,3062

0,0303

0,0038

-0,1026

0,0639

0,0000

-0,1602

-0,1513

0,0010

 

-0,1075

X10

0,1006

0,1483

0,0106

0,0525

-0,0150

-0,0389

0,2977

0,3008

0,2133

-0,1075

 

 

Алгоритм  построения интервальной оценки для  генерального коэффициента корреляции следующий:

1). Zr По найденному выборочному коэффициенту корреляции r с     помощью Z-преобразования Фишера находят соответствующее значение Zr ,   являющееся гиперболическим арктангенсом r :

                                             

Для этого  в Excel есть встроенная функция ATANH, где в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r. Следует учитывать, что Z-функция – нечетная, т.е.    Z(-r)= - Z(r). Можно найти значение Zr и по таблице Z-преобразования Фишера .

2). ΔZ Найдём значение tγ, соответствующее заданной надёжности γ=0,95. - значение функции Лапласа.

Для нахождения значения tγ можно использовать встроенную функцию Excel НОРМСТОБР. Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F(t):  

.

Поэтому при  расчёте всех интервальных оценок нужно  пересчитывать γ=0,95 в , а по этому значению уже вычислять t.

В нашем случае для надёжности γ=0,95:   F(t)=0,975;    tγ =1,959964.

Находим   

3). Zmin и Zmax   Теперь можно найти Zmin и Zmax:

Zmin = Zr  – ΔZ;      Zmax= Zr  + ΔZ

4). ρmin и ρmax   Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции   ρmin и ρmax   , соответствующие Zmin и Zmax.

Соответствующие значения ρmin и ρmax являются гиперболическими тангенсами Zmin и Zmax :        

.

 Для их  нахождения в Excel используем встроенную функцию TANH, введя в качестве аргумента значения соответствующих Zmin и Zmax. Можно найти значения ρmin и ρmax и по таблице Z-преобразования Фишера.

Построим  с надёжностью  γ=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами.  Расчёты представим в виде таблицы.

Таблица 7

Расчёт  доверительных интервалов для парных генеральных коэффициентов с  надёжностью γ=0,95

 

r

Zr

∆Z

Zmin

Zmax

ρmin

ρmax

YX1

0,2000

0,20278

0,19502

0,00776

0,39780

0,00776

0,37807

YX5

0,3907

0,41267

0,41267

0,60769

0,39073

0,54250

YX6

0,3700

0,38841

0,38841

0,58343

0,36999

0,52516

YX7

0,4061

0,43098

0,43098

0,62601

0,40614

0,55530

YX8

0,6370

0,75304

0,75304

0,94806

0,63696

0,73890

YX9

0,3062

0,31634

0,31634

0,51137

0,30620

0,47101


 

Таким образом, доверительные интервалы с надёжностью γ=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:    

P(0,00776≤ ρYX1 ≤0,37807)=0,95 (разница 0,3703)

P(0,39073≤ ρYX5 ≤0,54250)=0,95 (разница 0,1518)

P(0,36999≤ ρYX6 ≤0,52516)=0,95 (разница 0,1552)

P(0,40614≤ ρYX7 ≤0,55530)=0,95 (разница 0,1492)

P(0,63696≤ ρYX8 ≤0,73890)=0,95 (разница 0,1019)

P(0,30620≤ ρYX9 ≤0,47101)=0,95 (разница 0,1648)

По полученным данным можно сделать следующие  выводы:

Между исследуемыми показателями выявлены значимые корреляционные зависимости.

1) Значимая  корреляционная прямая  взаимосвязь  обнаружена между изучаемым признаком Y – ценой объектива и X1 – фокусным расстоянием.

2) Более умеренная прямая связь существует между изучаемым признаком Y – ценой объектива и X5 – числом лепестков диафрагмы, X6 – числом групп элементов, X7 -  числом элементов, X9 – значимостью бреда (репутацией).

3) Менее значимая прямая связь существует между изучаемым признаком Y – ценой объектива и X8 – весом.

2.3 Регрессионный анализ показателей

После того как с помощью корреляционного  анализа выявлено наличие статистически  значимых связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,... Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее  часто используется множественная  линейная модель регрессионного анализа,  уравнение которой имеет вид:

                          

для всех i=1,2,…n, или в матричной форме:

                                                ,                 

где

   

         
       

 

Исследуем на основе линейной регрессионной модели зависимость цены объектива Y от:

X1 – фокусное расстояние;

X2 – максимальная диафрагма;

X3 -  минимальная диафрагма;

X4 – минимальное расстояние фокусировки;

X5 – число лепестков диафрагмы;

X6 – число групп элементов;

X7 -  число элементов;

X8 – вес;

X9 – значимость бреда (репутация);

X10 – автофокус (цена технологии).

 

Проверка  исходных данных на мультиколлинеарность.

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования  достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,... Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных  количественных критериев для определения  наличия или отсутствия мультиколлинеарности не существует. Однако на практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8 , т.е.  | rij | > 0,8 , то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или X(как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной  модели, необходимо проверить объясняющие  переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу  парных коэффициентов корреляции между  факторными признаками Xi.

Таблица 8

Матрица парных коэффициентов корреляции факторных  признаков

 

Y

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

Y

 

0,2000

0,0304

-0,0279

0,1843

0,3907

0,3700

0,4061

0,6370

0,3062

0,1006

X1

0,2000

 

0,4181

0,3726

0,8408

0,3376

0,0694

0,1151

0,7237

0,0303

0,1483

X2

0,0304

0,4181

 

0,6615

0,1740

-0,2159

0,2852

0,3099

0,2611

0,0038

0,0106

X3

-0,0279

0,3726

0,6615

 

0,0620

-0,1210

0,3155

0,3274

0,2201

-0,1026

0,0525

X4

0,1843

0,8408

0,1740

0,0620

 

0,2786

-0,1714

-0,1401

0,5489

0,0639

-0,0150

X5

0,3907

0,3376

-0,2159

-0,1210

0,2786

 

0,0547

0,0656

0,4534

0,0000

-0,0389

X6

0,3700

0,0694

0,2852

0,3155

-0,1714

0,0547

 

0,9223

0,4510

-0,1602

0,2977

X7

0,4061

0,1151

0,3099

0,3274

-0,1401

0,0656

0,9223

 

0,5139

-0,1513

0,3008

X8

0,6370

0,7237

0,2611

0,2201

0,5489

0,4534

0,4510

0,5139

 

0,0010

0,2133

X9

0,3062

0,0303

0,0038

-0,1026

0,0639

0,0000

-0,1602

-0,1513

0,0010

 

-0,1075

X10

0,1006

0,1483

0,0106

0,0525

-0,0150

-0,0389

0,2977

0,3008

0,2133

-0,1075

 

Информация о работе Корреляционный и регрессионный анализ влияния факторных признаков фотографического объектива