Автор: Пользователь скрыл имя, 06 Мая 2012 в 18:20, курсовая работа
Прогресс человеческого общества неотделим от истории развития транспорта. Расселение людей на более обширных территориях, строительство городов, рост обмена и торговли — все это привело к дальнейшему быстрому развитию транспорта.
Современный транспорт представляет собой единую, в социально-экономическом отношении, транспортную систему. Перемещая ежегодно многие миллиарды пассажиров с достаточно высоким уровнем комфорта и скорости, современный транспорт обеспечивает массовое индустриальное производство, глубокое разделение труда, внутреннюю и внешнюю торговлю, способствует развитию культуры и науки.
Введение…………………………………………………………………….стр.3
Глава 1: Теоретические аспекты исследования стоимости железнодорожных перевозок.
1.1 Железнодорожный транспорт и факторы, влияющие на стоимость железнодорожных перевозок……………………………………………...стр.5
1.2 Характеристика методов исследования………………………………стр.11
Глава 2: Проведение корреляционно-регрессионного анализа влияния различных факторов на стоимость железнодорожных перевозок.
2.1 Визуализация данных………………………………………………….стр.17
2.2 Корреляционный анализ……………………………………………....стр.21
2.3 Регрессионный анализ………………………………………………...стр.24
Заключение………………………………………………………………..стр.29
Список литературы……………………………………………………….стр31.
У - стоимость проезда до Москвы на железнодорожном транспорте.
Х1 - цены на авиа топливо.
Х2 - расстояние до Москвы.
Х3 – численность постоянного населения.
Х4 - стоимость проезда до Москвы на авиатранспорте.
Х5 – среднемесячная номинальная заработная плата.
1.2 Характеристика методов исследования.
Эконометрика - сравнительно молодая, но быстро развивающаяся научная дисциплина. Это наука, в которой на базе реальных статистических данных строятся, анализируются и совершенствуются математические модели реальных экономических явлений.
К основным задачам эконометрике можно отнести следующие:
Построение эконометрических моделей, то есть представление экономических моделей в математической форме, удобной для проведения эмпирического анализа. Данную проблему принято называть проблемой спецификации. Зачастую она может быть решена несколькими способами.
Оценка параметров построенной модели, делающих выбранную модель наиболее адекватной реальным данным. Это так называемый этап параметризации.
Проверка качества найденных параметров модели и самой модели в целом. Иногда этот этап анализа называют этапом верификации.
Использование построенных моделей для объяснения поведения исследуемых экономических показателей, прогнозирования и предсказания, а также для осмысленного проведения экономической политики.
Различают два типа связей между различными явлениями и их признаками: функциональную и статистическую. Функциональная связь величин возможна лишь при условии, что одна из них зависит только от другой и ни от чего более. В реальном обществе таких связей не существует. Поэтому в экономике говорят не о функциональных, а о корреляционных, либо статистических зависимостях. Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой. Такую статистическую зависимость называют корреляционной.
Корреляционно-регрессионный анализ проводится на третьем этапе экономического моделирования, с целью установления наличия, тесноты взаимосвязи случайных величин, проведения оценки неизвестных параметров, проверки модели на адекватность. Корреляционный анализ выборочных данных позволяет обнаружить и измерить тесноту статистической связи между переменными, когда переменные рассматривают как случайные величины. Для анализа корреляции случайных величин на основе выборки применяют следующие приемы:
1. построение корреляционного поля;
2. определение выборочных коэффициентов корреляции;
3. проверку статистических гипотез о значимости корреляционной связи.
Но для того чтобы эффективно использовать результаты корреляционного анализа, необходимо следить за выполнением определенных требований в отношении отбора данных.
Во-первых, корреляционный анализ применяется в том случае, когда данные наблюдений или экспериментов можно считать случайными величинами, и они выбраны из совокупности, которая имеет нормальное распределение. Это условие связано с применением метода наименьших квадратов (МНК) при расчете параметров корреляции: только при нормальном распределении МНК дает оценку параметров, отвечающих принципам максимального правдоподобия. На практике эта предпосылка чаще всего выполняется приближенно.
Во-вторых, данные, которые подвергаются изучению методами корреляционного анализа, должны быть однородными. Количественная оценка этого требования состоит в расчете коэффициента вариации: 100%. Совокупность считается однородной, если V не превышает 50% для распределений близких к нормальному, т.е. чем меньше V, тем более типична средняя для совокупности.
Другое важное требование - достаточное число наблюдений. Какое именно число наблюдений достаточно для анализа связи - зависит от цели, требуемой точности и надежности параметров связи, от числа факторов, корреляции с которыми изучается. Обычно считают, что число наблюдений должно быть не менее чем в 5-6, а лучше в 10 раз больше числа факторов, тогда закон больших чисел действует в полную силу.
Существует и требование и в отношении факторов, вводимых в исследование. Понятно, что все множество факторов не может быть включено в рассмотрение и в этом нет необходимости, т.к. их роль и значение в формировании результативного показателя могут иметь существенные различия. Поэтому при ограничении числа факторов целесообразно использовать количественные оценки, позволяющие конкретно охарактеризовать влияние их на результативный признак. Это могут быть выборочные парные коэффициенты корреляции, которые служат мерой линейной статистической связи между двумя случайными величинами.
Этот коэффициент обладает рядом определенных свойств:
• не имеет размерности;
• изменяется от -1 до 1, соответственно близость абсолютной величины г к 1 свидетельствует о приближении к функциональной связи, близость к 0 - об отсутствии линейной зависимости (хотя допускается существование нелинейной);
• является симметричным, т.е. rxy = ryx
• определяет направление связи, при r>0 связь прямая, при r<0 - обратная.
Однако сама по себе величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменении признаков. Возникает необходимость оценки значимости коэффициента, т.е. проверки предположения, существенно ли он отличается от нуля, или это случайное отклонение, связанное с выборкой. Если - коэффициент корреляции в генеральной совокупности, то гипотеза Н0: =0, и альтернативная ей Н1: .Зная среднюю ошибку коэффициента регрессии и корреляции, можно вычислить вероятность того, что нулевое значение коэффициента входит в интервал возможных с учетом ошибки значений. В качестве критерия применяют статистику, которая для выборки из нормально генеральной совокупности будет иметь t-распределение. Рассчитывают t-статистику Стьюдента:
,
которую сравнивают с табличным значением , где - уровень значимости, =n-2 –число степеней свободы. Если tрасч>tтабл, то принимаем гипотезу о наличии и существенности связи. В противном случае принимаем гипотезу об отсутствии связи. В случае, когда корреляция между фактором и откликом незначима, показатель X не включают в уравнение регрессии.
После корреляционного анализа следует проводить регрессионный. Под регрессией понимается функциональная зависимость между объясняющими переменными и условным математическим ожиданием зависимой переменной, которая строится с целью прогнозирования этого среднего значения при фиксированных значениях последних. Поскольку реальные значения зависимой переменной не всегда совпадают с ее условным математическим ожиданием и могут быть различными при одном и том же значении объясняющей переменной, фактическая зависимость должна быть дополнена некоторым слагаемым ε, которая указывает на стохастическую суть зависимости. Из этого следует, что связи между зависимой и объясняющей(ими) переменными выражаются соотношениями
Y = M (Y/x) + ε
Y = M (Y/x1, x2, …, xm) + ε
называемыми регрессионными моделями.
В экономике регрессионный анализ имеет достаточно широкое применение. К задачам анализа:
установление формы зависимости;
оценка модельной функции или уравнения регрессии;
прогноз неизвестных значений зависимой переменной по модельному уравнению регрессии.
Рассмотрим парную линейную регрессию. Модель в этом случае имеет вид
y = α0 + α1х+ ε,
где α0 и α1 – неизвестные параметры регрессии; (α0 + α1) образуют детерминированную составляющую модели.
На основе имеющихся наблюдений необходимо подобрать наилучшие по определенному критерию оценки а0 и а1 неизвестных параметров α0 и α1. уравнение регрессии с оценками параметров
ŷ = а0 + а1х,
ŷ – выровненная или расчетная величина у.
Оценки а0 и а1 неизвестных параметров α0 и α1 определяются из условия минимизации суммы квадратов отклонений наблюдаемых значений уi от расчетных ŷ. Данный метод называется методом наименьших квадратов.
Рассмотрение метода наименьших квадратов позволяет сделать ряд выводов:
1. Оценки МНК являются функциями от выборки;
2. Оценки МНК являются точечными оценками теоретических коэффициентов регрессии;
3. Эмпирическое уравнение регрессии построено таким образом, что сумма отклонений εi , а также среднее значение отклонения ε равны нулю;
4. Случайные отклонения εi не коррелированны с наблюдаемыми значениями уi зависимой переменной Y;
5. Случайные отклонения εi не коррелированны с наблюдаемыми значениями xi зависимой переменной Х.
Уравнение регрессии служит незаменимым и очень качественным инструментом анализа и прогнозирования.
Глава 2:Проведение корреляционно- регрессионного анализа влияния факторов на ж/д. перевозки.
2.1. Визуализация данных
2.1.1 Проверка выборки на однородность
Если выборка неоднородна, то результат исследования может оказаться неадекватным. Во избежание этого необходимо проверить результирующий фактор, стоимость проезда на железнодорожном транспорте, на однородность, построив диаграмму рассеивания.
График 1.Диаграмма рассеивания
Так как вариация (Y) идет не совсем однородно около линии среднего уровня, можно сделать предположение, что наша выборка не совсем однородна. Для того чтобы сделать выборку более однородной, уберем из нее значения под номерами 2(7622,7), 3(13267,6), 6(6902,1) и 18(8649,49) и получим новую диаграмму рассеивания:
График 2.Диаграмма рассеивания
Из графика можно сделать предположение, что наша выборка однородна, так как вариация (Y) идет однородно около линии среднего уровня. Это значит, что стоимость билетов распределена однородно в районе 3214,48 рублей.
2.1.2. Проверка выборки на близость к нормальному закону распределения.
Статистики | |
---|---|
Асимметрия | ,620 |
Стд. ошибка асимметрии | ,564 |
Эксцесс | ,046 |
Стд. ошибка эксцесса | 1,091 |
Одним из условий проведения корреляционно-регрессионного анализа является случайный характер взятых показателей, а также близость их распределения к нормальному. Для проверки выполнения данного условия найдем коэффициенты эксцесса и асимметрии и построим гистограмму. На основании гистограммы обычно выдвигают предположение о виде закона распределения исследуемой величины, что позволяет придать определенную направленность исследованию.