Автор: Пользователь скрыл имя, 20 Января 2011 в 22:17, курсовая работа
Целью курсовой работы является изучение корреляционно-регрессионного анализа взаимосвязи рыночных процессов (на примере рынка жилья).
Для достижения указанной цели ставятся следующие задачи:
1. Изучить теоретические аспекты корреляционно-регрессионного анализа;
2. Провести решение статистических задач;
3. Проанализировать жилищное строительство в РФ.
Введение 3
1. Теоретическая часть. Корреляционно-регрессионный анализ 4
2. Практическая часть. Решение статистических задач 16
3. Аналитическая часть. Анализ жилищного строительства в РФ 26
Заключение 38
Список литературы 40
Оглавление
Введение
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики, это и определяет актуальность темы курсовой работы.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Признаки Х и Y находятся в корреляционной зависимости, если каждому значению одного признака xi соответствует определенная условная средняя другого признака.
Парная корреляционная зависимость будет линейной, если она приближенно выражается линейной функцией. Вид зависимости можно определить графически. С этой целью строятся точки с координатами (xi , ). По расположению построенных точек подбирается линия. Если это будет прямая, то связь линейная.
Целью
корреляционного анализа
Целью курсовой работы является изучение корреляционно-регрессионного анализа взаимосвязи рыночных процессов (на примере рынка жилья).
Для достижения указанной цели ставятся следующие задачи:
1. Теоретическая часть. Корреляционно-регрессионный анализ
Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.
Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от направленности) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая. Но для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.[2, c.131]
По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.
Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.
Указанные
выше классификационные признаки наиболее
часто встречаются в
По силе различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.
Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.[4, c.112]
Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.
Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.
Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.
Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров.
Например, измеряем рост и вес человека, каждое измерение представлено точкой в двумерном пространстве:
Несмотря на то, что величины носят случайный характер, в общем наблюдается некоторая зависимость - величины коррелируют.
В данном случае это положительная корреляция (при увеличении одного параметра второй тоже увеличивается). Возможны также такие случаи:
Отрицательная
корреляция:
|
Отсутствие
корреляции:
|
Взаимосвязь между переменными необходимо охарактеризовать численно, чтобы, например, различать такие случаи:
Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом:
Есть массив из n точек {x1,i, x2,i}
Рассчитываются средние значения для каждого параметра:
И коэффициент корреляции:
r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.[5, c.119]
Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы:
1. Коэффициент корреляции значимо отличается от нуля (т.е. есть взаимосвязь между величинами):
Тестовая статистика вычисляется по формуле:
и сравнивается с табличным значением коэффициента Стьюдента t(p = 0.95, f = ) = 1.96
Если тестовая статистика больше табличного значения, то коэффициент значимо отличается от нуля. По формуле видно, что чем больше измерений n, тем лучше (больше тестовая статистика, вероятнее, что коэффициент значимо отличается от нуля)[3, c.89]
2. Отличие между двумя коэффициентами корреляции значимо:
Тестовая статистика:
Также сравнивается с табличным значением t(p, )
Методами корреляционного анализа решаются следующие задачи:
1)
Взаимосвязь. Есть ли
2)
Прогнозирование. Если
3) Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации.
Наличие
для каждого региона данных о
социально-демографической
Рассчитанные для каждой группы значения умножаются на их долю в населении каждого региона. В результате получаются численные оценки, которые можно сравнивать с реальными значениями преступности, неестественной смертности или голосования "против всех" в каждом регионе. Далее осуществляется такое уточнение показателей для каждой группы, при котором дисперсия (сумма квадратичных отклонений для всех регионов) между модельными и реальными значениями исследуемого показателя минимальна. Эти значения рассматриваются как статистически наиболее вероятные для каждого социально-демографического слоя в населении страны. Таким образом показатели, ранее измеренные только в разрезе отдельных регионов ("средняя температура по больнице") переводятся в показатели для отдельных социально-демографических групп. Этот метод позволяет снять покров социальной анонимности с результатов голосования, статистики смертности, преступности, миграционной подвижности и других проявлений деятельной активности или социального конформизма людей. Корреляционный анализ позволил дополнительно проконтролировать полученный результат. Если модель распределения по социальному профилю действия или события обнаруживает статистически значимую связь с результатами опроса, относящимися к тому же содержательному кругу явлений, то она скорее всего характеризует реальный социальный факт, если нет - то высока вероятность артефакта, статистической игры цифр. В ходе подобного анализа была установлена отчетливая закономерность повышения вероятности неестественных причин смерти в тех регионах, где в структуре жилого фонда преобладают многоквартирные дома, не оборудованные коммунальными удобствами. Этот тип жилья, который правильнее называть бараками, наиболее характерен для территорий недавнего промышленного освоения, куда стекались деятели со всей страны, пополняя контингент "покорителей Сибири", "освоителей подземных кладовых", "строителей БАМа" и т.п.