Статистика данных

Автор: Пользователь скрыл имя, 21 Декабря 2010 в 16:08, курсовая работа

Описание работы

Целью данной работы является рассмотрение методов статистического анализа. Для достижения поставленной цели нам необходимо поставить следующие задачи: анализ данных с помощью:

- динамики изменения показателей,

- аналитической группировки,

- показателей вариации,

- оценка взаимосвязи.

Содержание

Введение..................................................................................................................2

1. Теоретические основы в области обработки статистических данных..........4

1.1 Показатели анализа ряда динамики................................................................4

1.2 Показатели вариации.......................................................................................9

1.3 Статистическое моделирование связи методом корреляционного и регрессионного анализа........................................................................................12

2.Расчетная часть...................................................................................................16

Заключение.............................................................................................................30

Список литературы................................................................................................32

Работа содержит 1 файл

курсач-стат.doc

— 475.00 Кб (Скачать)

     Для обобщающей характеристики динамики исследуемого явления определяют средние показатели. Они характеризуют общую тенденцию  явления или процесса на протяжении длительного временного интервала.  Исчисляются с целью выявления закономерностей развития социально-экономических явлений. К средним показателям относятся:

средний уровень ряда;

средний абсолютный прирост;

средний темп роста;

средний темп прироста.

    Рассмотрим каждый средний показатель в отдельности:

Средний уровень ряда. Характеризует обобщенную величину абсолютных уровней. Он рассчитывается по средней хронологической, т.е. по средней исчисленной из значений, изменяющихся во времени.

Интервальный ряд Моментный ряд
равностоящий  ряд

             

равностоящий  ряд

       

ряд не равностоящий

            

ряд не равностоящий

Где – уровень ряда динамики;

       – число уровней;

       – длительность интервалов времени между уровнями.

 

        Средний абсолютный прирост. Это обобщающий показатель скорости изменения уровней во времени, представляющий собой обобщенную характеристику индивидуальный абсолютных приростов ряда динамики. Он определяется по формуле: , где ук – конечный уровень ряда динамики; ун– начальный уровень ряда динамики.

        Средний темп роста. Это сводная обобщающая характеристика, показывающая, во сколько раз в среднем за единицу времени изменяется уровень ряда динамики. Средний темп роста вычисляется по следующим формулам: - цепной показатель; - базисный.

        Средний темп прироста. Определяется по единственной методологии:

. 

1.2 Показатели вариации

  Вариация  — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

  Например, работники фирмы различаются  по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.

  Вариация  возникает в результате того, что  индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

   Исследование  вариации в статистике имеет большое  значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дают важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.

  Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не покапывает, как располагаются около нее варианты усредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. в одном случае вариация признака мала, а в другом — велика, что имеет весьма важное значение для характеристики надежности средней величины.

  Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют  ряд обобщающих показателей.

     К показателям вариации относятся:  размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.

    Самым элементарным показателем вариации признака является размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака:

  R= Xmax-Xmin

  Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных).

  Среднее квадратическое отклонение равно корню квадратному из дисперсии. Среднее квадратическое отклонение — это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

   При вычислении средних величин и  дисперсии для интервальных рядов распределения истинные значения признака заменяются центральными (серединными) значениями интервалов, которые отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В.Ф.Шеппард установил, что погрешность в расчете дисперсии, вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала (т.е. i2/l2) как в сторону занижения, так и в сторону завышения величины дисперсии.

  В статистической практике часто возникает  необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

  Для осуществления такого рода сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации — коэффициент вариации.

  Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической.

  Коэффициент вариации используют не только для  сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

Показатели  вариации  для несгруппированных данных
Средняя арифметическая(
)=
Размах  вариации (R)= Xmax-Xmin
Среднее квадратичное отклонение (σ)=
Дисперсия(σ2)=
Коэффициент вариации(Vσ)=
 
Показатели  вариации  для сгруппированных данных
Средняя арифметическая(
)=
Размах  вариации (R)= Xmax-Xmin
Среднее квадратичное отклонение (σ)=
Дисперсия(σ2)=
Коэффициент вариации(Vσ)=
 
 

1.3 Статистическое моделирование связи методом

корреляционного и регрессионного анализа

      В общем виде задача статистики в области  изучения взаимосвязей состоит не только в количественной оценке их наличия, направления и силы связи, но и в определении формы (аналитическо-известной связи между варьирующими признаками) определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценке факторов, оказывающих наибольшее влияние на результативный признак.

      Задачи  регрессионного анализа — выбор  типа модели (формы связи), установление степени влияния независимых  переменных на зависимую и определение  расчетных значений зависимой переменой (функции регрессии).

      Решение всех названных задач приводит к необходимости комплексного использования этих методов.

      Корреляционный  и регрессионный  анализ

      Исследование  связей в условиях массового наблюдения и действия случайных факторов осуществляется, как правило, с помощью экономико-статистических моделей. В широком смысле модель — это аналог, условный образ (изображение, описание, схема, чертеж и т.п.) какого-либо объекта, процесса или события, приближенно воссоздающий оригинал. Модель представляет собой логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, дает возможность установить основные закономерности изменения оригинала. В модели оперируют показателями, исчисленными для качественно однородных массовых явлений (совокупностей). Выражение модели в виде функциональных уравнений используют для расчета средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов.

      По  количеству включаемых факторов модели могут быть однофакторными и многофакторными (два и более факторов).

      В зависимости от познавательной цели статистические модели подразделяются на структурные, динамические и модели связи.

      Рассмотрим  основные проблемы статистического  моделирования связи методами корреляционного  и регрессионного анализа.

      Двухмерная  линейная модель корреляционного  и регрессионного анализа (однофакторный линейный корреляционный и регрессионный анализ)

      Наиболее  разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая  влияние вариации факторного признака х на результативный признак у представляющая собой одно факторный корреляционный и регрессионный анализ. Овладение теорией и практикой построения и анализа двухмерной модели корреляционного и регрессионного анализа представляет собой исходную основу для изучения многофакторных стохастических связей.

      Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Сложность заключается  в том, из множества функций необходимо найти такую, которая лучше других выражает реально существующие связи между анализируемыми признаками. Выбор типа функции может опираться на теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований или осуществляться эмпирически — перебором и оценкой функций разных типов и т.п.

      При изучении связи экономических показателей  производства (деятельности) используют различного вида уравнения прямолинейной  и криволинейной связи. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, я  большинстве случаев нелинейные формы связи дня расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Уравнение однофакторной (парной) линейной корреляционной связи имеет вид:

      

      Поскольку а0 является средним значением у в точке х=О, экономическая интерпретация часто затруднена или вообще невозможна.

      Коэффициент парной линейной регрессии а1 имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, т.е. вариацию у, приходящуюся на единицу вариации х. Знак а1 указывает направление этого изменения.

      Параметры уравнения а0, а1 находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений.

      

      Для нахождения минимума данной функции  приравниваем к нулю ее частные производные  и получим систему двух линейных ‚равнений, которая называется системой нормальных уравнений:

Информация о работе Статистика данных