Автор: d***********@gmail.com, 28 Ноября 2011 в 01:29, лекция
Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два ряда распределения, имеющих одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Если индивидуальные значения признака ряда мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой данной совокупности.
В научной статистике широко используется показатель вариации, называемый дисперсией. Дисперсия – это средний квадрат отклонений индивидуальных значений признака от средней арифметической.
Дисперсия вычисляется по следующим формулам.
Для
не сгруппированных данных:
. (6.8)
Для сгруппированных данных (дискретный ряд):
. (6.9)
Для интервального ряда:
. (6.10)
На дисперсии основаны практически все методы математической статистики.
Дисперсия и среднее квадратическое отклонение – наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака.
Рассмотренные ранее показатели вариации, за исключением дисперсии, выражались в единицах измерения варьирующего признака. Так, например, среднее квадратическое отклонение урожайности пшеницы измеряется в центнерах. Так как среднеквадратическое отклонение – число именованное, то оно неудобно для сопоставления вариации различных признаков. Например, вычислив среднее квадратическое отклонение производительности работы и заработной платы рабочих, невозможно определить, вариация какого признака больше, т.к в первом случае она измеряется в единицах продукции (деталях), во втором – в гривнях.
Для сравнения вариации разных признаков наиболее часто применяется показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности статистической совокупности. Статистическая совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному закону).
Принцип
построения коэффициентов вариации
таков:
(6.11)
Линейный
коэффициент вариации |
Квадратический
коэффициент вариации |
Коэффициент |
Чаще всего на практике употребляется квадратический коэффициент вариации.
С помощью коэффициента вариации можно сравнивать размеры одного признака в нескольких совокупностях. Так, например, с помощью коэффициента вариации можно сравнивать вариацию срока службы станков на различных предприятиях, вариацию роста и веса населения в различных регионах страны.
Пример.
Рассмотрим коэффициенты вариации срока
службы электролампочек, выпускаемых
на трех заводах. Исходные данные представлены
в табл. 6.5.
Таблица 6.5
Срок
службы электролампочек
Номер завода | Средняя продолжительность
горения лампочек, ч., (х) |
|||
1 | 800 | -100 | 10000 | 10,20 |
2 | 1000 | + 100 | 10000 | 8,17 |
3 | 900 | 0 | 0 | 9,07 |
ИТОГО- | 2700 | 0 | 20000 |
Вычислим
среднюю арифметическую срока горения
лампочек:
Вычислим
среднее квадратическое отклонение:
Вычислим коэффициент вариации для каждого завода и занесем данные в таблицу. Наиболее низкий коэффициент вариации у электролампочек, выпускаемых на заводе № 2, что свидетельствует о большой однородности его продукции (в данном случае, однородности качества электролампочек).
Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических исследований приходится встречаться с самими различными распределениями. Однородные совокупности характеризуются как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однородных групп.
Выяснение общего характера распределения предполагает оценку степени его однородности, а также исчисление показателей асимметрии и эксцесса. В симметричном распределении , а чем заметнее асимметрия, тем больше отклонение между характеристиками центра распределения .
Стандартное
отклонение называется коэффициентом
асимметрии:
. (6.13)
В
случае правосторонней асимметрии
As > 0, левосторонней
– As < 0.
Если
As < 0,25, считается,
что ассиметрия низкая, если As
≤ 0,5 – средняя, а при As
> 0,5 – высокая.
Рис. 6.1.
Симметрия распределения
Оценивание
коэффициента асимметрии также может
производиться на базе центрального момента
распределения и вычисляется по формуле:
(6.14)
где μ3 – центральный момент третьего порядка: .
Алгебраически
центральный момент
распределения – это средняя арифметическая
k-й степени отклонения индивидуальных
значений признака от средней:
(6.15)
Очевидно, что момент второго порядка – это дисперсия, которая характеризует вариацию, моменты 3-го и 4-го порядков характеризуют соответственно ассиметрию и эксцесс.
Эксцесс распределения – степень сосредоточенности элементов совокупности около центра распределения. Показатель эксцесса (островершинности) рассчитывается по формуле:
, (6.16)
где μ4 – центральный момент четвертого порядка .
Рис. 6.2.
Эксцесс распределения
Эксцесс может быть положительным и отрицательным. У островершинных распределений показатель эксцесса имеет положительный знак, а у плосковершинных – отрицательный знак. Предельным значением отрицательного эксцесса является значение Ех = – 2; величина положительного эксцесса является величиной бесконечной. В нормальном распределении и поэтому .