Автор: Пользователь скрыл имя, 26 Сентября 2011 в 12:04, реферат
Понятие вариационного ряда. Первичные статистические данные, с которыми имеет дело историк, часто представлены неупорядоченной последовательностью чисел, характеризующей ту или иную сторону процесса или явления. В этой совокупности чисел бывает трудно разобраться, и первичная обработка материалов сводится к приведению имеющихся данных к виду, удобному для анализа.
Вариацинные ряды и их характеристики
Вариационный ряд
Понятие вариационного ряда. Первичные статистические данные, с которыми имеет дело историк, часто представлены неупорядоченной последовательностью чисел, характеризующей ту или иную сторону процесса или явления. В этой совокупности чисел бывает трудно разобраться, и первичная обработка материалов сводится к приведению имеющихся данных к виду, удобному для анализа.
Полученный ряд называется вариационным. Сведение первичных данных в вариационный ряд облегчает анализ совокупности. Кроме того, вариационный ряд является исходным материалом для большинства методов математической статистики.
При построении вариационного ряда можно приписывать вариантам не частоты, а рассматривать доли каждой варианты во всей совокупности. Они вычисляются как отношения соответствующих частот к объему всей совокупности и называются частостями (обозначим их qi). Частости могут быть выражены в относительных числах или процентах.
Дискретный и интервальный вариационные ряды. Изменение признака, по которому обследуются объекты, может быть дискретным и непрерывным. Дискретной вариацией признака называется такая, при которой отдельные значения варианты отличаются на некоторую конечную величину. В приведенном примере вариация признака зафиксирована как дискретная (отдельные значения варианты отличаются на единицу). Вариация называется непрерывной, если отдельные значения признака могут отличаться друг от друга на сколько угодно малую величину. Примером непрерывной вариации признака служит распределение посевных площадей по урожайности.
В практике исторических исследований непрерывные вариации признака встречаются сравнительно редко, тем не менее, интервальные ряды имеют большое значение в обработке исторических данных. Дело в том, что некоторые признаки, принципиально являясь дискретными, принимают такое большое количество значений, что составленный по ним дискретный ряд является практически необозримым, при этом весьма затрудняется дальнейший его анализ. В такой ситуации прибегают к построению интервального ряда
Основные характеристики вариационного ряда
Построение
вариационного ряда является только
первым шагом в изучении статистических
данных. Для более глубокого
Существуют две группы характеристик вариационного ряда: 1) меры уровня, или средние, 2) меры рассеяния.
Меры уровня, или средние. Наиболее употребительными в статистических исследованиях являются три вида средних: средняя арифметическая, мода и медиана.
Выбор типа средней для характеристики вариационного ряда зависит от цели, для которой исчисляется средняя, от особенностей исходного материала и от возможностей той или иной средней.
Прежде чем перейти к характеристике отдельных видов средней, сформулируем некоторые, самые общие требования к средней.
Средняя, представляет собой количественную характеристику качественно однородной совокупности. Нарушение этого требования приводит к неверным выводам, искажает суть явления.
Приведем пример, рассмотренный В. И. Лениным. Исследуя арендные отношения в крестьянских хозяйствах Таврической губернии, В. И. Ленин установил, что среди бедняцких элементов деревни в среднем на одно хозяйство арендовалось 2,4 дес. земли, а среди кулацких элементов - 48,6 дес. Формальный подход дает математически верную среднюю для всех крестьянских хозяйств- 12,4 дес. Но подобная средняя является совершенно фиктивной. "Не смешно ли брать "средний" размер аренды, складывая вместо крестьян, из которых один берет 2 десятины, за безумную - цену (15 руб.), очевидно, из крайней нужды, на разорительных условиях. А другой берет 48 десятин, сверх достаточного количества своей земли, "покупая" землю оптом несравненно дешевле, по 3,55 руб. за десятину?" (Ленин В. И. Поли. собр. соч., т. 3, с. 73).
Кроме того, необходимо, чтобы средняя не была слишком абстрактной, а имела ясный смысл в решении задачи.
Далее, желательно, чтобы процедура вычисления средней была проста. При прочих равных условиях предпочтение отдается той средней, которая проще вычисляется.
И, наконец, при выборе средней желательно свести к минимуму влияние случайных колебаний выборки. Так, если одной и той же совокупности взять несколько групп элементов, то средние, им соответствующие, будут, как правило, различаться по величине. Рекомендуется использовать вид средней, у которой эти различия минимальны (подробнее о выборке и выборочной средней см. гл. 5 данного раздела).
Наиболее распространенной мерой уровня - является средная арифметическая:
где - знак суммирования от 1 до k; xi-варианты с порядковым номером i; - объем совокупности (число элементов совокупности); ni- частота варианта xi, k - число варианта. Если вместо частоты заданы частости qi, то формула имеет вид
Пример 5. Вычислим среднюю арифметическую для данных табл.
Средняя арифметическая
интервального вариационного
Пример 6. Вычислим
средние размеры наделов
Для решения задачи, прежде всего, необходимо найти середины интервалов. Определенная трудность возникает в связи с тем, что первый и последний интервалы являются открытыми. Нижнюю границу первого интервала естественно принять равной нулю. Тогда середина этого интервала равна (0+2)/2=l. Для нахождения центрального значения последнего интервала применим предложенный выше прием. Величина интервала, предшествующего последнему, равна 2. Условно принимаем за величину последнего интервала 2. Тогда верхняя граница того интервала-9 и, следовательно, его середина вычисляется так: (7+9)/2=8.
Пользуясь формулой средней арифметической (4.4а) и принимая за значение признака середину интервала (строка 2 табл. 5), рассчитываем средний дореформенный надел у барщинных крестьян:
Аналогично вычисляется средний дореформенный надел у оброчных крестьян: .
Кроме средней арифметической широкое распространение имеет другой вид мер уровня - медиана.
Медианой (обозначим Mе) называется такое значение варьирующего признака, которое приходится на середину вариационного ряда.
При нахождении
медианы дискретного
Пример 7. Пусть дан ряд с нечетным числом вариант:
|
Тогда число вариант, равное 9, представимо в виде 2m+1=9, откуда 2m=8, m=4, т.е.Me=x4+1=x5=15.
Рассмотрим случай четного числа членов:
Для интервального вариационного ряда медиана вычисляется по формуле
где xMe(min)-нижняя граница медианного интервала; h - величина этого интервала, или интервальная разность; qi- частоты или частости; - накопленная сверху частота (или частость) интервала, предшествующего медианному; частота или частость медианного интервала.
Содержание введенных
обозначений и процедуру
Пример 8. Вычислим медиану по данным табл. 6.
Вычисление медианы начинается с нахождения интервала, содержащего медиану. Медианному интервалу соответствует первая из накопленных частот или частостей, превышающая половину всего объема совокупности. В нашем случае объем совокупности равен 100%, первая из накопленных частостей, превышающая половину всего объема совокупности, - 60,1 (см. табл. 6). Следовательно, интервал 8-12 будет медианным. Далее, xme(min)=8, h=4, =41, qMe=19.1. Воспользуемся формулой (4.5):
Таким образом, серединный размер посева равен примерно 9,9 дес.
Медиану можно
использовать в тех случаях, когда
изучаемая совокупность неоднородна,
и в такой ситуации она будет
иметь вполне конкретный смысл. Так,
в рассмотренном примере
Особо важное значение
медиана приобретает при
Медиану следует применять, если вычисление средней арифметической неправомерно вследствие неопределенности интервалов (первого или последнего, или того и другого вместе).
К достоинствам медианы следует отнести также то, что она менее подвержена случайностям выборки, чем средняя арифметическая.
Медиану не следует использовать, когда число наблюдений невелико.
Наряду со средней арифметической и медианой важное значение как мера уровня имеет мода.
Модой (обозначим Мо) называется варианта, наиболее часто встречающаяся в данном вариационном ряду.
Для дискретного ряда мода равна варианте с наибольшей частотой или частостью.
Для интервального вариационного ряда модальный интервал, т. е. интервал, содержащий моду, определяется по наибольшей' частоте (частости) в случае равных интервалов и по наибольшей плотности в случае неравных интервалов. Значение варианты, равное моде, отыскивается приближенными методами.
Довольно грубое приближение можно получить, взяв за моду центральное значение модального интервала, т. е. среднее арифметическое границ интервала.
Пример 9. Вычислим моду по данным табл. 6. В последнем столбце табл. 6 вычислены плотности распределения.
Наибольшая плотность соответствует интервалу 4-8. Это и есть модальный интервал.
Рассчитываем моду:
Mo=(4+8)/2=6 (дес.).
Таким образом, получаем, что наиболее типичным по размеру посева хозяйством русских переселенцев, Чимкентского уезда в 1908 г. было хозяйство, засевавшее 6 дес. земли.
Моду можно вычислить также как взвешенную среднюю арифметическую из нижней и верхней границ модального интервала (весами в расчете будут служить частоты или частости интервалов предмодального и послемодального). При этом если ряд построен правильно (см. принципы построения вариационного ряда) и интервалы, соседние с модальными, мало отличаются друг от друга, т. е. распределение близко к симметричному, то этот способ дает хорошие результаты.