Автор: Пользователь скрыл имя, 16 Февраля 2013 в 12:45, курс лекций
Лекция 1. Предмет, метод и организация статистики
Понятие «статистика»
Предмет статистики
Методология статистики
Организация статистики, ее основные задачи и принципы в РФ
При цензовом наблюдении отбор единиц проходит по определенному критерию, называемому цензом. Например, при обследованиях предприятий задается определенное критическое число работников. Предприятия с числом занятых больше этого критического числа в процессе исследования не наблюдаются.
Несплошное наблюдение имеет ряд преимуществ по сравнению со сплошным:
• снижается стоимость наблюдения благодаря уменьшению объема наблюдения;
К недостаткам несплошного наблюдения относятся следующие:
Способы статистического наблюдения
Известны следующие
способы получения
- непосредственное наблюдение;
- способ, основанный на изучении документов;
- опрос.
При непосредственном наблюдении проводят подсчет, взвешивание, обмер единицы наблюдения и т. п. В результате этих действий устанавливается некий факт, сведения о котором заносятся в статистический формуляр.
Способ наблюдения, основанный на изучении документов, - наиболее точный, особенно если документами учетного характера является бухгалтерская документация.
При опросе регистрируемые сведения заносятся в статистический формуляр со слов опрашиваемого. Как правило, никакими документами они при этом не подтверждаются.
Различают следующие виды сбора информации:
- устный (экспедиционный);
- саморегистрация;
- корресподентский;
- анкетный;
- явочный;
9. Точность статистического наблюдения
Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.
Различают две группы ошибок:
- ошибки регистрации;
Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные и систематические.
Случайными ошибками регистрации называют ошибки, возникающие в следствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе «Пол» отмечен «Мужской» и т.п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, а в графе «Семейное положение» указано «Состоит в браке» и имеется высшее образование, то, естественно, возраст следует исправить. Если объем исследуемой совокупности велик, или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправленны и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов - логический анализ данных.
Систематические ошибки регистрации чаще всего имеют одноправленность искажений: они либо увеличивают, либо уменьшают статистический показатель и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин - мужчинам приятнее ощущать себя неженатыми, а для женщины «стыдно» быть незамужем. Другой пример, когда человек округляет свой возраст – вместо 32 лет говорит 30, вместо 79 – 80 и т.п. (это явление широко известно и даже получило название «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения
Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические.
Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть и, следовательно, при несплошном наблюдении присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.е. эти ошибки вычисляются и находятся под контролем.
Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические. Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще всего, если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты и т.п.
Для повышения точности наблюдения необходимо:
1) правильно разработан, формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
2) иметь хорошо обученный персонал для проведения обследования;
3) строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что, если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
4) провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
5) целесообразно провести и арифметический контроль данных, т.е. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
6) предпринять меры по восстановлению данных при наличии незаполненных анкет или формуляров, либо при получении результатов обследования сделать поправку на не ответы респондентов
16Степенные средние
Большое распространение в статистике имеют средние величины. Типический размер признака совокупности объектов или динамического ряда называется статистической средней.
Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности.
Сущность средней заключается в том, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием основных факторов.
На практике в статистике применяются различные виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая и другие структурные средние. Тот или иной вид используется в зависимости от характера данных и целей исследования.
Все виды средних объединяют в одну группу под общим названием степенные средние, индивидуальные формулы для их вычисления можно привести к виду, общему для всех степенных средних, а именно:
, - простая
где - варианты (значение, которые принимает признак);
m – показатель степенной средней: при m = 1 получаем формулу для вычисления средней арифметической, при m = 0 – средней геометрической, m = -1 – средней гармонической, при m = 2 – средней квадратической;
- частоты;
n – число единиц в совокупности.
Главным условием, при котором можно использовать степенные средние в статистическом анализе, является однородность совокупности, т.е. она не должна содержать исходные данные, резко отличающиеся по своему количественному значению.
Средняя арифметическая и ее свойства
Средняя арифметическая используется в тех случаях, когда разрыв между минимальным и максимальным значениями признака достаточно невелик.
Средняя арифметическая вычисляется либо как простая, либо как взвешенная величина.
Часто данные наблюдения представляют в интервальной форме. Тогда при расчете средней в качестве берут середины интервалов. Если первый и последний интервалы открытые, то их условно «закрывают», принимая за величину интервала величину примыкающих интервалов, т.е. первый закрывают исходя из величины второго, последний – предпоследнего.
Свойства средней
Средняя гармоническая
Средняя гармоническая взвешенная величина является модифицированной формой средней взвешенной арифметической. Она применяется в тех случаях, когда не знают значения частот у вариант ряда, зато известны для каждого произведения этих вариант на соответствующие им частоты, т.е.: . Формула средней гармонической взвешенной имеет вид:
,
где - значение произведения варианты на соответствующую ей частоту;
- значения вариант.
Если для каждой варианты мы рассчитаем частоту как , то формула средней гармонической взвешенной превратится в формулу для расчета средней арифметической взвешенной: .Если произведение вариант на соответствующие им частоты равны между собой, т.е. , то применяется средняя гармоническая простая, рассчитываемая по следующей формуле:
.
Средняя геометрическая
Если минимальное и максимальное значения признака резко отличаются друг от друга, что возникает при существенной вариации показателя в совокупности, либо, если мы имеем данные, представляющие собой отношения двух показателей, например, индексы или коэффициенты роста, то для нахождения среднего значения используется формула средней геометрической.
Для несгруппированных данных (при отсутствии частот) или для сгруппированных данных с равными частотами применяется средняя геометрическая простая
.
Для сгруппированных
данных с неравными частотами
применяется средняя
.
Средняя квадратическая
Если мы подставим в формулу средней степенной m = 2, то получим среднюю квадратическую:
Взвешенную (для сгруппированных данных): ;
Простую (для несгруппированных данных): .
Средняя квадратическая величина широко применяется при оценке вариации признака, а также в многомерных статистических методах. Кроме того, прикладное значение имеет расчет степенных средних и более высоких порядков, например, при изучении характеристик распределения случайных величин. Формулы для их вычисления получаются при подстановке в качестве m соответствующего показателя степени.
17.Структурные средние
Мода – это наиболее часто встречающееся значение признака, или, говоря иначе, значение варианты с наибольшей частотой.
В дискретных и интервальных рядах моду рассчитывают по-разному. В зависимости от того, равны интервалы между собой или нет, применяют тот или иной подход к определению моды.
Определение моды в дискретных вариационных рядах
В дискретных вариационных рядах для определения моды не требуется специальных вычислений: значение признака, которому соответствует наибольшая частота, и будет значением моды.
Определение моды в интервальных вариационных рядах с равными интервалами
Для определения моды в интервальных вариационных рядах с равными интервалами сначала находят модальный интервал, которым является интервал с наибольшей частотой, а затем ведут расчет по формуле
,
- нижняя граница модального интервала;
i – величина интервала;
- частота модального интервала;
- частота интервала,