Автор: Пользователь скрыл имя, 26 Февраля 2013 в 08:12, реферат
Статисти́ческие ме́тоды — методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.
Понятие о статистических выводах
понятие аналитического выравнивания ряда. Спецификация модели
Вопросы:
Статисти́ческие ме́тоды — методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.
Статистические методы анализа данных как область научно-практической деятельности
Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.
Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):
а) разработка и исследование методов общего назначения, без учета специфики области применения;
б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;
в) применение статистических
методов и моделей для
Кратко рассмотрим три только что выделенных вида научной и прикладной деятельности. По мере движения от а) к в) сужается широта области применения конкретного статистического метода, но при этом повышается его значение для анализа конкретной ситуации. Если работам вида а) соответствуют научные результаты, значимость которых оценивается по общенаучным критериям, то для работ вида в) основное - успешное решение конкретных задач той или иной области применения (техники и технологии, экономики, социологии, медицины и др.). Работы вида б) занимают промежуточное положение, поскольку, с одной стороны, теоретическое изучение свойств статистических методов и моделей, предназначенных для определенной области применения, может быть весьма сложным и математизированным, с другой - результаты представляют не всеобщий интерес, а лишь для некоторой группы специалистов. Можно сказать, что работы вида б) нацелены на решение типовых задач конкретной области применения.
2.
Аналитическое выравнивание. Под этим понимают определение основной проявляющейся во времени тенденции развития изучаемого явления . Развитие предстает перед исследователем как бы в зависимости только от течения времени . В итоге выравнивания временного ряда получают наиболее общий , суммарный , проявляющийся во времени результат действия всех причинных факторов . Отклонение конкретных уровней ряда от уровней , соответствующих общей тенденции , объясняют действием факторов , проявляющихся случайно или циклически . В результате приходят к трендовой модели , выраженной формулой (1):
, (1)
где f(t) – уровень , определяемый тенденцией развития ;
-- случайное и циклическое
Целью аналитического выравнивания динамического ряда является определение аналитической или графической зависимости f(t) . На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t) , а затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом , чтобы она давала содержательное объяснение изучаемого процесса .
Чаще всего при выравнивании используются следующий зависимости :
линейная ;
параболическая ;
экспоненциальная
Линейная зависимость выбирается в тех случаях , когда в исходном временном ряду наблюдаются более или менее постоянные абсолютные и цепные приросты , не проявляющие тенденции ни к увеличению , ни к снижению.
Параболическая зависимость
Экспоненциальные зависимости применяются , если в исходном временном ряду наблюдается либо более или менее постоянный относительный рост (устойчивость цепных темпов роста , темпов прироста , коэффициентов роста) , либо , при отсутствии такого постоянства , -- устойчивость в изменении показателей относительного роста (цепных темпов роста цепных же темпов роста , цепных коэффициентов роста цепных же коэффициентов или темпов роста и т.д.).
Оценка параметров ( ) осуществляется следующими методами :
Методом избранных точек,
Методом наименьших расстояний,
Методом наименьших квадратов (МНК)
В большинстве расчетов используется метод наименьших квадратов , который обеспечивает наименьшую сумму квадратов отклонений фактических уровней от выравненных :
Спецификация модели
Спецификация модели (т.е. формулировка модели) отражает наше представление о механизме зависимости между двумя переменными и сам выбор этих переменных, исходя из соответствующей теории связи между ними.
В первую очередь из всего круга факторов, влияющих на результативный признак, необходимо выбрать те, которые оказывают наибольшее влияние.
Уравнение, которое связывает
зависимую (или объясняемую) переменную
Y с независимыми (или объясняющими)
переменными называют уравнением регрессии.
Принято различать простую (парную)
регрессию и множественную регр
Простая регрессия представляет собой регрессию между двумя переменными – у и х, т. е. модель вида
где у – зависимая переменная (результативный признак);
х – независимая или объясняющая, переменная (признак-фактор).
Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной.
Множественная регрессия
соответственно представляет собой
регрессию результативного
В уравнении регрессии связь переменных представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых
y – фактическое значение результативного признака;
– теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х, т. е. из уравнения регрессии, ее также называют оценкой y;
ε – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина ε называется также возмущением. Присутствие случайных ошибок в уравнениях мотивируется комплексом причин — влиянием неучтенных факторов, непредсказуемостью человеческих реакций, неточностями наблюдений и измерений и т.д. Присутствие в модели случайной величины порождено тремя основными источниками:
спецификацией модели,
выборочным характером исходных данных,
особенностями измерения переменных.
От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным.
К ошибкам спецификации будут относиться не только неправильный выбор той или иной математической функции для у, но и недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной. Так, спрос на конкретный товар может определяться не только ценой, но и доходом на душу населения.
Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики.
Использование временной
информации также представляет собой
выборку из всего множества
Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки – увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Особенно велика роль ошибок измерения при исследовании на макроуровне. Так, в исследованиях спроса и потребления в качестве объясняющей переменной широко используется «доход на душу населения». Вместе с тем статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов.
Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.