Автор: Пользователь скрыл имя, 06 Апреля 2011 в 12:31, курсовая работа
C помощью ППП "Statistica" показан анализ пациентов и клиник в которых они проходили лечение сердечно-сосудистых заболеваний.
Основные проблемы анализа выживаемости……………………………..……3
I. Таблицы времён жизни …………… …………… …………… …………… ..4
1.1 Исходные данные………………………………………………………….….4
1.2 Построение таблиц времён жизни……………………………………...……6
1.3 Аппроксимация эмпирических данных теоретическим распределением……………………………………………………………………11
II. Оценки Каплана-Майера…………………………………………………..…17
III. Сравнение выживаемости в группах…………………………………….…21
Список литературы………………………………………………………………23
Ниже
представлены графики функции выживания
для семейства распределений
Вейбулла, подогнанные на основе трех
алгоритмов (Weight1, Weight2, Weight3).
Рис.5. Графическое
представление эмпирической функции выживания
и теоретических кривых распределения
Гомпертца.
а) нижняя граница временных интервалов;
б) количество цензурированных наблюдений;
в) число отказов (умерших) в каждом временном интервале.
Если
не удается получить хорошую подгонку
к наблюдаемым данным, то для определения
формы функции надежности можно
использовать независимые от распределения
методы оценки параметров, т.н. непараметрические
оценки (доступные в окне результатов).
В этом случае предусмотрен метод Каплана-Майера,
позволяющий получить оценку предела
функции надежности (выживания). Эта оценка
не зависит от предположения о природе
распределения исходных данных.
II. Оценки Каплана–Майера
Как указывалось выше, одна из задач анализа выживаемости состоит в оценке функции выживания S(t).
Если все наблюдения являются полными (completed), то оценка S(t) строится просто: подсчитывается количество пациентов, проживших t дней после проведения операции, и делится на общее число пациентов. При наличии неполных (censored) наблюдений ситуация усложняется: требуется строить таблицу времен жизни (механизм ее построения был подробно изложен в предыдущем параграфе).
В
случае цензурированных (но не группированных)
наблюдений имеется также возможность
оценить функцию выживания непо
Его
основная идея состоит в следующем.
Пусть массив исходных данных содержит
зафиксированные
S(t) – оценка функции выживания,
n – общее число наблюдений (объем выборки),
j – порядковый (хронологический) номер отдельного события (наблюдения),
- индикатор цензурирования. Причем , если j-e событие означает отказ (смерть), и , если речь идет о потере наблюдения для дальнейшего исследования независимо от причин.
П - произведение по всем наблюдениям j, завершившимся к моменту времени t.
Так как приведенная оценка функции выживания состоит из произведения нескольких сомножителей, она также носит название мультипликативной (множительной).
Обратимся
к тому же файлу исходных данных,
который использовался для
Таблица 8
Результаты оценки функции выживания методом Каплана-Майера.
В первом столбце таблицы показаны номера наблюдений, для которых в соответствующий момент времени произошло некоторое событие. Знаком «+» обозначены цензурированные наблюдения (пациент был выписан).
Из таблицы видно, что вероятность того, что пациент проживёт больше 47 дней, равна 0,9097; вероятность того, что пациент проживёт больше 66 дней, равна 0,7161 и т.д.
Следует обратить внимание на стандартные ошибки полученных оценок. Стандартная ошибка функции выживания достаточно мала.
Сравним
ошибками функции выживания (Cum.
Prop Survivng), рассчитанной для таблиц времен
жизни в табл.3).
Таблица 9
Стандартные ошибки функция выживания для таблиц времен жизни
Как мы видим, стандартные ошибки полученных оценок полностью не совпадают, прежде всего, это связано с тем, что в таблицах времён жизни данные были сгруппированы. В один интервал входит приблизительно 5 наблюдений, а в таблицах Каплана-Майера каждое наблюдение рассматривается в отдельности.
Ниже приведен график функции выживания.
Рис. 7. Функция выживания.
Для удобства интерпретации на графике полные наблюдения отмечены точками, неполные наблюдения - крестиками.
Преимущество
метода Каплана-Майера, по сравнению
с методом таблиц времен жизни, состоит
в том, что получаемые оценки не зависят
от разбиения времени жизни пациента (объекта)
на интервалы, т.е. от группировки. Здесь
нет необходимости разбивать временную
ось на интервалы. Метод множительных
оценок Каплана-Майера и метод таблиц
времен жизни приводят практически к одинаковым
результатам, если временные интервалы
содержат максимум по одному наблюдению.
Представляет интерес сравнить времена жизни пациентов в различных группах, например, в группах мужчин и женщин. В системе «Statistica» предусмотрены специальные процедуры для сравнения выживаемости в группах.
Если имеется две группы, то используется опция Сравнение двух выборок (Comparing two samples).
Если количество групп больше двух, то используется опция Сравнение нескольких выборок (Comparing multiple samples).
Так как времена жизни не являются нормально распределенными, в этом случае приходится использовать непараметрические тесты, основанные на рангах. Имеется множество непараметрических критериев, которые могут быть применены для сравнения времен жизни, однако в подавляющем большинстве они неприменимы для цензурированных данных.
Для сравнения выживаемости в группах имеется несколько критериев (критерии для сравнения нескольких выборок представляют собой развитие соответствующих двухвыборочных):
Эти критерии основаны на соответствующих z-значениях стандартного нормального распределения, которые могут быть использованы для статистической проверки различий между группами. В то же время надёжные результаты получаются лишь при достаточно больших объёмах выборок, в противном случае эти критерии не столь надёжны. Для иллюстрации адекватности построенной модели удобно применять параллельно визуальные методы.
Замечание. F-критерий Кокса обычно мощнее, чем критерий Вилкоксона-Гехана, если объёмы выборок (групп) меньше 50 ( ). Это верно также в том случае, если выборки извлекаются из экспоненциального распределения или распределения Вейбулла.
Сравним времена жизни пациентов, перенесших операции на сердце, в различных клиниках. Так как исходные данные содержат информацию о трех клиниках (Hillview, Biner и St. Andreas), выбираем опцию Сравнение нескольких выборок (Comparing multiple samples).
Графики
позволяют наглядно убедиться в
существовании различий между обозначенными
группами (клиниками).
Рис. 8.
Функции выживания для
Выводы:
Сразу
можно отметить, что вероятность
дожития пациентов, прооперированных
в клинике BINER, значительно
выше, чем в двух других клиниках на протяжении
практически всего наблюдаемого периода
времени.
Информация о работе Анализ выживаемости в системе "Statistica"