Анализ выживаемости в системе "Statistica"

Автор: Пользователь скрыл имя, 06 Апреля 2011 в 12:31, курсовая работа

Описание работы

C помощью ППП "Statistica" показан анализ пациентов и клиник в которых они проходили лечение сердечно-сосудистых заболеваний.

Содержание

Основные проблемы анализа выживаемости……………………………..……3
I. Таблицы времён жизни …………… …………… …………… …………… ..4
1.1 Исходные данные………………………………………………………….….4
1.2 Построение таблиц времён жизни……………………………………...……6
1.3 Аппроксимация эмпирических данных теоретическим распределением……………………………………………………………………11
II. Оценки Каплана-Майера…………………………………………………..…17
III. Сравнение выживаемости в группах…………………………………….…21
Список литературы………………………………………………………………23

Работа содержит 1 файл

Курсовая НА ПЕЧАТЬ.doc

— 896.50 Кб (Скачать)

    Ниже  представлены графики функции выживания  для семейства распределений  Вейбулла, подогнанные на основе трех алгоритмов (Weight1, Weight2, Weight3). 

Рис.5. Графическое представление эмпирической функции выживания и теоретических кривых распределения Гомпертца. 
 
 

    В заключение отметим, что имеется  возможность анализировать в  качестве исходных  табулированные данные. Для этого нужно выбрать закладку Таблица времен жизни (Table of Survival Times) в диалоговом окне Таблицы и распределения времен жизни. В этом случае файл с табулированными данными должен содержать три переменные со следующей информацией:

а) нижняя граница  временных интервалов;

б) количество цензурированных  наблюдений;

в) число отказов (умерших) в каждом временном интервале.

   Если  не удается получить хорошую подгонку к наблюдаемым данным, то для определения  формы функции надежности можно  использовать независимые от распределения методы оценки параметров, т.н. непараметрические оценки (доступные в окне результатов). В этом случае предусмотрен метод Каплана-Майера, позволяющий получить оценку предела функции надежности (выживания). Эта оценка не зависит от предположения о природе распределения исходных данных.  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    II. Оценки Каплана–Майера

    Как указывалось выше, одна из задач  анализа выживаемости состоит в  оценке функции выживания S(t).

    Если  все наблюдения являются полными (completed), то оценка S(t) строится просто: подсчитывается количество пациентов, проживших t дней после проведения операции, и делится на общее число пациентов. При наличии неполных (censored) наблюдений ситуация усложняется: требуется строить таблицу времен жизни (механизм ее построения был подробно изложен в предыдущем параграфе).

    В случае цензурированных (но не группированных) наблюдений имеется также возможность  оценить функцию выживания непосредственно, не используя таблицу времен жизни. Такой метод впервые был предложен Капланом и Майером (Kaplan & Meier (1958)). .

    Его основная идея состоит в следующем. Пусть массив исходных данных содержит зафиксированные последовательно  в хронологическом порядке отдельные наблюдения (события). Если исходить из того, что каждое наблюдение содержит точно один временной интервал, то перемножая вероятности выживания в каждом интервале получим следующую формулу для функции выживания:

    

, где

S(t) – оценка функции выживания,

n – общее число наблюдений (объем выборки),

j – порядковый (хронологический) номер отдельного события (наблюдения),

  - индикатор цензурирования. Причем , если j-e событие означает отказ (смерть), и , если речь идет о потере наблюдения для дальнейшего исследования независимо от причин.

П - произведение по всем наблюдениям j, завершившимся к моменту времени t.

    Так как приведенная оценка функции  выживания состоит из произведения нескольких сомножителей, она также носит название мультипликативной (множительной).

    Обратимся к тому же файлу исходных данных, который использовался для построения таблиц времен жизни. Оценки Каплана-Майера функции выживания, построенные  по этим данным, показаны в следующей  таблице: 

      Таблица 8

Результаты оценки функции выживания методом Каплана-Майера.

     

     
     
     
     
     
     
     
     
     

В первом столбце таблицы показаны номера наблюдений, для которых в соответствующий  момент времени произошло некоторое  событие. Знаком «+» обозначены цензурированные  наблюдения (пациент был выписан).

    Из  таблицы видно, что вероятность  того, что пациент проживёт больше 47 дней, равна 0,9097; вероятность того, что пациент проживёт больше 66 дней, равна 0,7161 и т.д.

    Следует обратить внимание на стандартные ошибки полученных оценок. Стандартная ошибка функции выживания достаточно мала.

    Сравним ошибками функции выживания (Cum. Prop Survivng), рассчитанной для таблиц времен жизни в табл.3).  
 
 

    Таблица 9

    Стандартные ошибки функция выживания  для таблиц времен жизни

 
 
 
 

    Как мы видим, стандартные ошибки полученных оценок полностью не совпадают, прежде всего, это связано с тем, что в таблицах времён жизни данные были сгруппированы. В один интервал входит приблизительно 5 наблюдений, а в таблицах Каплана-Майера каждое наблюдение рассматривается в отдельности.

    Ниже  приведен график функции выживания.

Рис. 7. Функция  выживания.

    Для удобства интерпретации на графике  полные наблюдения отмечены точками, неполные наблюдения - крестиками.

    Преимущество  метода Каплана-Майера, по сравнению  с методом таблиц времен жизни, состоит в том, что получаемые оценки не зависят от разбиения времени жизни пациента (объекта) на интервалы, т.е. от группировки. Здесь нет необходимости разбивать временную ось на интервалы. Метод множительных оценок Каплана-Майера и метод таблиц времен жизни приводят практически к одинаковым результатам, если временные интервалы содержат максимум по одному наблюдению. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

III. Сравнение выживаемости в группах

 

    Представляет  интерес сравнить времена жизни  пациентов в различных группах, например, в группах мужчин и женщин. В системе «Statistica» предусмотрены специальные процедуры для сравнения выживаемости в группах.

    Если  имеется две группы, то используется опция Сравнение двух выборок (Comparing two samples).

    Если  количество групп больше двух, то используется опция Сравнение нескольких выборок (Comparing multiple samples).

    Так как времена жизни не являются нормально распределенными, в этом случае приходится использовать непараметрические  тесты, основанные на рангах. Имеется  множество непараметрических критериев, которые могут быть применены для сравнения времен жизни, однако в подавляющем большинстве они неприменимы для цензурированных данных.

    Для сравнения выживаемости в группах  имеется несколько критериев (критерии для сравнения нескольких выборок представляют собой развитие соответствующих двухвыборочных):

    • непараметричесий критерий Вилкоксона, предложенный для неполных наблюдений Геханом и Пето;
    • F-критерий Кокса;
    • логарифмический ранговый критерий (Lee, 1975 и 1980).

    Эти критерии основаны на соответствующих z-значениях стандартного нормального распределения, которые могут быть использованы для статистической проверки различий между группами. В то же время надёжные результаты получаются лишь при достаточно больших объёмах выборок, в противном случае эти критерии не столь надёжны. Для иллюстрации адекватности построенной модели удобно применять параллельно визуальные методы.

    Замечание. F-критерий Кокса обычно мощнее, чем критерий Вилкоксона-Гехана, если объёмы  выборок (групп) меньше 50 ( ). Это верно также в том случае, если выборки извлекаются из экспоненциального распределения или распределения Вейбулла.

    Сравним времена жизни пациентов, перенесших операции на сердце, в различных  клиниках. Так как исходные данные содержат информацию о трех клиниках (Hillview, Biner и St. Andreas), выбираем опцию Сравнение нескольких выборок (Comparing multiple samples).

    Графики позволяют наглядно убедиться в  существовании различий между обозначенными  группами (клиниками). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Рис. 8.  Функции выживания для пациентов  трех клиник. 
 

    Выводы:

    Сразу можно отметить, что вероятность  дожития пациентов, прооперированных в клинике BINER, значительно выше, чем в двух других клиниках на протяжении практически всего наблюдаемого периода времени. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Список  литературы
 
 
  1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и  основы эконометрики. – М., ЮНИТИ, 1998
  2. Боровиков В.П., Боровиков И.П. Статистический анализ и обработка данных в среде  Windows. – М., Информационно-издательский дом  «Филинъ», 1997
  3. Боровиков В.П. Популярное введение в программу  «Statistica». – М., Компьютер-пресс, 1998
  4. Боровиков В.П. Statistica. Анализ и обработка данных в системе WINDOWS. – М., Финансы и статистика, 1998
  5. Боровиков В.П. Statistica: искусство анализа данных на компьютере (для профессионалов). – СПб., ПИТЕР, 2003
  6. Халафян А.А.  Statistica 6. Статистический анализ данных. – М., Бином, 2008
  7. Экономико-математические методы и прикладные модели. Под редакцией Федосеева В.В. – М., ЮНИТИ, 1999   

Информация о работе Анализ выживаемости в системе "Statistica"