Análise de Sobrevivência

3,034 views
2,791 views

Published on

Survival analysis, Kaplan-Meier

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
3,034
On SlideShare
0
From Embeds
0
Number of Embeds
15
Actions
Shares
0
Downloads
60
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Análise de Sobrevivência

  1. 1. Paulo Novis Rocha paulonrocha@ufba.br ANÁLISE DE SOBREVIVÊNCIA – I
  2. 2. ANÁLISE DE SOBREVIVÊNCIA • Existem estudos onde a variável resposta de interesse é o tempo entre uma observação inicial e a ocorrência de um evento • Exemplos: • Tempo do nascimento até a morte • Tempo entre o transplante e a rejeição do órgão • Tempo entre o início da terapia de manutenção de um câncer que entrou em remissão e a recaída da doença • Datas serão variáveis essenciais! O tempo em questão será um subtração entre duas datas.
  3. 3. ANÁLISE DE SOBREVIVÊNCIA • O tempo entre uma observação inicial e a ocorrência de um evento (ou falha) é chamado de tempo de sobrevida (ou de sobrevivência). • Embora o tempo de sobrevida seja uma variável quantitativa contínua, a sua distribuição é raramente normal; em geral, a distribuição é enviesada para direita. • A análise deste tipo de dado geralmente procura estimar a probabilidade de que um indivíduo irá sobreviver por um determinado período de tempo.
  4. 4. PROBLEMA AO TRABALHAR COM DADOS DE SOBREVIVÊNCIA: • Nem todos os indivíduos da amostra são observados até os seus respectivos tempos de falha. • Em situações onde o tempo entre o início da observação e a falha é muito longo, os dados são frequentemente analisados antes que o evento de interesse tenha ocorrido em todos os pacientes. • Pode também haver desistências ou perdas de seguimento.
  5. 5. CENSURA • A observação incompleta até o tempo de falha é chamada de CENSURA. • A existência de observações censuradas distingue a análise de sobrevivência de outros tipos de análise.
  6. 6. FUNÇÃO DE SOBREVIVÊNCIA • A distribuição de tempos de sobrevivência pode ser caracterizada por uma função de sobrevivência, representada por S(t). • S(t) é definida como a probabilidade que um indivíduo sobreviva além do tempo t. • Igualmente, para um dado t, S(t) especifica a proporção de indivíduos que ainda não falharam. • Se T é uma variável aleatória contínua que representa o tempo de sobrevivência: • S(t) = P(T > t)
  7. 7. O gráfico de S(t) versus t é chamado de curva de sobrevida (ou sobrevivência).
  8. 8. t to t+n nqt lt S(t) 0-1 0,01260 100.000 1,0000 1-2 0,00093 98.740 0,9874 2-3 0,00065 98.648 0,9865 3-4 0,00050 98.584 0,9858 4-5 0,00040 98.535 0,9854 5-6 0,00037 98.495 0,9850 ... ... ... ... • t to t+n: tempos de sobrevivência agrupados em intervalos fixos de tempo • nqt: é a proporção de pacientes vivos no tempo t e que falharam antes de t + n (função de azar / hazard function) • : número de indivíduos vivos no tempo t • 0: número de indivíduos vivos no tempo 0 • ( ): / 0 (função de sobrevivência) MÉTODO DA TABELA DE SOBREVIVÊNCIA Passos: Complete US Life Table for individuals less than 30 years of age, 1979 – 1981
  9. 9. CURVA DE SOBREVIVÊNCIA • A tabela de sobrevivência apresentada é corrente ou transversal • É construída com dados coletados em um período relativamente curto de tempo • As pessoas representadas nos diferentes intervalos não são o mesmo grupo de indivíduos ao longo do tempo
  10. 10. MÉTODO DA TABELA DE SOBREVIVÊNCIA • O ideal seria trabalhar com uma tabela de sobrevivência longitudinal. • Este tipo de tabela acompanha uma coorte de indivíduos ao longo de suas vidas. • Esse método não é prático para grandes estudos populacionais, porque envolveria acompanhar um grande número de indivíduos por 100 anos ou mais. • Pode ser usado em estudos clínicos menores, em que pacientes são arrolados sequencialmente e seguidos por períodos mais curtos de tempo.
  11. 11. t to t+n nqt lt 1 – nqt Ŝ(t) 0-1 0,0000 12 1,0000 1,0000 1-2 0,0000 12 1,0000 1,0000 2-3 0,0833 12 0,9167 0,9167 3-4 0,0909 11 0,9091 0,8333 4-5 0,0000 10 1,0000 0,8333 5-6 0,0000 10 1,0000 0,8333 6-7 0,2000 10 0,8000 0,6667 7-8 0,1250 8 0,8750 0,5833 8-9 0,0000 7 1,0000 0,5833 9-10 0,0000 7 1,0000 0,5833 10-11 0,1429 7 0,8571 0,5000 ... ... ... ... ... Patient number Survival (months) 1 2 2 3 3 6 4 6 5 7 6 10 7 15 8 15 9 16 10 27 11 30 12 32 LONGITUDINAL LIFE TABLE Interval from primary AIDS diagnosis until death for a sample of 12 hemophiliac patients at most 40 years of age at HIV seroconversion Life table method of estimating S(t) for hemophiliac patients at most 40 years of age at HIV seroconversion 1/12 = 0,0833 1/11 = 0,0909 2/10 = 0,2000
  12. 12. CALCULANDO Ŝ(t) •
  13. 13. • • CALCULANDO Ŝ(t), CONT.
  14. 14. MÉTODO DA TABELA DE SOBREVIVÊNCIA CURVA DE SOBREVIVÊNCIA LONGITUDINAL Uma curva de sobrevivência pode ser aproximada ao plotar a função de sobrevivência Ŝ(t) versus o ponto representando o início de cada intervalo. Os pontos são então conectados com linhas retas.
  15. 15. O MÉTODO PRODUTO-LIMITE (KAPLAN-MEIER) • Com o método da tabela de sobrevivência, a função de sobrevivência estimada Ŝ(t) só se modifica em intervalos de tempo em que há ao menos uma morte. • Em bancos de dados menores, como o dos 12 hemofílicos com AIDS, existem diversos intervalos sem uma morte sequer. • Nestas circunstâncias, pode não ser ideal apresentar a função de sobrevivência desta maneira. • O método produto-limite (Kaplan-Meier) é uma técnica não-paramétrica que utiliza o tempo de sobrevivência exato de cada indivíduo na amostra (em vez de agrupar os tempos de sobrevivência em intervalos).
  16. 16. PRODUCT-LIMIT METHOD OF ESTIMATING Ŝ(t) FOR HEMOPHILIAC PATIENTS AT MOST 40 YEARS OF AGE AT HIV SEROCONVERSION Time qt 1 – qt Ŝ(t) 0 0,0000 1,0000 1,0000 2 0,0833 0,9167 0,9167 3 0,0909 0,9091 0,8333 6 0,2000 0,8000 0,6667 7 0,1250 0,8750 0,5833 10 0,1429 0,8751 0,5000 15 0,3333 0,6667 0,3333 16 0,2500 0,7500 0,2500 27 0,3333 0,6667 0,1667 30 0,5000 0,5000 0,0833 32 1,0000 0,0000 0,0000 Tempo exato de falha % pacientes que falham no tempo t % pacientes que não falham no tempo t Função de sobrevivência
  17. 17. MÉTODO DE KAPLAN-MEIER CURVA DE SOBREVIVÊNCIA LONGITUDINAL Ŝ(t) se modifica precisamente quando um sujeito falha; assume-se que ela se mantém constante no período entre as falhas.
  18. 18. MÉTODO DE KAPLAN-MEIER CURVA DE SOBREVIVÊNCIA LONGITUDINAL Ŝ(t) é uma mera estimativa da verdadeira função de sobrevivência , pois representa os achados de uma amostra. Para quantificar a variação amostral, calcula-se o erro padrão de Ŝ(t) e constrói-se um intervalo de confiança de 95% para as curvas de sobrevivência.
  19. 19. • O método de Kaplan-Meier pode ser ajustado para considerar as informações parciais sobre o tempo de sobrevivência oriundas de informações censuradas. • Suponha que no momento da análise dos dados dos 12 hemofílicos com AIDS, dois pacientes ainda estivessem vivos. OBSERVAÇÕES CENSURADAS Interval from primary AIDS diagnosis until death for a sample of 12 hemophiliac patients at most 40 years of age at HIV seroconversion, censored observations included Patient number Survival (months) 1 2 2 3+ 3 6 4 6 5 7 6 10+ 7 15 8 15 9 16 10 27 11 30 12 32
  20. 20. PRODUCT-LIMIT METHOD OF ESTIMATING Ŝ(t) FOR HEMOPHILIAC PATIENTS AT MOST 40 YEARS OF AGE AT HIV SEROCONVERSION Time qt 1 – qt Ŝ(t) 0 0,0000 1,0000 1,0000 2 0,0833 0,9167 0,9167 3 0,0000 1,0000 0,9167 6 0,2000 0,8000 0,7333 7 0,1250 0,8750 0,6417 10 0,0000 1,0000 0,6417 15 0,3333 0,6667 0,4278 16 0,2500 0,7500 0,3208 27 0,3333 0,6667 0,2139 30 0,5000 0,5000 0,1069 32 1,0000 0,0000 0,0000 Tempo exato de falha % pacientes que falham no tempo t % pacientes que não falham no tempo t Função de sobrevivência
  21. 21. MÉTODO DE KAPLAN-MEIER CURVA DE SOBREVIVÊNCIA LONGITUDINAL OBSERVAÇÕES CENSURADAS INCLUÍDAS
  22. 22. INTERVAL FROM PRIMARY AIDS DIAGNOSIS UNTIL DEATH FOR A SAMPLE OF 21 HEMOPHILIAC PATIENTS, STRATIFIED BY AGE AT HIV SEROCONVERSION Age ≤ 40 years Age ≥ 40 years Patient number Survival (months) Patient number Survival (months) 1 2 1 1 2 3 2 1 3 6 3 1 4 6 4 1 5 7 5 2 6 10 6 3 7 15 7 3 8 15 8 9 9 16 9 22 10 27 11 30 12 32
  23. 23. SURVIVAL CURVES FOR TWO GROUPS OF HEMOPHILIAC PATIENTS, STRATIFIED BY AGE AT HIV SEROCONVERSION A probabilidade estimada de sobrevida é maior para os pacientes que eram mais jovens à época da soroconversão. Essa diferença entre as curvas é maior que o que seria esperado apenas por acaso (variação amostral)?
  24. 24. TESTE ESTATÍSTICO PARA COMPARAÇÃO DE TEMPOS MEDIANOS DE SOBREVIVÊNCIA • Se não houver observações censuradas em nenhum dos grupos, o teste de Mann- Whitney (também conhecido como Wilcoxon rank sum) pode ser utilizado para comparar as medianas de tempo de sobrevivência. • Se houver observações censuradas, no entanto, é preciso utilizar outras técnicas estatísticas. • Uma das técnicas disponíveis para comparar as distribuições de tempos de sobrevivência para duas populações distintas é o teste de log-rank.
  25. 25. O TESTE DE LOG-RANK • O racional do teste de log-rank é a construção de uma tabela da contingência 2 x 2 mostrando grupo (idade à soroconversão) versus sobrevivência (vivo/morto) para cada tempo t em que uma morte acontece. • Para t = 1 mês, por exemplo, nenhum dos pacientes mais jovens (0/12) morre, mas 4/9 pacientes mais velhos morrem. Grupo Falha Total Sim Não Idade ≤ 40 0 12 12 Idade ≥ 40 4 5 9 Total 4 17 21
  26. 26. TESTE DE LOG-RANK • O mesmo é feito para t = 2 e todos os outros tempos de sobrevivência • Uma vez que toda a sequência de tabelas 2 x 2 tenha sido gerada, a informação contida nas tabelas é acumulada utilizando o teste estatístico de Mantel-Haenszel. • Esta estatística compara o número observado de falhas em cada tempo com o número de falhas que seria esperado, caso não houvesse diferença na distribuição dos tempos de sobrevivência entre os grupos. • Se a hipótese nula for verdadeira, a estatística deste teste tem distribuição que se aproxima da distribuição qui-quadrado com 1 grau de liberdade.
  27. 27. SURVIVAL CURVES FOR TWO GROUPS OF HEMOPHILIAC PATIENTS, STRATIFIED BY AGE AT HIV SEROCONVERSION H0 : S≤40(t) = S>40(t) Log-rank test p = 0,025
  28. 28. PARÊNTESE: O MÉTODO DE MANTEL-HAENSZEL • Técnica utilizada para combinar informações de um número de tabelas 2 x 2. • Etapas: 1) Teste de Homogeneidade 2) Summary Odds Ratio 3) Intervalo de confiança do summary odds ratio 4) Teste de hipótese
  29. 29. ESTUDO AVALIANDO A RELAÇÃO ENTRE O CONSUMO DE CAFEÍNA E INFARTO NÃO-FATAL EM DUAS AMOSTRAS DE HOMENS COM MENOS DE 55 ANOS: 1559 FUMANTES E 937 NÃO-FUMANTES
  30. 30. ESTUDO AVALIANDO A RELAÇÃO ENTRE O CONSUMO DE CAFEÍNA E INFARTO NÃO-FATAL EM DUAS AMOSTRAS DE HOMENS COM MENOS DE 55 ANOS: 1559 FUMANTES E 937 NÃO-FUMANTES TOTAL Infarto do miocárdio Café Total Sim Não Sim 1394 147 1541 Não 755 200 955 Total 2149 347 2496
  31. 31. ESTUDO AVALIANDO A RELAÇÃO ENTRE O CONSUMO DE CAFEÍNA E INFARTO NÃO-FATAL EM DUAS AMOSTRAS DE HOMENS COM MENOS DE 55 ANOS: 1559 FUMANTES E 937 NÃO-FUMANTES
  32. 32. SURVIVAL CURVES FOR MODERATE-RISK BREAST CANCER PATIENTS IN TWO TREATMENT GROUPS H0 : SA(t) = SB(t) Log-rank test p = 0,88
  33. 33. SURVIVAL CURVES FOR MODERATE-RISK BREAST CANCER PATIENTS IN TWO TREATMENT GROUPS Premenopausal women Postmenopausal women H0 : SA(t) = SB(t) Log-rank test p = 0,052 H0 : SA(t) = SB(t) Log-rank test p = 0,086

×