Capítulo 27 Análise preditiva
27.1 Predição
27.1.1 O que são modelos preditivos clínicos?
Modelos preditivos clínicos combinam características do paciente, sinais, sintomas, exames ou outros preditores para estimar a probabilidade de um desfecho diagnóstico ou prognóstico.301
Modelos diagnósticos estimam a probabilidade de uma condição já estar presente no momento da avaliação, enquanto modelos prognósticos estimam a probabilidade de um evento ocorrer no futuro, dentro de um horizonte de tempo definido.301
27.1.2 Qual é a diferença entre predição diagnóstica e prognóstica?
Na predição diagnóstica, o desfecho de interesse corresponde ao estado atual do paciente, como a presença ou ausência de uma doença no momento da avaliação.301
Na predição prognóstica, o desfecho ainda não ocorreu: o modelo estima o risco de um evento futuro, como morte, recaída, internação, complicação ou resposta terapêutica em determinado período.301
Em modelos prognósticos, é fundamental definir claramente o horizonte de predição, pois prever risco em 30 dias, 1 ano ou 5 anos pode gerar interpretações clínicas muito diferentes.301
27.1.3 Como avaliar o desempenho de um modelo preditivo?
O desempenho de um modelo preditivo costuma ser avaliado principalmente por discriminação e calibração.301,302
Discriminação: Capacidade do modelo de diferenciar indivíduos que terão o evento daqueles que não terão, geralmente medida pelo índice C ou pela AUC.301,302
Calibração: Concordância entre os riscos preditos pelo modelo e as proporções observadas de eventos.301,302
A calibração é especialmente importante quando o modelo será usado para definir limiares de decisão clínica, como indicar ou não uma intervenção, exame ou tratamento.301
27.1.4 O que é validação de um modelo preditivo?
Validação interna avalia se o modelo mantém desempenho adequado dentro da mesma população usada em seu desenvolvimento, geralmente por bootstrap, validação cruzada ou divisão treino-teste.303
Validação externa avalia o desempenho do modelo em novos pacientes, coletados em outro período, outro centro, outra região ou outro sistema de saúde.303
A validação interna está mais relacionada ao risco de sobreajuste, enquanto a validação externa está relacionada à transportabilidade do modelo para novos contextos clínicos.303
27.1.5 Um modelo pode ser considerado definitivamente validado?
Não existe um modelo preditivo validado de forma definitiva, pois populações, práticas clínicas, medidas, equipamentos e padrões de cuidado variam entre locais e ao longo do tempo.303
Uma única validação externa representa apenas um retrato do desempenho do modelo em determinado cenário, com determinada população, em determinado momento.303
É mais adequado dizer que um modelo apresentou bom desempenho em uma validação específica do que afirmar que ele está universalmente validado.303
27.1.6 Por que a transportabilidade é um problema?
A transportabilidade de um modelo pode ser afetada por diferenças entre populações, como idade, gravidade da doença, prevalência do desfecho, critérios de inclusão e contexto assistencial.302,303
Também pode ser afetada por diferenças na forma de medir preditores e desfechos, como exames laboratoriais, métodos de imagem, julgamento clínico, protocolos locais e disponibilidade de recursos.302,303
Mesmo quando a discriminação permanece aparentemente estável, a calibração pode se deteriorar com o tempo, fenômeno conhecido como drift de calibração.302,303
27.1.7 Quais são os principais riscos metodológicos em modelos preditivos?
Entre os problemas comuns estão amostras pequenas, dados não representativos, ausência de validação externa, relato incompleto, seleção excessivamente orientada pelos dados, dicotomização de variáveis contínuas e tratamento inadequado de dados ausentes.301
O desenvolvimento de novos modelos deve ser evitado quando já existem modelos relevantes para o mesmo desfecho e população, pois muitas vezes é mais útil validar, atualizar, ampliar ou estudar o impacto de modelos existentes.301
27.1.8 Como melhorar o uso de modelos preditivos?
Estudos multicêntricos ajudam a avaliar a heterogeneidade de desempenho entre locais, populações e sistemas de saúde.303
Modelos promissores devem ser submetidos a validações externas repetidas, bem relatadas e em diferentes contextos clínicos.303
Antes da implementação local, recomenda-se validação no próprio serviço, com atenção especial à calibração.303
Após a implementação, o desempenho deve ser monitorado ao longo do tempo, com possibilidade de recalibração ou atualização quando o modelo deixar de refletir a realidade clínica atual.302,303
O pacote ggeffects304 fornece a função predict_response para calcular valores preditos marginais ou ajustados das variáveis de desfecho.
O pacote ggeffects304 fornece a função test_response para testar valores preditos marginais ou ajustados das variáveis de desfecho.
27.1.9 Como árvores de decisão são usadas para predição?
Utilizam padrões históricos para prever resultados futuros em novos registros.305
Identificam combinações de fatores que elevam ou reduzem o risco de um evento clínico.305
Podem ser aplicadas em diagnósticos médicos para prever subtipos de condições ou diferentes respostas terapêuticas.305
27.2 Interpretação e aplicação
27.2.1 Quais são as implicações do uso de árvores de decisão em predição?
Tornam os resultados mais compreensíveis para clínicos e pesquisadores, com regras “se-então” claras.305
Auxiliam na formulação de hipóteses clínicas e direcionamento de futuras pesquisas.305
Podem ser estendidas para predição de sobrevivência, subgrupos de tratamento e análise de custo-benefício.305
27.2.2 Por que o desempenho estatístico não basta?
Um modelo pode apresentar boa discriminação e calibração, mas ainda assim não melhorar decisões clínicas se suas predições não forem usadas de modo adequado.301,302
Por isso, além de avaliar desempenho estatístico, é necessário avaliar a utilidade clínica do modelo, isto é, se ele ajuda a escolher melhor entre intervir, investigar, acompanhar ou não tratar.301,302
A análise de curva de decisão contribui justamente para essa etapa, pois compara o benefício líquido do modelo com estratégias simples, como “tratar todos” ou “tratar ninguém”.306
27.3 Análise de curva de decisão
27.3.1 O que é a análise de curva de decisão?
- Análise de curva de decisão é um método para avaliar a utilidade clínica de modelos preditivos em comparação às estratégias padrão “tratar todos” ou “tratar ninguém”.307
27.3.2 O que significam os eixos da curva de decisão?
O eixo vertical mostra o benefício líquido, ganho obtido ao usar o modelo em relação às estratégias de referência. O eixo horizontal mostra a preferência, que corresponde ao limiar de decisão: a probabilidade mínima de evento a partir da qual se recomenda intervir.306
O limiar reflete o equilíbrio entre o risco de perder casos da doença e o risco de intervenções desnecessárias.306
27.3.3 Como interpretar o benefício líquido?
O benefício líquido é o número de verdadeiros positivos obtidos ajustado pelo “custo” dos falsos positivos, expresso na mesma unidade dos verdadeiros positivos.306
Quando a estratégia padrão é “tratar todos”, o benefício líquido também pode ser expresso como intervenções desnecessárias evitadas, facilitando a interpretação clínica.306
27.3.4 Por que é importante comparar sempre com “tratar todos” e “tratar nenhum”?
Porque essas duas estratégias são frequentemente plausíveis em contextos reais: tratar todos os pacientes de risco ou tratar nenhum.306
Um modelo ou teste só é considerado útil se apresentar maior benefício líquido do que ambas as estratégias, garantindo que realmente agrega valor clínico.306
Essa comparação evita que um modelo com bom AUC mas má calibração seja usado, já que pode apresentar net benefit inferior às estratégias padrão.306
27.3.5 Quais são os limites e usos da análise de curva de decisão?
A análise de curva de decisão não substitui uma análise de decisão completa ou uma avaliação de custo-efetividade, mas é mais simples e prática, exigindo apenas a definição de um intervalo de limiares de decisão razoáveis.306
Em situações claras (modelo com nenhum benefício ou benefício amplo), pode dispensar análises complexas.306
Em casos ambíguos, serve como primeiro passo antes de análises mais detalhadas.306
27.3.6 A análise de curva de decisão pode ser conduzida sem dados individuais de pacientes?
- Em modelos bem calibrados e com tamanho amostral adequado, a análise de curva de decisão pode ser realizada utilizando apenas estimativas sumárias (média e desvio-padrão).307
27.3.7 Como funciona o cálculo do benefício líquido?
- O benefício líquido é estimado contrastando verdadeiros positivos e falsos positivos em diferentes limiares de decisão.307
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,