Capítulo 22 Análise preditiva

22.1 Predição

22.1.1 O que são predições?

.^REF?

O pacote ggeffects²⁴¹ fornece a função predict_response para calcular valores preditos marginais ou ajustados das variáveis de desfecho.

O pacote ggeffects²⁴¹ fornece a função test_response para testar valores preditos marginais ou ajustados das variáveis de desfecho.

22.1.2 Como árvores de decisão são usadas para predição?

Utilizam padrões históricos para prever resultados futuros em novos registros.²⁴² Identificam combinações de fatores que elevam ou reduzem o risco de um evento clínico.²⁴²
Podem ser aplicadas em diagnósticos médicos para prever subtipos de condições ou diferentes respostas terapêuticas.²⁴²

22.2 Interpretação e aplicação

22.2.1 Quais são as implicações do uso de árvores de decisão em predição?

Tornam os resultados mais compreensíveis para clínicos e pesquisadores, com regras “se-então” claras.²⁴²
Auxiliam na formulação de hipóteses clínicas e direcionamento de futuras pesquisas.²⁴²
Podem ser estendidas para predição de sobrevivência, subgrupos de tratamento e análise de custo-benefício.²⁴²

22.3 Análise de curva de decisão

22.3.1 O que é a análise de curva de decisão?

Análise de curva de decisão é um método para avaliar a utilidade clínica de modelos preditivos em comparação às estratégias padrão “tratar todos” ou “tratar ninguém”.²⁴³

22.3.2 O que significam os eixos da curva de decisão?

O eixo vertical mostra o benefício líquido, ganho obtido ao usar o modelo em relação às estratégias de referência. O eixo horizontal mostra a preferência, que corresponde ao limiar de decisão: a probabilidade mínima de evento a partir da qual se recomenda intervir.²⁴⁴
O limiar reflete o equilíbrio entre o risco de perder casos da doença e o risco de intervenções desnecessárias.²⁴⁴

22.3.3 Como interpretar o benefício líquido?

O benefício líquido é o número de verdadeiros positivos obtidos ajustado pelo “custo” dos falsos positivos, expresso na mesma unidade dos verdadeiros positivos.²⁴⁴
Quando a estratégia padrão é “tratar todos”, o benefício líquido também pode ser expresso como intervenções desnecessárias evitadas, facilitando a interpretação clínica.²⁴⁴

22.3.4 Por que é importante comparar sempre com “tratar todos” e “tratar nenhum”?

Porque essas duas estratégias são frequentemente plausíveis em contextos reais: tratar todos os pacientes de risco ou tratar nenhum.²⁴⁴
Um modelo ou teste só é considerado útil se apresentar maior benefício líquido do que ambas as estratégias, garantindo que realmente agrega valor clínico.²⁴⁴
Essa comparação evita que um modelo com bom AUC mas má calibração seja usado, já que pode apresentar net benefit inferior às estratégias padrão.²⁴⁴

22.3.5 Quais são os limites e usos da análise de curva de decisão?

A análise de curva de decisão não substitui uma análise de decisão completa ou uma avaliação de custo-efetividade, mas é mais simples e prática, exigindo apenas a definição de um intervalo de limiares de decisão razoáveis.²⁴⁴
Em situações claras (modelo com nenhum benefício ou benefício amplo), pode dispensar análises complexas.²⁴⁴
Em casos ambíguos, serve como primeiro passo antes de análises mais detalhadas.²⁴⁴

22.3.6 A análise de curva de decisão pode ser conduzida sem dados individuais de pacientes?

Em modelos bem calibrados e com tamanho amostral adequado, a análise de curva de decisão pode ser realizada utilizando apenas estimativas sumárias (média e desvio-padrão).²⁴³

22.3.7 Como funciona o cálculo do benefício líquido?

O benefício líquido é estimado contrastando verdadeiros positivos e falsos positivos em diferentes limiares de decisão.²⁴³

Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,

Referências

241.

Lüdecke D. ggeffects: Tidy Data Frames of Marginal Effects from Regression Models. Journal of Open Source Software. 2018;3:772. doi:10.21105/joss.00772

242.

Song YY, Lu Y. Decision tree methods: applications for classification and prediction. Shanghai archives of psychiatry. 2015;27(2):130–135. doi:10.11919/j.issn.1002-0829.215044

243.

Hozo I, Guyatt G, Djulbegovic B. Decision curve analysis based on summary data. Journal of Evaluation in Clinical Practice. 2023;30(2):281–289. doi:10.1111/jep.13945

244.

Vickers AJ, Calster B van, Steyerberg EW. A simple, step-by-step guide to interpreting decision curve analysis. Diagnostic and Prognostic Research. 2019;3(1). doi:10.1186/s41512-019-0064-7