Capítulo 37 Análise causal

37.1 Causalidade

37.1.1 O que é análise causal?

Análise causal é usada para explicar a relação entre causa e efeito em um conjunto de dados, respondendo a perguntas do tipo “por quê?”.¹⁸³
Análise causal implica em contrafactual, no sentido de que a análise causal é baseada na comparação entre o que realmente aconteceu e o que teria acontecido se uma ou mais variáveis tivessem sido diferentes.¹⁸³

37.1.2 Quais os dois grandes tipos de causalidade?

Baseada em experiência: conhecimento empírico, muitas vezes sem compreensão dos mecanismos. Estatística tem papel central na causalidade baseada em experiência.³⁰⁰
Mecanicista: busca entender processos internos e mecanismos. Estatística tem seu papel ainda limitado, mas crescente, especialmente em sistemas complexos.³⁰⁰

37.2 Abordagens filosóficas e estatísticas da causalidade

37.2.1 O que é realidade causal?

A estatística assume tanto a presença do acaso quanto de causalidade. Entretanto, a natureza de cada um (se essencial ou apenas reflexo de ignorância) é raramente debatida.³⁰⁰

37.2.2 Por que estatísticos historicamente evitaram falar em causalidade?

Pearson e Fisher defenderam que estatística trata apenas de associação, não de causalidade, o que gerou cautela excessiva e paralisou avanços em áreas como economia e ciências sociais.³⁰⁰
Autores como Judea Pearl, Robins e Rubin trouxeram definições mais precisas, especialmente via modelos contrafactuais.³⁰⁰
O uso de ensaios clínicos randomizados consolidou o papel da estatística em inferência causal aplicada.³⁰⁰

37.3 Inferência causal em estudos observacionais

37.3.1 Como diferenciar associação de causalidade?

Associação descreve que duas variáveis variam juntas, mas não garante que uma afete a outra.³⁰¹
Causalidade exige evidências (diretas ou indiretas) de que modificar a variável de exposição altera o desfecho.³⁰¹

37.3.2 Quais critérios ajudam a sustentar inferência causal?

Existência de um mecanismo plausível.³⁰¹
Controle adequado de confundidores (medidos e não medidos).³⁰¹
Consistência com literatura prévia e plausibilidade do tamanho do efeito.³⁰¹
Avaliação de alternativas explicativas (ex.: viés de seleção, mediadores não controlados).³⁰¹

37.3.3 Qual o papel dos caminhos causais (DAGs)?

Ajudam a identificar quais variáveis precisam ser medidas e ajustadas.³⁰¹
Evitam ajustes indevidos (ex.: em colisores), que podem introduzir viés.³⁰¹

37.3.4 Como lidar com confundimento residual?

Reconhecer que modelos multivariados e escores de propensão não eliminam completamente o confundimento.³⁰¹
Comparar características basais entre grupos para identificar diferenças persistentes.³⁰¹
Considerar análises de sensibilidade, mas com cautela na interpretação.³⁰¹

37.4 Critérios de Hill para inferência causal

37.4.1 Quais são os nove critérios?

Temporalidade: A exposição deve preceder o desfecho. Único critério considerado essencial por Hill.³⁰²
Força da associação: Associações mais fortes são mais prováveis de refletir causalidade.³⁰²
Consistência: A associação é observada em diferentes estudos, populações e contextos.³⁰²
Especificidade: Uma exposição leva a um efeito específico (embora nem sempre aplicável).³⁰²
Gradiente biológico (dose–resposta): Aumentos na exposição acompanham aumentos no risco.³⁰²
Plausibilidade biológica: Compatibilidade com o conhecimento científico da época.³⁰²
Coerência: A associação não deve contradizer a história natural ou biologia da doença.³⁰²
Evidência experimental: Reduções na exposição devem reduzir o risco observado.³⁰²
Analogia: Comparação com relações causais já conhecidas.³⁰²

37.4.2 Hill propôs um checklist rígido?

Nenhum critério, isoladamente, prova ou refuta causalidade. Devem ser usados como guias para reflexão científica, não como requisitos obrigatórios.³⁰²

37.5 Críticas contemporâneas aos critérios de Hill

37.5.1 Qual critério é indispensável?

A temporalidade: a exposição deve preceder o desfecho. Mesmo assim, observar uma ordem temporal inversa apenas invalida a hipótese em casos específicos, não em todos.³⁰³

37.5.2 A força da associação garante causalidade?

Não. Associações fortes podem ainda ser não-causais e associações fracas podem ser causais.³⁰³

37.5.3 A consistência é indispensável?

Não. A ausência de consistência não elimina causalidade, pois alguns efeitos só se manifestam em condições específicas (ex.: transfusão só causa HIV se o vírus estiver presente).³⁰³
A consistência ajuda apenas a afastar a hipótese de viés ou erro em um estudo isolado:contentReference.³⁰³

37.5.4 O critério da especificidade é válido?

Não. É considerado um critério inválido e enganoso. Uma causa pode ter múltiplos efeitos (tabagismo → vários desfechos) e um efeito pode ter múltiplas causas.³⁰³

37.5.5 O gradiente biológico (dose–resposta) é confiável?

Nem sempre. Pode ser distorcido por confundimento. A ausência de gradiente não invalida a causalidade.³⁰³

37.5.6 A plausibilidade e a coerência são objetivas?

Não. Ambas são fortemente dependentes do conhecimento científico da época. O que parecia implausível no passado (ex.: transmissão de tifo por piolhos) depois se confirmou como verdadeiro.³⁰³

37.5.7 Evidência experimental é decisiva?

Pode ser útil, mas raramente está disponível em epidemiologia. Mesmo quando disponível, pode ter explicações alternativas.³⁰³

37.5.8 Analogia é útil?

Tem pouco valor. Analogias podem sempre ser inventadas e, na prática, funcionam mais como fonte de hipóteses do que como prova.³⁰³

37.6 Visão atual sobre os critérios de Hill

37.6.1 Como os critérios de Hill foram revisitados?

Estudos recentes propõem integrá-los a três abordagens modernas: DAG (destacam estrutura causal e confundimento), modelos de causa suficiente (enfatizam multifatorialidade) e GRADE (orienta sobre a certeza da evidência em corpos de estudos).³⁰⁴

37.6.2 Quais mudanças na interpretação?

Temporalidade e experimentos: seguem centrais, mas analisados com mais sofisticação.³⁰⁴
Força da associação: relevante, mas não garante causalidade (pode haver confundimento).³⁰⁴
Consistência: pensada como transportabilidade entre populações.³⁰⁴
Especificidade: pouco útil hoje; substituída por falsificação (controles negativos).³⁰⁴
Dose–resposta: pode ser espúria, cautela é necessária.³⁰⁴
Coerência e analogia: utilidade limitada.³⁰⁴

37.7 Linguagem causal em estudos observacionais

37.7.1 Quais são as principais recomendações para relatar causalidade?

Usar termos causais de forma explícita e criteriosa (“causa”, “efeito”, “reduzir”, “aumentar”), evitando expressões ambíguas como “fator de risco”.³⁰¹
Contextualizar a causalidade em termos práticos, explicando por que identificar a causa é relevante para intervenções.³⁰¹
Declarar claramente na introdução se existe hipótese causal, justificando quando não houver.³⁰¹
Descrever caminhos causais (mediadores, confundidores, colisores) em texto claro ou com diagramas.³⁰¹
Justificar a seleção de covariáveis com base nas relações causais previstas.³⁰¹
Avaliar o controle de confundimento, reconhecendo limitações e possível confundimento residual.³⁰¹
Discutir as inferências causais considerando estimativas, vieses e plausibilidade biológica.³⁰¹
Indicar recomendações específicas para pesquisas futuras ou prática clínica baseadas nas conclusões causais.³⁰¹

37.8 Efeitos diretos e indiretos

37.8.1 Como distinguir efeitos diretos de indiretos?

Um efeito direto ocorre quando uma variável influencia outra sem mediação.³⁰⁰
Um efeito indireto acontece quando a influência é mediada por variáveis intermediárias.³⁰⁰

37.9 O papel do tempo e a causalidade dinâmica

37.9.1 O que é Granger–Schweder Causality?

É um conceito estatístico que analisa como processos passados influenciam o futuro, indo além da simples associação.³⁰⁰
Permite identificar relações direcionais entre processos ao longo do tempo (ex.: cérebro controlando contrações musculares).³⁰⁰
A estatística, nesse contexto, busca “olhar dentro da caixa”, aproximando-se de uma visão mecanicista.³⁰⁰

37.9.2 Por que o tempo é essencial na análise causal?

Processos causais não ocorrem de forma estática: efeitos diretos e indiretos se acumulam em cadeias temporais.³⁰⁰
Modelos tradicionais (ex.: regressões estáticas ou DAGs sem tempo) podem falhar em capturar a dinâmica.³⁰⁰
A integração de séries temporais e processos estocásticos é fundamental para compreender mecanismos.³⁰⁰

37.10 Diagrama acíclico direcionado (DAG)

37.10.1 O que são DAGs?

DAGs são representações gráficas de relações causais entre variáveis, usando nós (variáveis) e arestas direcionadas (relações causais).^REF?
DAGs ajudam a identificar confundidores, mediadores e colisores, orientando a seleção de variáveis para ajuste em análises estatísticas.^REF?
DAGs são acíclicos, ou seja, não permitem ciclos ou loops, refletindo a natureza unidirecional das relações causais.^REF?

37.10.2 Quais são os padrões causais básicos?

Independência: duas variáveis não têm relação causal direta ou indireta.^REF?
Cadeia: uma variável causa outra, que por sua vez causa uma terceira (X → M → Y).^REF?
Garfo: uma variável causa duas outras (X ← Z → Y), onde Z é um confundidor.^REF?
Colisor: duas variáveis causam uma terceira (X → Z ← Y), onde Z é um colisor.^REF?

O pacote dagitty³⁰⁵ fornece a função dagitty para criar um objeto grafo a partir de uma descrição textual.

O pacote ggdag³⁰⁶ fornece a função ggdag para criar figuras de grafos.

O pacote performance²⁹⁷ fornece a função check_dag para criar, verificar e visualizar os modelos em grafos.

Figura 37.1: Padrões causais básicos: independência, cadeia, garfo e colisor.

Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,

Referências

183.

Gerring J. Mere Description. British Journal of Political Science. 2012;42(4):721–746. doi:10.1017/s0007123412000130

297.

Lüdecke D, Ben-Shachar MS, Patil I, Waggoner P, Makowski D. performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software. 2021;6:3139. doi:10.21105/joss.03139

300.

AALEN OO, FRIGESSI A. What can Statistics Contribute to a Causal Understanding? Scandinavian Journal of Statistics. 2007;34(1):155–168. doi:10.1111/j.1467-9469.2006.00549.x

301.

Vickers AJ, Assel M, Dunn RL, et al. Guidelines for Reporting Observational Research in Urology: The Importance of Clear Reference to Causality. European Urology. 2023;84(2):147–151. doi:10.1016/j.eururo.2023.04.027

302.

Hill AB. The Environment and Disease: Association or Causation? Proceedings of the Royal Society of Medicine. 1965;58(5):295–300. doi:10.1177/003591576505800503

303.

Rothman KJ, Greenland S. H ill’s Criteria for Causality. Encyclopedia of Biostatistics. fevereiro 2005. doi:10.1002/0470011815.b2a03072

304.

Shimonovich M, Pearce A, Thomson H, Keyes K, Katikireddi SV. Assessing causality in epidemiology: revisiting Bradford Hill to incorporate developments in causal thinking. European Journal of Epidemiology. 2020;36(9):873–887. doi:10.1007/s10654-020-00703-7

305.

Textor J, Zander B van der, Gilthorpe MS, Liskiewicz M, Ellison GT. Robust causal inference using directed acyclic graphs: the R package dagitty. International Journal of Epidemiology. 2016;45:1887–1894. doi:10.1093/ije/dyw341

306.

Barrett M. ggdag: Analyze and Create Elegant Directed Acyclic Graphs.; 2024. https://CRAN.R-project.org/package=ggdag.