Capítulo 23 Análise causal


23.1 Causalidade


23.1.1 O que é análise causal?

  • Análise causal é usada para explicar a relação entre causa e efeito em um conjunto de dados, respondendo a perguntas do tipo “por quê?”.208

  • Análise causal implica em contrafactual, no sentido de que a análise causal é baseada na comparação entre o que realmente aconteceu e o que teria acontecido se uma ou mais variáveis tivessem sido diferentes.208

  • Análise causal refere-se ao processo conceitual e analítico, enquanto inferência causal diz respeito às conclusões extraídas a partir de dados.REF?


23.1.2 Quais os dois grandes tipos de causalidade?

  • Baseada em experiência: conhecimento empírico, muitas vezes sem compreensão dos mecanismos. Estatística tem papel central na causalidade baseada em experiência.245

  • Mecanicista: busca entender processos internos e mecanismos. Estatística tem seu papel ainda limitado, mas crescente, especialmente em sistemas complexos.245


23.1.3 Como realizar uma análise causal?

  • Formular explicitamente uma pergunta causal, definindo qual intervenção hipotética está sendo considerada e qual efeito se deseja estimar.REF?

  • Especificar a ordem temporal entre exposição, desfecho e demais variáveis, assegurando que a causa preceda o efeito.REF?

  • Tornar explícitas as suposições causais sobre o sistema em estudo, preferencialmente por meio de um diagrama causal (DAG).REF?

  • Identificar confundidores, mediadores e colisores com base na estrutura causal assumida, e não apenas em critérios estatísticos.REF?

  • Definir o conjunto mínimo de ajuste necessário para bloquear caminhos espúrios entre exposição e desfecho.REF?

  • Escolher métodos estatísticos compatíveis com a pergunta causal (ex.: regressão ajustada, ponderação por escore de propensão, g-methods), reconhecendo que o método não cria causalidade.REF?

  • Avaliar limitações como confundimento residual, viés de seleção e erro de medida, discutindo seu impacto potencial nas inferências.REF?

  • Interpretar os resultados em termos causais explícitos, distinguindo claramente associação de efeito causal.REF?


23.2 Abordagens filosóficas e estatísticas da causalidade


23.2.1 O que é realidade causal?

  • A estatística assume tanto a presença do acaso quanto de causalidade. Entretanto, a natureza de cada um (se essencial ou apenas reflexo de ignorância) é raramente debatida.245


23.2.2 Por que estatísticos historicamente evitaram falar em causalidade?

  • Pearson e Fisher defenderam que estatística trata apenas de associação, não de causalidade, o que gerou cautela excessiva e paralisou avanços em áreas como economia e ciências sociais.245

  • Autores como Judea Pearl, Robins e Rubin trouxeram definições mais precisas, especialmente via modelos contrafactuais.245

  • O uso de ensaios clínicos randomizados consolidou o papel da estatística em inferência causal aplicada.245


23.3 Ilusões de causalidade


23.3.1 O que são ilusões de causalidade?

  • Ocorrem quando acreditamos que há uma relação causal entre dois eventos que, na realidade, são independentes. São comuns em superstições, pseudociências e crenças do cotidiano.246


23.3.2 Quais fatores favorecem a ilusão?

  • Alta frequência do desfecho: quando o resultado ocorre frequentemente por acaso, as pessoas superestimam a eficácia da causa (ex.: melhora espontânea de sintomas atribuída a um tratamento).246

  • Alta frequência da causa: quanto mais vezes um comportamento ou tratamento é aplicado, mais coincidências com o desfecho ocorrem, aumentando a crença no efeito.246

  • Coincidências causa–desfecho: damos peso desproporcional a casos em que causa e efeito ocorrem juntos, mesmo que sejam apenas coincidências.246


23.3.3 Como reduzir ilusões de causalidade?

  • Ensinar princípios de controle científico, observando casos em que a causa está ausente (comparação necessária para detectar ausência de relação).246

  • Diminuir a frequência da causa (ex.: reduzir uso de um “remédio ineficaz” ajuda a perceber que o resultado ocorre independentemente).246

  • Instruções explícitas para testar hipóteses: orientar a aplicar a causa em apenas 50% das vezes favorece a detecção correta da ausência de efeito.246

  • Promover educação científica prática, mostrando às pessoas como seus próprios julgamentos podem ser enviesados e oferecendo ferramentas para avaliação crítica.246


23.4 Inferência causal em estudos observacionais


23.4.1 Como diferenciar associação de causalidade?

  • Associação descreve que duas variáveis variam juntas, mas não garante que uma afete a outra.247

  • Causalidade exige evidências (diretas ou indiretas) de que modificar a variável de exposição altera o desfecho.247


23.4.2 Quais critérios ajudam a sustentar inferência causal?

  • Existência de um mecanismo plausível.247

  • Controle adequado de confundidores (medidos e não medidos).247

  • Consistência com literatura prévia e plausibilidade do tamanho do efeito.247

  • Avaliação de alternativas explicativas (ex.: viés de seleção, mediadores não controlados).247


23.4.3 Qual o papel dos caminhos causais (DAGs)?

  • Ajudam a identificar quais variáveis precisam ser medidas e ajustadas.247

  • Evitam ajustes indevidos (ex.: em colisores), que podem introduzir viés.247


23.4.4 Como lidar com confundimento residual?

  • Reconhecer que modelos multivariados e escores de propensão não eliminam completamente o confundimento.247

  • Comparar características basais entre grupos para identificar diferenças persistentes.247

  • Considerar análises de sensibilidade, mas com cautela na interpretação.247


23.5 Critérios de Hill para inferência causal


23.5.1 Quais são os nove critérios?

  • Temporalidade: A exposição deve preceder o desfecho. Único critério considerado essencial por Hill.248

  • Força da associação: Associações mais fortes são mais prováveis de refletir causalidade.248

  • Consistência: A associação é observada em diferentes estudos, populações e contextos.248

  • Especificidade: Uma exposição leva a um efeito específico (embora nem sempre aplicável).248

  • Gradiente biológico (dose–resposta): Aumentos na exposição acompanham aumentos no risco.248

  • Plausibilidade biológica: Compatibilidade com o conhecimento científico da época.248

  • Coerência: A associação não deve contradizer a história natural ou biologia da doença.248

  • Evidência experimental: Reduções na exposição devem reduzir o risco observado.248

  • Analogia: Comparação com relações causais já conhecidas.248


23.5.2 Hill propôs um checklist rígido?

  • Nenhum critério, isoladamente, prova ou refuta causalidade. Devem ser usados como guias para reflexão científica, não como requisitos obrigatórios.248


23.6 Críticas contemporâneas aos critérios de Hill


23.6.1 Qual critério é indispensável?

  • A temporalidade: a exposição deve preceder o desfecho. Mesmo assim, observar uma ordem temporal inversa apenas invalida a hipótese em casos específicos, não em todos.249


23.6.2 A força da associação garante causalidade?

  • Não. Associações fortes podem ainda ser não-causais e associações fracas podem ser causais.249


23.6.3 A consistência é indispensável?

  • Não. A ausência de consistência não elimina causalidade, pois alguns efeitos só se manifestam em condições específicas (ex.: transfusão só causa HIV se o vírus estiver presente).249

  • A consistência ajuda apenas a afastar a hipótese de viés ou erro em um estudo isolado:contentReference.249


23.6.4 O critério da especificidade é válido?

  • Não. É considerado um critério inválido e enganoso. Uma causa pode ter múltiplos efeitos (tabagismo → vários desfechos) e um efeito pode ter múltiplas causas.249


23.6.5 O gradiente biológico (dose–resposta) é confiável?

  • Nem sempre. Pode ser distorcido por confundimento. A ausência de gradiente não invalida a causalidade.249


23.6.6 A plausibilidade e a coerência são objetivas?

  • Não. Ambas são fortemente dependentes do conhecimento científico da época. O que parecia implausível no passado depois se confirmou como verdadeiro.249


23.6.7 Evidência experimental é decisiva?

  • Pode ser útil, mas raramente está disponível em epidemiologia. Mesmo quando disponível, pode ter explicações alternativas.249


23.6.8 Analogia é útil?

  • Tem pouco valor. Analogias podem sempre ser inventadas e, na prática, funcionam mais como fonte de hipóteses do que como prova.249


23.7 Visão atual sobre os critérios de Hill


23.7.1 Como os critérios de Hill foram revisitados?

  • Estudos recentes propõem integrá-los a três abordagens modernas: DAG (destacam estrutura causal e confundimento), modelos de causa suficiente (enfatizam multifatorialidade) e GRADE (orienta sobre a certeza da evidência em corpos de estudos).250


23.7.2 Quais mudanças na interpretação?

  • Temporalidade e experimentos: seguem centrais, mas analisados com mais sofisticação.250

  • Força da associação: relevante, mas não garante causalidade (pode haver confundimento).250

  • Consistência: pensada como transportabilidade entre populações.250

  • Especificidade: pouco útil hoje; substituída por falsificação (controles negativos).250

  • Dose–resposta: pode ser espúria, cautela é necessária.250

  • Coerência e analogia: utilidade limitada.250


23.8 Linguagem causal em estudos observacionais


23.8.1 Quais são as principais recomendações para relatar causalidade?

  • Usar termos causais de forma explícita e criteriosa (“causa”, “efeito”, “reduzir”, “aumentar”), evitando expressões ambíguas como “fator de risco”.247

  • Contextualizar a causalidade em termos práticos, explicando por que identificar a causa é relevante para intervenções.247

  • Declarar claramente na introdução se existe hipótese causal, justificando quando não houver.247

  • Descrever caminhos causais (mediadores, confundidores, colisores) em texto claro ou com diagramas.247

  • Justificar a seleção de covariáveis com base nas relações causais previstas.247

  • Avaliar o controle de confundimento, reconhecendo limitações e possível confundimento residual.247

  • Discutir as inferências causais considerando estimativas, vieses e plausibilidade biológica.247

  • Indicar recomendações específicas para pesquisas futuras ou prática clínica baseadas nas conclusões causais.247


23.9 Efeitos diretos e indiretos


23.9.1 Como distinguir efeitos diretos de indiretos?

  • Um efeito direto ocorre quando uma variável influencia outra sem mediação.245

  • Um efeito indireto acontece quando a influência é mediada por variáveis intermediárias.245


23.10 O papel do tempo e a causalidade dinâmica


23.10.1 O que é causalidade de Granger?

  • É um conceito estatístico que analisa como processos passados influenciam o futuro, indo além da simples associação.245

  • Permite identificar relações direcionais entre processos ao longo do tempo (ex.: cérebro controlando contrações musculares).245

  • A estatística, nesse contexto, busca “olhar dentro da caixa”, aproximando-se de uma visão mecanicista.245


23.10.2 Por que o tempo é essencial na análise causal?

  • Processos causais não ocorrem de forma estática: efeitos diretos e indiretos se acumulam em cadeias temporais.245

  • Modelos tradicionais (ex.: regressões estáticas ou DAGs sem tempo) podem falhar em capturar a dinâmica.245

  • A integração de séries temporais e processos estocásticos é fundamental para compreender mecanismos.245


23.11 Diagrama acíclico direcionado (DAG)


23.11.1 O que são DAGs?

  • DAGs são representações gráficas de relações causais entre variáveis, usando nós (variáveis) e arestas direcionadas (relações causais).REF?

  • DAGs ajudam a identificar confundidores, mediadores e colisores, orientando a seleção de variáveis para ajuste em análises estatísticas.REF?

  • DAGs são acíclicos, ou seja, não permitem ciclos ou loops, refletindo a natureza unidirecional das relações causais.REF?


23.11.2 Quais são os padrões causais básicos?

  • Independência: duas variáveis não têm relação causal direta ou indireta.REF?

  • Cadeia: uma variável causa outra, que por sua vez causa uma terceira (X → M → Y).REF?

  • Garfo: uma variável causa duas outras (X ← Z → Y), onde Z é um confundidor.REF?

  • Colisor: duas variáveis causam uma terceira (X → Z ← Y), onde Z é um colisor.REF?


Padrões causais básicos: independência, cadeia, garfo e colisor.

Figura 23.1: Padrões causais básicos: independência, cadeia, garfo e colisor.


23.11.3 Quais são as regras básicas para análise causal?

  • Variáveis causalmente independentes tendem a não ser correlacionadas, exceto na presença de confundimento ou viés de seleção.REF?

  • Influência causal pode criar correlação estatística, mas correlação não é condição necessária nem suficiente para causalidade.REF?

  • Confundimento cria correlação espúria entre exposição e desfecho, mesmo na ausência de efeito causal direto.REF?

  • Aleatorização protege a variável de exposição contra influência causal de fatores antecedentes, reduzindo confundimento pré-exposição.REF?


23.11.4 Quais são as regras básicas para ajuste?

  • Controlar por um confundidor bloqueia caminhos causais espúrios e reduz viés na estimativa do efeito causal.REF?

  • Controlar por um mediador bloqueia parte ou todo o efeito causal total, sendo inadequado quando o objetivo é estimar o efeito total da exposição.REF?

  • Controlar por um colisor cria correlação espúria entre as variáveis que o causam, introduzindo viés mesmo quando não havia associação prévia.REF?

  • Controlar por uma variável descendente de um colisor pode reabrir parcialmente caminhos espúrios, produzindo viés de seleção.REF?






Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

208.
Gerring J. Mere Description. British Journal of Political Science. 2012;42(4):721–746. doi:10.1017/s0007123412000130
245.
AALEN OO, FRIGESSI A. What can Statistics Contribute to a Causal Understanding? Scandinavian Journal of Statistics. 2007;34(1):155–168. doi:10.1111/j.1467-9469.2006.00549.x
246.
Matute H, Blanco F, Yarritu I, Díaz-Lago M, Vadillo MA, Barberia I. Illusions of causality: how they bias our everyday thinking and how they could be reduced. Frontiers in Psychology. 2015;6. doi:10.3389/fpsyg.2015.00888
247.
Vickers AJ, Assel M, Dunn RL, et al. Guidelines for Reporting Observational Research in Urology: The Importance of Clear Reference to Causality. European Urology. 2023;84(2):147–151. doi:10.1016/j.eururo.2023.04.027
248.
Hill AB. The Environment and Disease: Association or Causation? Proceedings of the Royal Society of Medicine. 1965;58(5):295–300. doi:10.1177/003591576505800503
249.
Rothman KJ, Greenland S. H ill’s Criteria for Causality. Encyclopedia of Biostatistics. fevereiro 2005. doi:10.1002/0470011815.b2a03072
250.
Shimonovich M, Pearce A, Thomson H, Keyes K, Katikireddi SV. Assessing causality in epidemiology: revisiting Bradford Hill to incorporate developments in causal thinking. European Journal of Epidemiology. 2020;36(9):873–887. doi:10.1007/s10654-020-00703-7
251.
Textor J, Zander B van der, Gilthorpe MS, Liskiewicz M, Ellison GT. Robust causal inference using directed acyclic graphs: the R package dagitty. International Journal of Epidemiology. 2016;45:1887–1894. doi:10.1093/ije/dyw341
252.
Barrett M. ggdag: Analyze and Create Elegant Directed Acyclic Graphs.; 2024. https://CRAN.R-project.org/package=ggdag.
253.
Lüdecke D, Ben-Shachar MS, Patil I, Waggoner P, Makowski D. performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software. 2021;6:3139. doi:10.21105/joss.03139