Capítulo 22 Análise causal
22.1 Causalidade
22.1.1 O que é análise causal?
Análise causal é usada para explicar a relação entre causa e efeito em um conjunto de dados, respondendo a perguntas do tipo “por quê?”.204
Análise causal implica em contrafactual, no sentido de que a análise causal é baseada na comparação entre o que realmente aconteceu e o que teria acontecido se uma ou mais variáveis tivessem sido diferentes.204
22.1.2 Quais os dois grandes tipos de causalidade?
Baseada em experiência: conhecimento empírico, muitas vezes sem compreensão dos mecanismos. Estatística tem papel central na causalidade baseada em experiência.241
Mecanicista: busca entender processos internos e mecanismos. Estatística tem seu papel ainda limitado, mas crescente, especialmente em sistemas complexos.241
22.2 Abordagens filosóficas e estatísticas da causalidade
22.2.1 O que é realidade causal?
- A estatística assume tanto a presença do acaso quanto de causalidade. Entretanto, a natureza de cada um (se essencial ou apenas reflexo de ignorância) é raramente debatida.241
22.2.2 Por que estatísticos historicamente evitaram falar em causalidade?
Pearson e Fisher defenderam que estatística trata apenas de associação, não de causalidade, o que gerou cautela excessiva e paralisou avanços em áreas como economia e ciências sociais.241
Autores como Judea Pearl, Robins e Rubin trouxeram definições mais precisas, especialmente via modelos contrafactuais.241
O uso de ensaios clínicos randomizados consolidou o papel da estatística em inferência causal aplicada.241
22.3 Ilusões de causalidade
22.3.1 O que são ilusões de causalidade?
- Ocorrem quando acreditamos que há uma relação causal entre dois eventos que, na realidade, são independentes. São comuns em superstições, pseudociências e crenças do cotidiano.242
22.3.2 Quais fatores favorecem a ilusão?
Alta frequência do desfecho: quando o resultado ocorre frequentemente por acaso, as pessoas superestimam a eficácia da causa (ex.: melhora espontânea de sintomas atribuída a um tratamento).242
Alta frequência da causa: quanto mais vezes um comportamento ou tratamento é aplicado, mais coincidências com o desfecho ocorrem, aumentando a crença no efeito.242
Coincidências causa–desfecho: damos peso desproporcional a casos em que causa e efeito ocorrem juntos, mesmo que sejam apenas coincidências.242
22.3.3 Como reduzir ilusões de causalidade?
Ensinar princípios de controle científico, observando casos em que a causa está ausente (comparação necessária para detectar ausência de relação).242
Diminuir a frequência da causa (ex.: reduzir uso de um “remédio ineficaz” ajuda a perceber que o resultado ocorre independentemente).242
Instruções explícitas para testar hipóteses: orientar a aplicar a causa em apenas 50% das vezes favorece a detecção correta da ausência de efeito.242
Promover educação científica prática, mostrando às pessoas como seus próprios julgamentos podem ser enviesados e oferecendo ferramentas para avaliação crítica.242
22.4 Inferência causal em estudos observacionais
22.4.1 Como diferenciar associação de causalidade?
Associação descreve que duas variáveis variam juntas, mas não garante que uma afete a outra.243
Causalidade exige evidências (diretas ou indiretas) de que modificar a variável de exposição altera o desfecho.243
22.4.2 Quais critérios ajudam a sustentar inferência causal?
Existência de um mecanismo plausível.243
Controle adequado de confundidores (medidos e não medidos).243
Consistência com literatura prévia e plausibilidade do tamanho do efeito.243
Avaliação de alternativas explicativas (ex.: viés de seleção, mediadores não controlados).243
22.4.3 Qual o papel dos caminhos causais (DAGs)?
Ajudam a identificar quais variáveis precisam ser medidas e ajustadas.243
Evitam ajustes indevidos (ex.: em colisores), que podem introduzir viés.243
22.4.4 Como lidar com confundimento residual?
Reconhecer que modelos multivariados e escores de propensão não eliminam completamente o confundimento.243
Comparar características basais entre grupos para identificar diferenças persistentes.243
Considerar análises de sensibilidade, mas com cautela na interpretação.243
22.5 Critérios de Hill para inferência causal
22.5.1 Quais são os nove critérios?
Temporalidade: A exposição deve preceder o desfecho. Único critério considerado essencial por Hill.244
Força da associação: Associações mais fortes são mais prováveis de refletir causalidade.244
Consistência: A associação é observada em diferentes estudos, populações e contextos.244
Especificidade: Uma exposição leva a um efeito específico (embora nem sempre aplicável).244
Gradiente biológico (dose–resposta): Aumentos na exposição acompanham aumentos no risco.244
Plausibilidade biológica: Compatibilidade com o conhecimento científico da época.244
Coerência: A associação não deve contradizer a história natural ou biologia da doença.244
Evidência experimental: Reduções na exposição devem reduzir o risco observado.244
Analogia: Comparação com relações causais já conhecidas.244
22.5.2 Hill propôs um checklist rígido?
- Nenhum critério, isoladamente, prova ou refuta causalidade. Devem ser usados como guias para reflexão científica, não como requisitos obrigatórios.244
22.6 Críticas contemporâneas aos critérios de Hill
22.6.1 Qual critério é indispensável?
- A temporalidade: a exposição deve preceder o desfecho. Mesmo assim, observar uma ordem temporal inversa apenas invalida a hipótese em casos específicos, não em todos.245
22.6.2 A força da associação garante causalidade?
- Não. Associações fortes podem ainda ser não-causais e associações fracas podem ser causais.245
22.6.3 A consistência é indispensável?
Não. A ausência de consistência não elimina causalidade, pois alguns efeitos só se manifestam em condições específicas (ex.: transfusão só causa HIV se o vírus estiver presente).245
A consistência ajuda apenas a afastar a hipótese de viés ou erro em um estudo isolado:contentReference.245
22.6.4 O critério da especificidade é válido?
- Não. É considerado um critério inválido e enganoso. Uma causa pode ter múltiplos efeitos (tabagismo → vários desfechos) e um efeito pode ter múltiplas causas.245
22.6.5 O gradiente biológico (dose–resposta) é confiável?
- Nem sempre. Pode ser distorcido por confundimento. A ausência de gradiente não invalida a causalidade.245
22.6.6 A plausibilidade e a coerência são objetivas?
- Não. Ambas são fortemente dependentes do conhecimento científico da época. O que parecia implausível no passado depois se confirmou como verdadeiro.245
22.6.7 Evidência experimental é decisiva?
- Pode ser útil, mas raramente está disponível em epidemiologia. Mesmo quando disponível, pode ter explicações alternativas.245
22.6.8 Analogia é útil?
- Tem pouco valor. Analogias podem sempre ser inventadas e, na prática, funcionam mais como fonte de hipóteses do que como prova.245
22.7 Visão atual sobre os critérios de Hill
22.7.1 Como os critérios de Hill foram revisitados?
- Estudos recentes propõem integrá-los a três abordagens modernas: DAG (destacam estrutura causal e confundimento), modelos de causa suficiente (enfatizam multifatorialidade) e GRADE (orienta sobre a certeza da evidência em corpos de estudos).246
22.7.2 Quais mudanças na interpretação?
Temporalidade e experimentos: seguem centrais, mas analisados com mais sofisticação.246
Força da associação: relevante, mas não garante causalidade (pode haver confundimento).246
Consistência: pensada como transportabilidade entre populações.246
Especificidade: pouco útil hoje; substituída por falsificação (controles negativos).246
Dose–resposta: pode ser espúria, cautela é necessária.246
Coerência e analogia: utilidade limitada.246
22.8 Linguagem causal em estudos observacionais
22.8.1 Quais são as principais recomendações para relatar causalidade?
Usar termos causais de forma explícita e criteriosa (“causa”, “efeito”, “reduzir”, “aumentar”), evitando expressões ambíguas como “fator de risco”.243
Contextualizar a causalidade em termos práticos, explicando por que identificar a causa é relevante para intervenções.243
Declarar claramente na introdução se existe hipótese causal, justificando quando não houver.243
Descrever caminhos causais (mediadores, confundidores, colisores) em texto claro ou com diagramas.243
Justificar a seleção de covariáveis com base nas relações causais previstas.243
Avaliar o controle de confundimento, reconhecendo limitações e possível confundimento residual.243
Discutir as inferências causais considerando estimativas, vieses e plausibilidade biológica.243
Indicar recomendações específicas para pesquisas futuras ou prática clínica baseadas nas conclusões causais.243
22.10 O papel do tempo e a causalidade dinâmica
22.10.1 O que é causalidade de Granger?
É um conceito estatístico que analisa como processos passados influenciam o futuro, indo além da simples associação.241
Permite identificar relações direcionais entre processos ao longo do tempo (ex.: cérebro controlando contrações musculares).241
A estatística, nesse contexto, busca “olhar dentro da caixa”, aproximando-se de uma visão mecanicista.241
22.10.2 Por que o tempo é essencial na análise causal?
Processos causais não ocorrem de forma estática: efeitos diretos e indiretos se acumulam em cadeias temporais.241
Modelos tradicionais (ex.: regressões estáticas ou DAGs sem tempo) podem falhar em capturar a dinâmica.241
A integração de séries temporais e processos estocásticos é fundamental para compreender mecanismos.241
22.11 Diagrama acíclico direcionado (DAG)
22.11.1 O que são DAGs?
DAGs são representações gráficas de relações causais entre variáveis, usando nós (variáveis) e arestas direcionadas (relações causais).REF?
DAGs ajudam a identificar confundidores, mediadores e colisores, orientando a seleção de variáveis para ajuste em análises estatísticas.REF?
DAGs são acíclicos, ou seja, não permitem ciclos ou loops, refletindo a natureza unidirecional das relações causais.REF?
22.11.2 Quais são os padrões causais básicos?
Independência: duas variáveis não têm relação causal direta ou indireta.REF?
Cadeia: uma variável causa outra, que por sua vez causa uma terceira (X → M → Y).REF?
Garfo: uma variável causa duas outras (X ← Z → Y), onde Z é um confundidor.REF?
Colisor: duas variáveis causam uma terceira (X → Z ← Y), onde Z é um colisor.REF?
O pacote dagitty247 fornece a função dagitty para criar um objeto grafo a partir de uma descrição textual.
O pacote performance249 fornece a função check_dag para criar, verificar e visualizar os modelos em grafos.
Figura 22.1: Padrões causais básicos: independência, cadeia, garfo e colisor.
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,