Capítulo 26 Suposições inferenciais
26.1 Suposições gerais em análises inferenciais
26.1.1 Quais são as suposições ao nível dos dados (condicionais ao modelo)?
Independência (ou dependência corretamente modelada) das observações.REF?
Forma da distribuição dos erros ou resíduos (normalidade, assimetria, caudas).REF?
Homocedasticidade (igualdade de variâncias condicionais).REF?
26.2 Suposições implícitas e explícitas nos testes
26.3 Suposições causais que conectam dados observados a efeitos causais
26.3.1 Quais são as suposições causais que conectam dados observados a efeitos causais?
Ausência de correlação espúria: associações observadas refletem relações sistemáticas e não flutuações aleatórias; quanto maior a amostra, mais plausível essa condição.REF?
Consistência: os valores observados do tratamento correspondem a intervenções bem definidas e coincidem com os valores dos contrafactuais relevantes.REF?
Intercambialidade: condicionalmente às covariáveis medidas, a atribuição do tratamento é independente dos desfechos potenciais.REF?
Positividade: para todos os valores das covariáveis consideradas, a probabilidade de receber cada nível do tratamento é maior que zero.REF?
Fidelidade: efeitos causais não se cancelam sistematicamente no agregado populacional, de modo que efeitos médios nulos correspondem à ausência de efeito causal relevante.REF?
26.3.2 Qual a relação dessas suposições com as demais suposições inferenciais?
Essas suposições operam antes do modelo estatístico.REF?
Não são verificáveis por diagnóstico residual ou testes de ajuste.REF?
Mesmo com todas as suposições estatísticas satisfeitas, a inferência causal pode falhar se qualquer uma dessas suposições não for atendida.REF?
26.4 Diagnóstico e verificação
26.4.1 O que fazer quando suposições gerais falham?
Transformações.REF?
Métodos robustos (estimadores e testes).REF?
Reamostragem.REF?
Modelos alternativos.REF?
26.4.2 O que fazer quando as suposições causais falham?
Clarificar o alvo causal: redefinir a população, o tratamento ou o efeito de interesse.[REF]
Análise de sensibilidade: avaliar quanto confundimento não medido seria necessário para invalidar as conclusões.[REF]
Restringir o suporte: limitar a análise a regiões com positividade plausível (suporte comum).[REF]
Estratificação ou ajuste enriquecido: incluir covariáveis adicionais relevantes, quando disponíveis.[REF]
Modelagem causal explícita: usar DAGs para tornar suposições transparentes e discutíveis.[REF]
Estimativas parciais ou locais: reportar efeitos condicionais ou locais quando o efeito médio não é identificável.[REF]
Conclusões mais fracas: interpretar resultados como associações ajustadas, não como efeitos causais.[REF]
Relato explícito das falhas: documentar quais suposições não são plausíveis e por quê.[REF]
O pacote performance250 fornece a função check_model para analisar a colinearidade entre variáveis, a normalidade da distribuição das variáveis e a heteroscedasticidade.
26.4.3 Como avaliar as suposições de uma regressão?
- Usando diagnóstico de regressão (ex.: análise de resíduos, gráficos de valores observados vs. preditos) e comparação com análises estratificadas.269
Figura 26.1: Diagnóstico de regressão para avaliar suposições do modelo: linearidade, normalidade dos resíduos, homocedasticidade e alavancagem.
26.4.4 Como avaliar a independência entre variáveis?
Verifique por dependência entre variáveis de um modelo de regressão:214
Gráfico de série temporal das variáveis
Gráfico de autocorrelação entre as variáveis
Figura 26.2: Séries temporais e autocorrelação de duas séries simuladas com fraca e forte autocorrelação.
26.5 Normalidade
26.5.1 Devemos testar as suposições de normalidade?
- Testes preliminares de normalidade não são necessários para a maioria dos testes paramétricos de comparação, pois eles são robustos contra desvios moderados da normalidade. Normalidade da distribuição deve ser estabelecida para a população.270
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,