Capítulo 25 Suposições inferenciais
25.1 Suposições gerais em análises inferenciais
25.1.1 Quais são as suposições ao nível dos dados (condicionais ao modelo)?
Independência (ou dependência corretamente modelada) das observações: .[REF]
Forma da distribuição dos erros ou resíduos (normalidade, assimetria, caudas): .[REF]
Homocedasticidade (igualdade de variâncias condicionais): .[REF]
25.2 Suposições implícitas e explícitas nos testes
25.3 Suposições causais que conectam dados observados a efeitos causais
25.3.1 Quais são as suposições causais que conectam dados observados a efeitos causais?
Ausência de correlação espúria: associações observadas refletem relações sistemáticas e não flutuações aleatórias; quanto maior a amostra, mais plausível essa condição.REF?
Consistência: os valores observados do tratamento correspondem a intervenções bem definidas e coincidem com os valores dos contrafactuais relevantes.REF?
Intercambialidade: condicionalmente às covariáveis medidas, a atribuição do tratamento é independente dos desfechos potenciais.REF?
Positividade: para todos os valores das covariáveis consideradas, a probabilidade de receber cada nível do tratamento é maior que zero.REF?
Fidelidade: efeitos causais não se cancelam sistematicamente no agregado populacional, de modo que efeitos médios nulos correspondem à ausência de efeito causal relevante.REF?
25.3.2 Qual a relação dessas suposições com as demais suposições inferenciais?
Essas suposições operam antes do modelo estatístico.REF?
Não são verificáveis por diagnóstico residual ou testes de ajuste.REF?
Mesmo com todas as suposições estatísticas satisfeitas, a inferência causal pode falhar se qualquer uma dessas suposições não for atendida.REF?
25.4 Diagnóstico e verificação
25.4.1 O que fazer quando suposições gerais falham?
Transformações: .[REF]
Métodos robustos (estimadores e testes): .[REF]
Reamostragem: .[REF]
Modelos alternativos: .[REF]
25.4.2 O que fazer quando as suposições causais falham?
Clarificar o alvo causal: redefinir a população, o tratamento ou o efeito de interesse.[REF]
Análise de sensibilidade: avaliar quanto confundimento não medido seria necessário para invalidar as conclusões.[REF]
Restringir o suporte: limitar a análise a regiões com positividade plausível (suporte comum).[REF]
Estratificação ou ajuste enriquecido: incluir covariáveis adicionais relevantes, quando disponíveis.[REF]
Modelagem causal explícita: usar DAGs para tornar suposições transparentes e discutíveis.[REF]
Estimativas parciais ou locais: reportar efeitos condicionais ou locais quando o efeito médio não é identificável.[REF]
Conclusões mais fracas: interpretar resultados como associações ajustadas, não como efeitos causais.[REF]
Relato explícito das falhas: documentar quais suposições não são plausíveis e por quê.[REF]
O pacote performance253 fornece a função check_model para analisar a colinearidade entre variáveis, a normalidade da distribuição das variáveis e a heteroscedasticidade.
25.4.3 Como avaliar as suposições de uma regressão?
- Usando diagnóstico de regressão (ex.: análise de resíduos, gráficos de valores observados vs. preditos) e comparação com análises estratificadas.255
Figura 25.1: Diagnóstico de regressão para avaliar suposições do modelo: linearidade, normalidade dos resíduos, homocedasticidade e alavancagem.
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,