Capítulo 25 Suposições inferenciais

25.1 Suposições gerais em análises inferenciais

25.1.1 Quais são as suposições ao nível dos dados (condicionais ao modelo)?

Independência (ou dependência corretamente modelada) das observações: .[REF]
Forma da distribuição dos erros ou resíduos (normalidade, assimetria, caudas): .[REF]
Homocedasticidade (igualdade de variâncias condicionais): .[REF]

25.1.2 Quais são as suposições ao nível do modelo?

Linearidade da relação entre variáveis: .[REF]
Multicolinearidade ausente ou controlada: .[REF]
Especificação funcional correta do modelo: .[REF]

25.1.3 Quais são as suposições ao nível do estudo?

Ausência de confundimento relevante não controlado: .[REF]
Estabilidade do processo gerador de dados (invariância temporal, populacional ou contextual): .[REF]

25.2 Suposições implícitas e explícitas nos testes

25.2.1 Quais suposições implícitas são feitas nos testes estatísticos?

Amostragem aleatória ou ignorabilidade condicional: .[REF]
Medição sem erro relevante: .[REF]
Correspondência entre modelo estatístico e processo gerador de dados: .[REF]
Ausência de múltiplas comparações não ajustadas: .[REF]

25.2.2 Quais suposições explícitas são feitas nos testes estatísticos?

Normalidade dos erros ou da estatística de teste: .[REF]
Homocedasticidade: .[REF]
Independência das observações: .[REF]

25.3 Suposições causais que conectam dados observados a efeitos causais

25.3.1 Quais são as suposições causais que conectam dados observados a efeitos causais?

Ausência de correlação espúria: associações observadas refletem relações sistemáticas e não flutuações aleatórias; quanto maior a amostra, mais plausível essa condição.^REF?
Consistência: os valores observados do tratamento correspondem a intervenções bem definidas e coincidem com os valores dos contrafactuais relevantes.^REF?
Intercambialidade: condicionalmente às covariáveis medidas, a atribuição do tratamento é independente dos desfechos potenciais.^REF?
Positividade: para todos os valores das covariáveis consideradas, a probabilidade de receber cada nível do tratamento é maior que zero.^REF?
Fidelidade: efeitos causais não se cancelam sistematicamente no agregado populacional, de modo que efeitos médios nulos correspondem à ausência de efeito causal relevante.^REF?

25.3.2 Qual a relação dessas suposições com as demais suposições inferenciais?

Essas suposições operam antes do modelo estatístico.^REF?
Não são verificáveis por diagnóstico residual ou testes de ajuste.^REF?
Mesmo com todas as suposições estatísticas satisfeitas, a inferência causal pode falhar se qualquer uma dessas suposições não for atendida.^REF?

25.4 Diagnóstico e verificação

25.4.1 O que fazer quando suposições gerais falham?

Transformações: .[REF]
Métodos robustos (estimadores e testes): .[REF]
Reamostragem: .[REF]
Modelos alternativos: .[REF]

25.4.2 O que fazer quando as suposições causais falham?

Clarificar o alvo causal: redefinir a população, o tratamento ou o efeito de interesse.[REF]
Análise de sensibilidade: avaliar quanto confundimento não medido seria necessário para invalidar as conclusões.[REF]
Restringir o suporte: limitar a análise a regiões com positividade plausível (suporte comum).[REF]
Estratificação ou ajuste enriquecido: incluir covariáveis adicionais relevantes, quando disponíveis.[REF]
Modelagem causal explícita: usar DAGs para tornar suposições transparentes e discutíveis.[REF]
Estimativas parciais ou locais: reportar efeitos condicionais ou locais quando o efeito médio não é identificável.[REF]
Conclusões mais fracas: interpretar resultados como associações ajustadas, não como efeitos causais.[REF]
Relato explícito das falhas: documentar quais suposições não são plausíveis e por quê.[REF]

O pacote performance²⁵³ fornece a função check_model para analisar a colinearidade entre variáveis, a normalidade da distribuição das variáveis e a heteroscedasticidade.

25.4.3 Como avaliar as suposições de uma regressão?

Usando diagnóstico de regressão (ex.: análise de resíduos, gráficos de valores observados vs. preditos) e comparação com análises estratificadas.²⁵⁵

Diagnóstico de regressão para avaliar suposições do modelo: linearidade, normalidade dos resíduos, homocedasticidade e alavancagem.

Figura 25.1: Diagnóstico de regressão para avaliar suposições do modelo: linearidade, normalidade dos resíduos, homocedasticidade e alavancagem.

Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,

Referências

253.

Lüdecke D, Ben-Shachar MS, Patil I, Waggoner P, Makowski D. performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software. 2021;6:3139. doi:10.21105/joss.03139

255.

Greenland S. Modeling and variable selection in epidemiologic analysis. American Journal of Public Health. 1989;79(3):340–349. doi:10.2105/ajph.79.3.340