Capítulo 25 Suposições inferenciais


25.1 Suposições gerais em análises inferenciais


25.1.1 Quais são as suposições ao nível dos dados (condicionais ao modelo)?

  • Independência (ou dependência corretamente modelada) das observações: .[REF]

  • Forma da distribuição dos erros ou resíduos (normalidade, assimetria, caudas): .[REF]

  • Homocedasticidade (igualdade de variâncias condicionais): .[REF]


25.1.2 Quais são as suposições ao nível do modelo?

  • Linearidade da relação entre variáveis: .[REF]

  • Multicolinearidade ausente ou controlada: .[REF]

  • Especificação funcional correta do modelo: .[REF]


25.1.3 Quais são as suposições ao nível do estudo?

  • Ausência de confundimento relevante não controlado: .[REF]

  • Estabilidade do processo gerador de dados (invariância temporal, populacional ou contextual): .[REF]


25.2 Suposições implícitas e explícitas nos testes


25.2.1 Quais suposições implícitas são feitas nos testes estatísticos?

  • Amostragem aleatória ou ignorabilidade condicional: .[REF]

  • Medição sem erro relevante: .[REF]

  • Correspondência entre modelo estatístico e processo gerador de dados: .[REF]

  • Ausência de múltiplas comparações não ajustadas: .[REF]


25.2.2 Quais suposições explícitas são feitas nos testes estatísticos?

  • Normalidade dos erros ou da estatística de teste: .[REF]

  • Homocedasticidade: .[REF]

  • Independência das observações: .[REF]


25.3 Suposições causais que conectam dados observados a efeitos causais


25.3.1 Quais são as suposições causais que conectam dados observados a efeitos causais?

  • Ausência de correlação espúria: associações observadas refletem relações sistemáticas e não flutuações aleatórias; quanto maior a amostra, mais plausível essa condição.REF?

  • Consistência: os valores observados do tratamento correspondem a intervenções bem definidas e coincidem com os valores dos contrafactuais relevantes.REF?

  • Intercambialidade: condicionalmente às covariáveis medidas, a atribuição do tratamento é independente dos desfechos potenciais.REF?

  • Positividade: para todos os valores das covariáveis consideradas, a probabilidade de receber cada nível do tratamento é maior que zero.REF?

  • Fidelidade: efeitos causais não se cancelam sistematicamente no agregado populacional, de modo que efeitos médios nulos correspondem à ausência de efeito causal relevante.REF?


25.3.2 Qual a relação dessas suposições com as demais suposições inferenciais?

  • Essas suposições operam antes do modelo estatístico.REF?

  • Não são verificáveis por diagnóstico residual ou testes de ajuste.REF?

  • Mesmo com todas as suposições estatísticas satisfeitas, a inferência causal pode falhar se qualquer uma dessas suposições não for atendida.REF?


25.4 Diagnóstico e verificação


25.4.1 O que fazer quando suposições gerais falham?

  • Transformações: .[REF]

  • Métodos robustos (estimadores e testes): .[REF]

  • Reamostragem: .[REF]

  • Modelos alternativos: .[REF]


25.4.2 O que fazer quando as suposições causais falham?

  • Clarificar o alvo causal: redefinir a população, o tratamento ou o efeito de interesse.[REF]

  • Análise de sensibilidade: avaliar quanto confundimento não medido seria necessário para invalidar as conclusões.[REF]

  • Restringir o suporte: limitar a análise a regiões com positividade plausível (suporte comum).[REF]

  • Estratificação ou ajuste enriquecido: incluir covariáveis adicionais relevantes, quando disponíveis.[REF]

  • Modelagem causal explícita: usar DAGs para tornar suposições transparentes e discutíveis.[REF]

  • Estimativas parciais ou locais: reportar efeitos condicionais ou locais quando o efeito médio não é identificável.[REF]

  • Conclusões mais fracas: interpretar resultados como associações ajustadas, não como efeitos causais.[REF]

  • Relato explícito das falhas: documentar quais suposições não são plausíveis e por quê.[REF]



25.4.3 Como avaliar as suposições de uma regressão?

  • Usando diagnóstico de regressão (ex.: análise de resíduos, gráficos de valores observados vs. preditos) e comparação com análises estratificadas.255


Diagnóstico de regressão para avaliar suposições do modelo: linearidade, normalidade dos resíduos, homocedasticidade e alavancagem.

Figura 25.1: Diagnóstico de regressão para avaliar suposições do modelo: linearidade, normalidade dos resíduos, homocedasticidade e alavancagem.



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

253.
Lüdecke D, Ben-Shachar MS, Patil I, Waggoner P, Makowski D. performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software. 2021;6:3139. doi:10.21105/joss.03139
255.
Greenland S. Modeling and variable selection in epidemiologic analysis. American Journal of Public Health. 1989;79(3):340–349. doi:10.2105/ajph.79.3.340