Capítulo 55 Plano de análise


55.1 Plano de análise estatística


55.1.1 O que é plano de análise estatística?

  • O plano de análise estatística é um documento que descreve, de forma pré-especificada, os métodos estatísticos que serão utilizados para analisar os dados de um estudo científico.45

  • O plano de análise estatística define como os dados serão analisados, quais estimativas serão produzidas, quais populações serão consideradas, como eventos intercorrentes serão tratados e quais procedimentos serão usados para lidar com dados incompletos.45


55.1.2 Qual é a relação entre pergunta científica e plano de análise?

  • O plano de análise estatística deve ser consequência direta da pergunta científica do estudo e não apenas da disponibilidade dos dados ou da familiaridade com determinados métodos analíticos.46

  • Perguntas cientificamente distintas exigem estimativas distintas, mesmo quando os dados observados são os mesmos.46

  • A ausência de uma definição explícita da pergunta científica pode resultar em análises tecnicamente corretas, porém conceitualmente desalinhadas com o objetivo do estudo.46


55.1.3 Por que a pré-especificação do plano de análise é fundamental?

  • A pré-especificação do plano de análise estatística reduz o risco de flexibilidade analítica, data dredging e p-hacking.45

  • Ela permite distinguir análises confirmatórias de análises exploratórias, preservando a interpretação inferencial dos resultados.45

  • Em estudos clínicos e observacionais, a existência de um SAP claro fortalece a avaliação crítica da qualidade metodológica do estudo.45,46


55.1.4 Como o plano de análise lida com dados perdidos?

  • O tratamento de dados perdidos deve ser especificado no plano de análise estatística de forma explícita e justificada.46

  • A escolha do método de tratamento de dados perdidos está diretamente relacionada ao estimando de interesse e às suposições feitas sobre o mecanismo de ausência dos dados.46

  • Métodos como imputação múltipla, análise de casos completos ou modelos baseados em máxima verossimilhança não são intercambiáveis do ponto de vista conceitual e podem corresponder a estimandos distintos.46


55.2 Fluxo estatístico


55.2.1 O que é fluxo estatístico?

  • Fluxo (workflow) estatístico é o conjunto de etapas iterativas utilizadas para transformar uma pergunta científica em evidência quantitativa confiável.457

  • Diferentemente da visão tradicional centrada em um único modelo estatístico, o workflow reconhece que a análise envolve múltiplos ciclos de exploração, modelagem, diagnóstico, revisão de pressupostos e interpretação.457

  • O objetivo do workflow não é apenas produzir estimativas, mas compreender a relação entre dados, modelos, suposições e conclusões científicas.457


55.2.2 Quais etapas costumam compor um workflow estatístico?

  • Formulação da pergunta científica.457

  • Definição do estimando.457

  • Planejamento da coleta e mensuração dos dados.457

  • Construção do modelo estatístico.457

  • Avaliação da qualidade dos dados.457

  • Diagnóstico do modelo e verificação de pressupostos.457

  • Análises de sensibilidade.457

  • Interpretação dos resultados à luz dos objetivos científicos.457

  • Comunicação transparente das limitações e incertezas.457


55.2.3 Por que o workflow é importante para um Plano de Análise Estatística?

  • O plano de análise estatística não deve ser visto apenas como uma lista de testes estatísticos, mas como parte de um processo mais amplo de produção de evidências científicas.457

  • A documentação explícita do workflow aumenta a transparência, a reprodutibilidade e a credibilidade das conclusões do estudo.457

  • O workflow ajuda a distinguir decisões pré-especificadas de decisões tomadas após a observação dos dados.457


55.3 Estimandos


55.3.1 O que são estimandos e por que eles são importantes?

  • Um estimando define precisamente o efeito ou quantidade de interesse que se pretende estimar em um estudo.46

  • A definição explícita do estimando reduz ambiguidades frequentes em análises estatísticas, como interpretações divergentes entre análises por intenção de tratar, por protocolo ou análises com imputação de dados.46


55.3.2 Qual é a diferença entre estimando teórico e estimando empírico?

  • O estimando teórico é a quantidade de interesse definida em termos conceituais, podendo envolver contrafactuais ou quantidades não observáveis (por exemplo, o efeito médio de um tratamento na população-alvo).458

  • O estimando empírico é a quantidade que pode ser expressa apenas com dados observáveis e que se conecta ao estimando teórico por meio de suposições de identificação.458

  • A distinção entre estimando teórico e empírico torna explícitas as suposições necessárias para interpretar uma estimativa como evidência sobre uma questão científica.458

  • Essa distinção evita que o leitor confunda uma associação observada com o efeito causal pretendido.458


55.3.3 Por que definir o estimando antes do método estatístico?

  • Todo estudo quantitativo deve ser capaz de responder explicitamente à pergunta: qual é o seu estimando?458

  • O estimando é o objeto de interesse — a quantidade precisa sobre a qual desejamos fazer inferência — e não deve ser confundido com o coeficiente de um modelo específico.458

  • Definir o objetivo dentro de um modelo (por exemplo, “o coeficiente da regressão logística”) restringe artificialmente a pergunta científica ao formato daquele modelo estatístico.458

  • Ao declarar o estimando fora do modelo estatístico (por exemplo, uma diferença média populacional ou um efeito causal médio), ampliamos as possibilidades metodológicas e fortalecemos a conexão entre teoria e evidência empírica.458


55.3.4 Quais componentes devem ser definidos em um estimando?

  • Quantidade específica por unidade (por exemplo, desfecho observado ou potencial sob intervenção).458

  • População-alvo à qual a inferência se refere.46,458

  • Variável de interesse (desfecho).46,458

  • Forma de tratamento de eventos intercorrentes (por exemplo, abandono do tratamento, uso de terapias concomitantes ou morte).46,458

  • Medida resumo que expressa o efeito de interesse (por exemplo, diferença de médias, razão de riscos ou razão de chances).46,458


55.3.5 Qual é a relação entre estimando, estimador e método estatístico?

  • O estimando descreve o que se deseja estimar.46

  • O estimador descreve como o estimando será estimado a partir dos dados observados.46

  • O método estatístico descreve o procedimento matemático e computacional usado para calcular o estimador.46

  • Diferentes métodos estatísticos podem produzir estimativas válidas para o mesmo estimando, assim como o mesmo método pode estimar estimandos diferentes, dependendo das decisões analíticas adotadas.46


55.3.6 Como a definição explícita do estimando melhora o Plano de Análise Estatística?

  • Obriga o pesquisador a declarar a pergunta científica em termos formais antes da escolha do método.458

  • Separa claramente três decisões distintas: definir o estimando teórico, estabelecer o estimando empírico sob hipóteses de identificação e escolher a estratégia de estimação.458

  • Reduz ambiguidades interpretativas, especialmente em estudos observacionais.458

  • Facilita a avaliação crítica por revisores e leitores, pois torna explícitas as suposições necessárias para que a evidência empírica sustente a conclusão teórica.458


55.3.7 Por que o estimando deve existir fora do modelo estatístico?

  • O estimando deve ser definido independentemente do modelo estatístico que será utilizado para estimá-lo.458

  • Quando o objetivo científico é formulado como um parâmetro específico de um modelo (por exemplo, um coeficiente de regressão), a pergunta científica passa a depender das suposições daquele modelo.458

  • A definição do estimando fora do modelo amplia o espaço de possíveis estratégias analíticas e permite avaliar métodos alternativos sob os mesmos objetivos científicos.458

  • No contexto de um plano de análise estatística, isso significa que o método é escolhido para estimar o estimando — e não o estimando para justificar o método.


55.4 Diretrizes para redação


55.4.1 Quais são as diretrizes para redação de planos de análise estatística?

  • Visite a rede Enhancing the QUAlity and Transparency Of health Research (EQUATOR Network) para encontrar diretrizes específicas.

  • Guidelines for the Content of Statistical Analysis Plans in Clinical Trials.45



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

45.
Gamble C, Krishan A, Stocken D, et al. Guidelines for the Content of Statistical Analysis Plans in Clinical Trials. JAMA. 2017;318(23):2337. doi:10.1001/jama.2017.18556
46.
Kahan BC, Hindley J, Edwards M, Cro S, Morris TP. The estimands framework: a primer on the ICH E9(R1) addendum. BMJ. janeiro 2024:e076316. doi:10.1136/bmj-2023-076316
457.
Gelman A, Vehtari A, McElreath R. Statistical workflow. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 2026;384(2321). doi:10.1098/rsta.2025.0293
458.
Lundberg I, Johnson R, Stewart BM. What Is Your Estimand? Defining the Target Quantity Connects Statistical Evidence to Theory. American Sociological Review. 2021;86(3):532–565. doi:10.1177/00031224211004187