Capítulo 55 Plano de análise
55.1 Plano de análise estatística
55.1.1 O que é plano de análise estatística?
O plano de análise estatística é um documento que descreve, de forma pré-especificada, os métodos estatísticos que serão utilizados para analisar os dados de um estudo científico.45
O plano de análise estatística define como os dados serão analisados, quais estimativas serão produzidas, quais populações serão consideradas, como eventos intercorrentes serão tratados e quais procedimentos serão usados para lidar com dados incompletos.45
55.1.2 Qual é a relação entre pergunta científica e plano de análise?
O plano de análise estatística deve ser consequência direta da pergunta científica do estudo e não apenas da disponibilidade dos dados ou da familiaridade com determinados métodos analíticos.46
Perguntas cientificamente distintas exigem estimativas distintas, mesmo quando os dados observados são os mesmos.46
A ausência de uma definição explícita da pergunta científica pode resultar em análises tecnicamente corretas, porém conceitualmente desalinhadas com o objetivo do estudo.46
55.1.3 Por que a pré-especificação do plano de análise é fundamental?
A pré-especificação do plano de análise estatística reduz o risco de flexibilidade analítica, data dredging e p-hacking.45
Ela permite distinguir análises confirmatórias de análises exploratórias, preservando a interpretação inferencial dos resultados.45
Em estudos clínicos e observacionais, a existência de um SAP claro fortalece a avaliação crítica da qualidade metodológica do estudo.45,46
55.1.4 Como o plano de análise lida com dados perdidos?
O tratamento de dados perdidos deve ser especificado no plano de análise estatística de forma explícita e justificada.46
A escolha do método de tratamento de dados perdidos está diretamente relacionada ao estimando de interesse e às suposições feitas sobre o mecanismo de ausência dos dados.46
Métodos como imputação múltipla, análise de casos completos ou modelos baseados em máxima verossimilhança não são intercambiáveis do ponto de vista conceitual e podem corresponder a estimandos distintos.46
55.2 Fluxo estatístico
55.2.1 O que é fluxo estatístico?
Fluxo (workflow) estatístico é o conjunto de etapas iterativas utilizadas para transformar uma pergunta científica em evidência quantitativa confiável.457
Diferentemente da visão tradicional centrada em um único modelo estatístico, o workflow reconhece que a análise envolve múltiplos ciclos de exploração, modelagem, diagnóstico, revisão de pressupostos e interpretação.457
O objetivo do workflow não é apenas produzir estimativas, mas compreender a relação entre dados, modelos, suposições e conclusões científicas.457
55.2.2 Quais etapas costumam compor um workflow estatístico?
Formulação da pergunta científica.457
Definição do estimando.457
Planejamento da coleta e mensuração dos dados.457
Construção do modelo estatístico.457
Avaliação da qualidade dos dados.457
Diagnóstico do modelo e verificação de pressupostos.457
Análises de sensibilidade.457
Interpretação dos resultados à luz dos objetivos científicos.457
Comunicação transparente das limitações e incertezas.457
55.2.3 Por que o workflow é importante para um Plano de Análise Estatística?
O plano de análise estatística não deve ser visto apenas como uma lista de testes estatísticos, mas como parte de um processo mais amplo de produção de evidências científicas.457
A documentação explícita do workflow aumenta a transparência, a reprodutibilidade e a credibilidade das conclusões do estudo.457
O workflow ajuda a distinguir decisões pré-especificadas de decisões tomadas após a observação dos dados.457
55.3 Estimandos
55.3.1 O que são estimandos e por que eles são importantes?
Um estimando define precisamente o efeito ou quantidade de interesse que se pretende estimar em um estudo.46
A definição explícita do estimando reduz ambiguidades frequentes em análises estatísticas, como interpretações divergentes entre análises por intenção de tratar, por protocolo ou análises com imputação de dados.46
55.3.2 Qual é a diferença entre estimando teórico e estimando empírico?
O estimando teórico é a quantidade de interesse definida em termos conceituais, podendo envolver contrafactuais ou quantidades não observáveis (por exemplo, o efeito médio de um tratamento na população-alvo).458
O estimando empírico é a quantidade que pode ser expressa apenas com dados observáveis e que se conecta ao estimando teórico por meio de suposições de identificação.458
A distinção entre estimando teórico e empírico torna explícitas as suposições necessárias para interpretar uma estimativa como evidência sobre uma questão científica.458
Essa distinção evita que o leitor confunda uma associação observada com o efeito causal pretendido.458
55.3.3 Por que definir o estimando antes do método estatístico?
Todo estudo quantitativo deve ser capaz de responder explicitamente à pergunta: qual é o seu estimando?458
O estimando é o objeto de interesse — a quantidade precisa sobre a qual desejamos fazer inferência — e não deve ser confundido com o coeficiente de um modelo específico.458
Definir o objetivo dentro de um modelo (por exemplo, “o coeficiente da regressão logística”) restringe artificialmente a pergunta científica ao formato daquele modelo estatístico.458
Ao declarar o estimando fora do modelo estatístico (por exemplo, uma diferença média populacional ou um efeito causal médio), ampliamos as possibilidades metodológicas e fortalecemos a conexão entre teoria e evidência empírica.458
55.3.4 Quais componentes devem ser definidos em um estimando?
Quantidade específica por unidade (por exemplo, desfecho observado ou potencial sob intervenção).458
Forma de tratamento de eventos intercorrentes (por exemplo, abandono do tratamento, uso de terapias concomitantes ou morte).46,458
Medida resumo que expressa o efeito de interesse (por exemplo, diferença de médias, razão de riscos ou razão de chances).46,458
55.3.5 Qual é a relação entre estimando, estimador e método estatístico?
O estimando descreve o que se deseja estimar.46
O estimador descreve como o estimando será estimado a partir dos dados observados.46
O método estatístico descreve o procedimento matemático e computacional usado para calcular o estimador.46
Diferentes métodos estatísticos podem produzir estimativas válidas para o mesmo estimando, assim como o mesmo método pode estimar estimandos diferentes, dependendo das decisões analíticas adotadas.46
55.3.6 Como a definição explícita do estimando melhora o Plano de Análise Estatística?
Obriga o pesquisador a declarar a pergunta científica em termos formais antes da escolha do método.458
Separa claramente três decisões distintas: definir o estimando teórico, estabelecer o estimando empírico sob hipóteses de identificação e escolher a estratégia de estimação.458
Reduz ambiguidades interpretativas, especialmente em estudos observacionais.458
Facilita a avaliação crítica por revisores e leitores, pois torna explícitas as suposições necessárias para que a evidência empírica sustente a conclusão teórica.458
55.3.7 Por que o estimando deve existir fora do modelo estatístico?
O estimando deve ser definido independentemente do modelo estatístico que será utilizado para estimá-lo.458
Quando o objetivo científico é formulado como um parâmetro específico de um modelo (por exemplo, um coeficiente de regressão), a pergunta científica passa a depender das suposições daquele modelo.458
A definição do estimando fora do modelo amplia o espaço de possíveis estratégias analíticas e permite avaliar métodos alternativos sob os mesmos objetivos científicos.458
No contexto de um plano de análise estatística, isso significa que o método é escolhido para estimar o estimando — e não o estimando para justificar o método.
55.4 Diretrizes para redação
55.4.1 Quais são as diretrizes para redação de planos de análise estatística?
Visite a rede Enhancing the QUAlity and Transparency Of health Research (EQUATOR Network) para encontrar diretrizes específicas.
Guidelines for the Content of Statistical Analysis Plans in Clinical Trials.45
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,