Capítulo 46 Poder estatístico
46.1 Poder do teste
46.1.1 O que é poder do teste?
Poder do teste é a probabilidade de rejeitar corretamente a hipótese nula (\(H_{0}\)) quando esta é falsa.252
Poder do teste pode ser calculado como \(1 - \beta\).252
46.1.2 O que é análise de poder do teste?
Poder é a probabilidade de que um dado tamanho de efeito será observado em um experimento futuro sob um conjunto de hipóteses — tamanho de efeito real e erro tipo I — para um dado tamanho de amostra.374
O objetivo geral da análise de poder ao projetar um estudo é escolher um tamanho de amostra que controle os 2 tipos de erros de inferência estatística: tipo I (\(\alpha\), resultado falso-positivo) e tipo II (\(\beta\), resultado falso-negativo).374
Numericamente, o poder de um estudo é calculado como \(1-\beta\) e reportado em valor percentual.374
46.1.3 Quando realizar a análise de poder do teste?
Na fase de projeto de pesquisa: a análise de poder para determinar o tamanho da amostra objetiva que o tamanho da amostra permita uma probabilidade razoável de detectar um efeito significativo pré-especificado.374
Após a coleta de dados: a análise de poder objetiva informar estudos futuros a respeito do tamanho da amostra necessário para a detecção de um efeito significativo pré-especificado.374
O pacote pwr283 fornece a função pwr.2p.test para cálculo do poder do teste de proporção balanceado (2 amostras com mesmo número de participantes).
O pacote pwr283 fornece a função pwr.2p2n.test para cálculo do poder do teste de proporção não balanceado (2 amostras com diferente número de participantes).
O pacote pwr283 fornece a função pwr.anova.test para cálculo do poder do teste de análise de variância balanceado (3 ou mais amostras com mesmo número de participantes).
O pacote pwr283 fornece a função pwr.chisq.test para cálculo do poder do teste de qui-quadrado \(\chi^2\).
O pacote pwr283 fornece a função pwr.f2.test para cálculo do poder do teste com modelo linear geral.
O pacote pwr283 fornece a função pwr.norm.test para cálculo do poder do teste de média de uma distribuição normal com variância conhecida.
O pacote pwr283 fornece a função pwr.p.test para cálculo do poder do teste de proporção (1 amostra).
O pacote pwr283 fornece a função pwr.r.test para cálculo do poder to teste de correlação (1 amostra).
O pacote pwr283 fornece a função pwr.t.test para cálculo do poder do teste t de diferença de 1 amostra, 2 amostras dependentes ou 2 amostras independentes (grupos balanceados).
O pacote pwr283 fornece a função pwr.t2n.test para cálculo do poder do teste t de diferença de 2 amostras independentes (grupos não balanceados).
O pacote longpower375 fornece a função power.mmrm para calcular o poder de testes com análises por modelo de regressão linear misto.
O pacote Superpower277 fornece a função power.ftest para calcular o poder do teste por análise de testes F.
O pacote Superpower277 fornece a função power_oneway_between para calcular o poder do teste por análise de variância (ANOVA) de 1 fator entre-sujeitos.
O pacote Superpower277 fornece a função power_oneway_within para calcular o poder do teste por análise de variância (ANOVA) de 1 fator intra-sujeitos.
O pacote Superpower277 fornece a função power_oneway_ancova para calcular o poder do teste por análise de covariância (ANCOVA).
O pacote Superpower277 fornece a função power_twoway_between para calcular o poder do teste por análise de covariância (ANOVA) de 2 fatores entre-sujeitos.
O pacote Superpower277 fornece a função power_threeway_between para calcular o poder do teste por análise de covariância (ANOVA) de 3 fatores entre-sujeitos.
O pacote InteractionPoweR376 fornece a função power_interaction para calcular o poder do teste por análise de efeito de interações.
46.1.4 Por que a análise de poder do teste post hoc é inadequada?
Calcular poder após o teste não muda a interpretação.377
A análise do poder é teoricamente incorreta, uma vez que a probabilidade calculada \(1-\beta\) expressa a probabilidade de um evento futuro, o que não é mais relevante quando o evento de interesse já ocorreu.225,374
46.1.5 O que pode ser realizado ao invés da análise de poder?
- Após a coleta e análise de dados, recomenda-se realizar a análise e interpretação dos resultados a partir do tamanho do efeito e do seu intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido.374
46.1.6 Por que o desequilíbrio entre grupos pode ser problemático para o poder do teste?
O desequilíbrio entre grupos pode reduzir o poder estatístico do teste, especialmente quando o efeito esperado é pequeno ou moderado.378
O tamanho total da amostra influencia mais o poder do que o desequilíbrio isoladamente. Em estudos pequenos, o desequilíbrio pode reduzir o poder de forma clinicamente relevante.378
Remover participantes para “corrigir” desequilíbrio pode reduzir ainda mais o poder do estudo do que manter o desequilíbrio existente.378
O controle inadequado da randomização compromete a validade interna do ensaio.378
46.2 Poder observado
46.2.1 Qual é a relação entre poder observado e P-valor?
O chamado “poder observado” é uma transformação matemática direta do P-valor; portanto, não adiciona qualquer nova informação à interpretação do teste estatístico.377
Se o P-valor é não significativo, o poder observado será baixo.377
Se o P-valor é limítrofe, o poder observado \(≈ 0,5\).377
Se o P-valor é altamente significativo, o poder observado será alto.377
46.3 Poder de salvaguarda
46.3.1 O que é poder de salvaguarda?
Poder de salvaguarda é uma abordagem prospectiva de análise de poder que incorpora explicitamente a incerteza do tamanho de efeito estimado no estudo original.379
Em vez de utilizar diretamente o tamanho de efeito observado, utiliza-se o limite inferior do intervalo de confiança do tamanho de efeito como estimativa conservadora do efeito populacional.379
O método reconhece que o intervalo de confiança representa o conjunto de valores plausíveis para o verdadeiro efeito populacional e, portanto, deve ser considerado no planejamento amostral.379
O poder de salvaguarda aumenta a probabilidade de que o poder nominal planejado seja efetivamente alcançado no estudo futuro.379
O método não substitui a interpretação baseada em tamanho de efeito e intervalo de confiança, mas constitui uma estratégia mais prudente para o planejamento prospectivo de estudos confirmatórios ou de replicação.379
46.3.2 Por que utilizar o poder de salvaguarda?
A análise de poder tradicional utiliza o tamanho de efeito observado como se fosse o verdadeiro valor populacional, desconsiderando a imprecisão inerente à estimativa amostral.379
Em amostras pequenas ou moderadas, o tamanho de efeito observado pode estar superestimado devido à variabilidade amostral e viés de publicação.379
Caso o efeito verdadeiro seja menor do que o observado inicialmente, o poder real do estudo planejado poderá ser substancialmente inferior ao poder nominal desejado.379
Simulações demonstram que, em cenários comuns de pesquisa com efeitos pequenos a moderados, o poder tradicional frequentemente produz poder real inferior ao planejado, enquanto o poder de salvaguarda tende a oferecer proteção contra esse subdimensionamento.379
A adoção do limite inferior do intervalo de confiança operacionaliza um nível explícito de proteção contra superestimação do tamanho de efeito.379
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,