Capítulo 46 Poder estatístico


46.1 Poder do teste


46.1.1 O que é poder do teste?

  • Poder do teste é a probabilidade de rejeitar corretamente a hipótese nula (\(H_{0}\)) quando esta é falsa.252

  • Poder do teste pode ser calculado como \(1 - \beta\).252


46.1.2 O que é análise de poder do teste?

  • Poder é a probabilidade de que um dado tamanho de efeito será observado em um experimento futuro sob um conjunto de hipóteses — tamanho de efeito real e erro tipo I — para um dado tamanho de amostra.374

  • O objetivo geral da análise de poder ao projetar um estudo é escolher um tamanho de amostra que controle os 2 tipos de erros de inferência estatística: tipo I (\(\alpha\), resultado falso-positivo) e tipo II (\(\beta\), resultado falso-negativo).374

  • Numericamente, o poder de um estudo é calculado como \(1-\beta\) e reportado em valor percentual.374


46.1.3 Quando realizar a análise de poder do teste?

  • Na fase de projeto de pesquisa: a análise de poder para determinar o tamanho da amostra objetiva que o tamanho da amostra permita uma probabilidade razoável de detectar um efeito significativo pré-especificado.374

  • Após a coleta de dados: a análise de poder objetiva informar estudos futuros a respeito do tamanho da amostra necessário para a detecção de um efeito significativo pré-especificado.374




















46.1.4 Por que a análise de poder do teste post hoc é inadequada?

  • Calcular poder após o teste não muda a interpretação.377

  • A análise do poder é teoricamente incorreta, uma vez que a probabilidade calculada \(1-\beta\) expressa a probabilidade de um evento futuro, o que não é mais relevante quando o evento de interesse já ocorreu.225,374


46.1.5 O que pode ser realizado ao invés da análise de poder?

  • Após a coleta e análise de dados, recomenda-se realizar a análise e interpretação dos resultados a partir do tamanho do efeito e do seu intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido.374


46.1.6 Por que o desequilíbrio entre grupos pode ser problemático para o poder do teste?

  • O desequilíbrio entre grupos pode reduzir o poder estatístico do teste, especialmente quando o efeito esperado é pequeno ou moderado.378

  • O tamanho total da amostra influencia mais o poder do que o desequilíbrio isoladamente. Em estudos pequenos, o desequilíbrio pode reduzir o poder de forma clinicamente relevante.378

  • Remover participantes para “corrigir” desequilíbrio pode reduzir ainda mais o poder do estudo do que manter o desequilíbrio existente.378

  • O controle inadequado da randomização compromete a validade interna do ensaio.378


46.2 Poder observado


46.2.1 Qual é a relação entre poder observado e P-valor?

  • O chamado “poder observado” é uma transformação matemática direta do P-valor; portanto, não adiciona qualquer nova informação à interpretação do teste estatístico.377

  • Se o P-valor é não significativo, o poder observado será baixo.377

  • Se o P-valor é limítrofe, o poder observado \(≈ 0,5\).377

  • Se o P-valor é altamente significativo, o poder observado será alto.377


46.3 Poder de salvaguarda


46.3.1 O que é poder de salvaguarda?

  • Poder de salvaguarda é uma abordagem prospectiva de análise de poder que incorpora explicitamente a incerteza do tamanho de efeito estimado no estudo original.379

  • Em vez de utilizar diretamente o tamanho de efeito observado, utiliza-se o limite inferior do intervalo de confiança do tamanho de efeito como estimativa conservadora do efeito populacional.379

  • O método reconhece que o intervalo de confiança representa o conjunto de valores plausíveis para o verdadeiro efeito populacional e, portanto, deve ser considerado no planejamento amostral.379

  • O poder de salvaguarda aumenta a probabilidade de que o poder nominal planejado seja efetivamente alcançado no estudo futuro.379

  • O método não substitui a interpretação baseada em tamanho de efeito e intervalo de confiança, mas constitui uma estratégia mais prudente para o planejamento prospectivo de estudos confirmatórios ou de replicação.379


46.3.2 Por que utilizar o poder de salvaguarda?

  • A análise de poder tradicional utiliza o tamanho de efeito observado como se fosse o verdadeiro valor populacional, desconsiderando a imprecisão inerente à estimativa amostral.379

  • Em amostras pequenas ou moderadas, o tamanho de efeito observado pode estar superestimado devido à variabilidade amostral e viés de publicação.379

  • Caso o efeito verdadeiro seja menor do que o observado inicialmente, o poder real do estudo planejado poderá ser substancialmente inferior ao poder nominal desejado.379

  • Simulações demonstram que, em cenários comuns de pesquisa com efeitos pequenos a moderados, o poder tradicional frequentemente produz poder real inferior ao planejado, enquanto o poder de salvaguarda tende a oferecer proteção contra esse subdimensionamento.379

  • A adoção do limite inferior do intervalo de confiança operacionaliza um nível explícito de proteção contra superestimação do tamanho de efeito.379



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

225.
Cummings P, Rivara FP. Reporting Statistical Information in Medical Journal Articles. Archives of Pediatrics & Adolescent Medicine. 2003;157(4):321. doi:10.1001/archpedi.157.4.321
252.
Curran-Everett D. Explorations in statistics: hypothesis tests and P values. Advances in Physiology Education. 2009;33(2):81–86. doi:10.1152/advan.90218.2008
277.
Lakens D, Caldwell A. Simulation-Based Power Analysis for Factorial Analysis of Variance Designs. Advances in Methods and Practices in Psychological Science. 2021;4:251524592095150. doi:10.1177/2515245920951503
283.
Champely S. pwr: Basic Functions for Power Analysis.; 2020. https://CRAN.R-project.org/package=pwr.
374.
Heckman MG, Davis JM, Crowson CS. Post Hoc Power Calculations: An Inappropriate Method for Interpreting the Findings of a Research Study. The Journal of Rheumatology. 2022;49(8):867–870. doi:10.3899/jrheum.211115
375.
Iddi S, Donohue MC. Power and Sample Size for Longitudinal Models in R – The longpower Package and Shiny App. The R Journal. 2022;14:264–282.
376.
Baranger DAA, Finsaas MC, Goldstein BL, Vize CE, Lynam DR, Olino TM. Tutorial: Power Analyses for Interaction Effects in Cross-Sectional Regressions. Advances in Methods and Practices in Psychological Science. 2023;6(3):25152459231187531. doi:10.1177/25152459231187531
377.
Hoenig JM, Heisey DM. The Abuse of Power. The American Statistician. 2001;55(1):19–24. doi:10.1198/000313001300339897
378.
Shibasaki WM, Martins RP. Simple randomization may lead to unequal group sizes. Is that a problem? American Journal of Orthodontics and Dentofacial Orthopedics. 2018;154(4):600–605. doi:10.1016/j.ajodo.2018.07.005
379.
Perugini M, Gallucci M, Costantini G. Safeguard Power as a Protection Against Imprecise Power Estimates. Perspectives on Psychological Science. 2014;9(3):319–332. doi:10.1177/1745691614528519