Capítulo 18 Análise inferencial


18.1 Raciocínio inferencial


18.1.1 O que é análise inferencial?

  • Na análise inferencial são utilizados dados da(s) amostra(s) para fazer uma inferência válida (isto é, estimativa) sobre os parâmetros populacionais desconhecidos.76

  • No paradigma de Jerzy Neyman e Egon Pearson, um teste de hipótese científica envolve a tomada de decisão sobre hipóteses nulas (\(H_{0}\)) e alternativa (\(H_{1}\)) concorrentes e mutuamente exclusivas.182


18.1.2 Quais são os tipos de raciocínio inferencial?

  • Inferência dedutiva: Uma dada hipótese inicial é utilizada para prever o que seria observado caso tal hipótese fosse verdadeira.183

  • Inferência indutiva: Com base nos dados observados, avalia-se qual hipótese é mais defensável (isto é, mais provável).183


18.1.3 Quais são as questões fundamentais da análise inferencial?

  • A direção do efeito184

  • A magnitude do efeito184

  • A importância do efeito184


18.2 Hipóteses científicas


18.2.1 O que é hipótese científica?

  • Hipótese científica é uma ideia que pode ser testada.182

  • Definir claramente os problemas e os objetivos da pesquisa são o ponto de partida de todos os estudos científicos.75


18.2.2 Quais são as fontes de ideias para gerar hipóteses científicas?

  • Revisão das práticas atuais.185

  • Desafio a ideias aceitas.185

  • Conflito entre ideias divergentes.185

  • Variações regionais, temporais e populacionais.185

  • Experiências dos próprios pesquisadores.185

  • Imaginação sem fronteiras ou limites convencionais.185


18.3 Hipóteses estatísticas


18.3.1 O que é hipótese nula?

  • A hipótese nula (\(H_{0}\)) é uma expressão que representa o estado atual do conhecimento (status quo), em geral a não existência de um determinado efeito.135


18.3.2 O que é hipótese alternativa?

  • A hipótese alternativa (\(H_{1}\)) é uma expressão que contém as situações que serão testadas, de modo que um resultado positivo indique alguma ação a ser conduzida.135


18.3.3 Qual hipótese está sendo testada?

  • A hipótese nula (\(H_{0}\)) é a hipótese sob teste em análises inferenciais.105

  • Pode-se concluir sobre rejeitar ou não rejeitar a hipótese nula (\(H_{0}\)).105

  • Não se conclui sobre a hipótese alternativa (\(H_{1}\)).135

  • Para testar a hipótese nula, deve-se selecionar o nível de significância crítica (P-valor de corte); a probabilidade de rejeitarmos uma hipótese nula verdadeira (\(\alpha\)); e a probabilidade de não rejeitarmos uma hipótese nula falsa (\(\beta\)).182


18.4 Testes de hipóteses


18.4.1 Quais são os tipos de teste de hipóteses?

  • Teste (clássico) de significância da hipótese nula.186

  • Teste de mínimos efeitos.186

  • Teste de equivalência.186

  • Teste de inferioridade.186

  • Teste de não-inferioridade.REF?

  • Teste de superioridade.REF?


18.4.2 O que é uma família de hipóteses?


18.4.3 O que são testes ad hoc e post hoc?


18.4.4 Como ajustar a análise inferencial para hipóteses múltiplas?



18.4.5 O que são testes unicaudais e bicaudais?


18.4.6 O que reportar após um teste de hipótese?

  • P-valores, como estimativa da significância estatística.187

  • Tamanho do efeito, como estimativa de significância substantiva (clínica).187


18.5 Poder do teste


18.5.1 O que é poder do teste?

  • Poder do teste é a probabilidade de rejeitar corretamente a hipótese nula (\(H_{0}\)) quando esta é falsa.182

  • Poder do teste pode ser calculado como (\(1 - \beta\)).182


18.5.2 O que é análise de poder do teste?

  • Poder é a probabilidade de que um dado tamanho de efeito será observado em um experimento futuro sob um conjunto de hipóteses - tamanho de efeito real e erro tipo I - para um dado tamanho de amostra.188

  • O objetivo geral da análise de poder ao projetar um estudo é escolher um tamanho de amostra que controle os 2 tipos de erros de inferência estatística: tipo I (\(\alpha\), resultado falso-positivo) e tipo II (\(\beta\), resultado falso-negativo).188

  • Numericamente, o poder de um estudo é calculado como \(1-\beta\) e reportado em valor percentual.188


18.5.3 Quando realizar a análise de poder do teste?

  • Na fase de projeto de pesquisa: a análise de poder para determinar o tamanho da amostra objetiva que o tamanho da amostra permita uma probabilidade razoável de detectar um efeito significativo pré-especificado.188

  • Após a coleta de dados: a análise de poder objetiva informar estudos futuros a respeito do tamanho da amostra necessário para a detecção de um efeito significativo pré-especificado.188




















18.5.4 Por que a análise de poder do teste post hoc é inadequada?

  • A análise do poder é teoricamente incorreta, uma vez que a probabilidade calculada \(1-\beta\) expressa a probabilidade de um evento futuro, o que não é mais relevante quando o evento de interesse já ocorreu.157,188


18.5.5 O que pode ser realizado ao invés da análise de poder?

  • Após a coleta e análise de dados, recomenda-se realizar a análise e interpretação dos resultados a partir do tamanho do efeito e do seu intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido.188


18.6 Inferência visual


18.6.1 O que é inferência visual?

  • Inferência visual consiste na interpretação de dados apresentados em gráficos.193

  • Para inferência visual, recomenda-se a apresentação dos dados em gráficos com estimativas de tendência central e seu intervalo (preferencialmete intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido).193


18.6.2 Por que usar intervalos de confiança para inferência visual?

  • Intervalos de confiança fornecem estimativas pontuais e intervalares na mesma unidade de medida da variável.193

  • Existe uma relação entre o intervalo de confiança e o valor de P obtido pelo teste de significância de hipótese nula, em que ambos consideram o mesmo nível de significância \(\alpha\) pré-estabelecido.193


18.6.3 Como interpretar intervalos de confiança?

  • Identifique o que as tendências centrais e as barras de erro representam. Qual é a variável dependente? É expressa em unidades originais ou é padronizada ? A figura mostra intervalos de confiança, erro-padrão ou desvio-padrão? Qual é o desenho experimental?193

  • Faça uma interpretação substantiva dos valores de tendência central e dos intervalos de confiança.193

  • O intervalo de confiança é uma faixa de valores plausíveis para a tendência central. Valores fora do intervalo são relativamente implausíveis, no nível de significância \(\alpha\) pré-estabelecido.193

  • Qualquer valor fora do intervalo de confiança, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P < \alpha\) pré-estabelecido (bicaudal). Qualquer valor dentro do intervalo, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P > \alpha\) pré-estabelecido (bicaudal).


18.7 Interpretação de análise inferencial


18.7.1 Como interpretar uma análise inferencial?

  • Testes de hipótese nula (\(H_{0}\)) vs. alternativa (\(H_{1}\)) a partir de um nível de significância (\(\alpha\)) pré-especificado.194

  • P-valor como evidência estatística sobre (\(H_{0}\)).194

  • Estimação de intervalos de confiança de um nível de significância (\(\alpha\)) pré-especificado bicaudal (\(IC_{1-\alpha/2}\)) ou unicaudal (\(IC_{1-\alpha}\)).194

  • Análise Bayesiana.194


18.7.2 O que são resultados ‘positivos’ e ‘negativos’ ou inconclusivos em teste de hipótese?

  • Resultados ‘positivos’ compreendem um P-valor dentro da zona crítica estatisticamente significativa (ex.: \(P<0,05\) ou outro ponto de corte) e sugerem que os autores rejeitem a hipótese nula \(H_{0}\), confirmando assim sua hipótese científica.195

  • Resultados ‘negativos’ ou inconclusivos compreendem um P-valor fora da zona crítica estatisticamente significativa (ex.: \(P \geq 0,05\) ou outro ponto de corte) e sugerem que os autores não rejeitem a hipótese nula \(H_{0}\) porque o efeito observado é nulo (logo, negativo), ou porque o estudo não possui poder suficiente para detectá-lo, não permitindo portanto afirmar a hipótese científica (logo, inconclusivo).195


18.7.3 Qual a importância de resultados ‘negativos’?

  • Conhecer resultados negativos contribui com uma visão mais ampla do campo de estudo junto aos resultados positivos.196

  • Resultados negativos permitem um melhor planejamento das pesquisas futuras e pode aumentar suas chances de sucesso.196


18.7.4 Resultados inconclusivos: Ausência de evidência ou evidência de ausência?

  • Em estudos (geralmente com amostras grandes), resultados estatisticamente significativos (com P-valores menores do limiar pré-estabelecido, \(P<\alpha\)) podem não ser clinicamente relevantes.197

  • Em estudos (geralmente com amostras pequenas), resultados estatisticamente não significativos (com P-valores iguais ou maiores do limiar pré-estabelecido, \(P \geq \alpha\)) não devem ser interpretados como evidência de inexistência do efeito.197

  • Geralmente é razoável aceitar uma nova conclusão apenas quando há dados a seu favor (‘resultados positivos’). Também é razoável questionar se apenas a ausência de dados a seu favor (‘resultados negativos’) justifica suficientemente a rejeição de tal conclusão.197


18.8 Erros de inferência


18.8.1 O que são erros de inferência estatística?

  • Um erro de inferência é a tomada de decisão incorreta, seja a favor ou contra a hipótese nula \(H_{0}\).182


18.8.2 O que são erros Tipo I e Tipo II?

  • Erro Tipo I significa a rejeição de uma hipótese nula (\(H_{0}\)) quando esta é verdadeira.182

  • Erro Tipo II significa a não rejeição de uma hipótese nula (\(H_{0}\)) quando esta é falsa.182


Tabela 18.1: Tabela de erros tipos I e II de inferência estatística.
Hipótese nula \(H_{0}\) é falsa Hipótese nula \(H_{0}\) é verdadeira
Hipótese nula \(H_{0}\) foi rejeitada Decisão correta Decisão incorreta (erro tipo I)
Hipótese nula \(H_{0}\) não foi rejeitada Decisão incorreta (erro tipo II) Decisão correta


18.8.3 O que são erros Tipo S e Tipo M?

  • Erro Tipo S (do inglês sign) significa a identificação errônea da direção - positiva ou negativa - do efeito observado.198,199


Tabela 18.2: Tabela de erro tipo S de inferência estatística.
Sinal positivo Sinal negativo
Sinal positivo Decisão correta Decisão incorreta (erro tipo S)
Sinal negativo Decisão incorreta (erro tipo S) Decisão correta


  • Erro Tipo M (do inglês magnitude) significa a identificação errônea - em geral, exagerada - da magnitude do efeito observado.198,199


Tabela 18.3: Tabela de erro tipo M de inferência estatística.
Magnitude alta Magnitude baixa
Magnitude alta Decisão correta Decisão incorreta (erro tipo M)
Magnitude baixa Decisão incorreta (erro tipo M) Decisão correta


Referências

71.
R Core Team. R: A Language and Environment for Statistical Computing.; 2023. https://www.R-project.org/.
75.
Smeden M van. A very short list of common pitfalls in research design, data analysis, and reporting. PRiMER. 2022;6. doi:10.22454/PRiMER.2022.511416
76.
Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375-1380. doi:10.1213/ane.0000000000002370
105.
Ali Z, Bhaskar Sb. Basic statistical tools in research and data analysis. Indian Journal of Anaesthesia. 2016;60(9):662. doi:10.4103/0019-5049.190623
135.
Kanji G. 100 Statistical Tests.; 2006. doi:10.4135/9781849208499
157.
Cummings P, Rivara FP. Reporting Statistical Information in Medical Journal Articles. Archives of Pediatrics & Adolescent Medicine. 2003;157(4):321. doi:10.1001/archpedi.157.4.321
182.
Curran-Everett D. Explorations in statistics: hypothesis tests and P values. Advances in Physiology Education. 2009;33(2):81-86. doi:10.1152/advan.90218.2008
183.
Goodman SN. Toward Evidence-Based Medical Statistics. 1: The P Value Fallacy. Annals of Internal Medicine. 1999;130(12):995. doi:10.7326/0003-4819-130-12-199906150-00008
184.
McCaskey K, Rainey C. Substantive importance and the veil of statistical significance. Statistics, Politics and Policy. 2015;6(1-2). doi:10.1515/spp-2015-0001
185.
Vandenbroucke JP, Pearce N. From ideas to studies: how to get ideas and sharpen them into research questions. Clinical Epidemiology. 2018;Volume 10:253-264. doi:10.2147/clep.s142940
186.
Lakens D, Scheel AM, Isager PM. Equivalence Testing for Psychological Research: A Tutorial. Advances in Methods and Practices in Psychological Science. 2018;1(2):259-269. doi:10.1177/2515245918770963
187.
Sullivan GM, Feinn R. Using Effect Sizeor Why the P Value Is Not Enough. Journal of Graduate Medical Education. 2012;4(3):279-282. doi:10.4300/jgme-d-12-00156.1
188.
Heckman MG, Davis JM, Crowson CS. Post Hoc Power Calculations: An Inappropriate Method for Interpreting the Findings of a Research Study. The Journal of Rheumatology. 2022;49(8):867-870. doi:10.3899/jrheum.211115
189.
Champely S. Pwr: Basic Functions for Power Analysis.; 2020. https://CRAN.R-project.org/package=pwr.
190.
Iddi S, Donohue MC. Power and sample size for longitudinal models in r-the longpower package and shiny app. 2022;14:264-281.
191.
Lakens D, Caldwell A. Simulation-based power analysis for factorial analysis of variance designs. 2021;4:251524592095150. doi:10.1177/2515245920951503
192.
Baranger DAA, Finsaas MC, Goldstein BL, Vize CE, Lynam DR, Olino TM. Tutorial: Power analyses for interaction effects in cross-sectional regressions. 2022. doi:10.31234/osf.io/5ptd7
193.
Cumming G, Finch S. Inference by Eye: Confidence Intervals and How to Read Pictures of Data. American Psychologist. 2005;60(2):170-180. doi:10.1037/0003-066x.60.2.170
194.
Goodman SN. Aligning statistical and scientific reasoning. Science. 2016;352(6290):1180-1181. doi:10.1126/science.aaf5406
195.
Greenhalgh T. How to read a paper: Statistics for the non-statistician. II: ̈Significanẗ relations and their pitfalls. BMJ. 1997;315(7105):422-425. doi:10.1136/bmj.315.7105.422
196.
Weintraub PG. The Importance of Publishing Negative Results. Journal of Insect Science. 2016;16(1):109. doi:10.1093/jisesa/iew092
197.
Altman DG, Bland JM. Statistics notes: Absence of evidence is not evidence of absence. BMJ. 1995;311(7003):485-485. doi:10.1136/bmj.311.7003.485
198.
Gelman A, Carlin J. Beyond Power Calculations. Perspectives on Psychological Science. 2014;9(6):641-651. doi:10.1177/1745691614551642
199.
Lu J, Qiu Y, Deng A. A note on Type S/M errors in hypothesis testing. British Journal of Mathematical and Statistical Psychology. 2018;72(1):1-17. doi:10.1111/bmsp.12132