Capítulo 24 Análise inferencial


24.1 Raciocínio inferencial


24.1.1 O que é análise inferencial?

  • Na análise inferencial são utilizados dados da(s) amostra(s) para fazer uma inferência válida (isto é, estimativa) sobre os parâmetros populacionais desconhecidos.109

  • No paradigma de Jerzy Neyman e Egon Pearson, um teste de hipótese científica envolve a tomada de decisão sobre hipóteses nulas (\(H_{0}\)) e alternativa (\(H_{1}\)) concorrentes e mutuamente exclusivas.243


24.1.2 Quais são os tipos de raciocínio inferencial?

  • Inferência dedutiva: Uma dada hipótese inicial é utilizada para prever o que seria observado caso tal hipótese fosse verdadeira.244

  • Inferência indutiva: Com base nos dados observados, avalia-se qual hipótese é mais defensável (isto é, mais provável).244


24.1.3 Quais são as questões fundamentais da análise inferencial?

  • A direção do efeito245

  • A magnitude do efeito245

  • A importância do efeito245


24.2 Hipóteses científicas


24.2.1 O que é hipótese científica?

  • Hipótese científica é uma ideia que pode ser testada.243

  • Definir claramente os problemas e os objetivos da pesquisa são o ponto de partida de todos os estudos científicos.133


24.2.2 Quais são as fontes de ideias para gerar hipóteses científicas?

  • Revisão das práticas atuais.246

  • Desafio a ideias aceitas.246

  • Conflito entre ideias divergentes.246

  • Variações regionais, temporais e populacionais.246

  • Experiências dos próprios pesquisadores.246

  • Imaginação sem fronteiras ou limites convencionais.246


24.3 Hipóteses estatísticas


24.3.1 O que é hipótese nula?

  • A hipótese nula (\(H_{0}\)) é uma expressão que representa o estado atual do conhecimento (status quo), em geral a não existência de um determinado efeito.217


24.3.2 O que é hipótese alternativa?

  • A hipótese alternativa (\(H_{1}\)) é uma expressão que contém as situações que serão testadas, de modo que um resultado positivo indique alguma ação a ser conduzida.217


24.3.3 Qual hipótese está sendo testada?

  • A hipótese nula (\(H_{0}\)) é a hipótese sob teste em análises inferenciais.110

  • Pode-se concluir sobre rejeitar ou não rejeitar a hipótese nula (\(H_{0}\)).110

  • Não se conclui sobre a hipótese alternativa (\(H_{1}\)).217

  • Para testar a hipótese nula, deve-se selecionar o nível de significância crítica (P-valor de corte); a probabilidade de rejeitarmos uma hipótese nula verdadeira (\(\alpha\)); e a probabilidade de não rejeitarmos uma hipótese nula falsa (\(\beta\)).243


24.4 Testes de hipóteses


24.4.1 Quais são os tipos de teste de hipóteses?

  • Teste (clássico) de significância da hipótese nula.247

  • Teste de mínimos efeitos.247

  • Teste de equivalência.247

  • Teste de inferioridade.247

  • Teste de não-inferioridade.REF?

  • Teste de superioridade.REF?


24.4.2 O que é uma família de hipóteses?


24.4.3 O que são testes ad hoc e post hoc?


24.4.4 Como ajustar a análise inferencial para hipóteses múltiplas?



24.4.5 O que são testes unicaudais e bicaudais?


Representação gráfica de um teste de hipótese unicaudal à direita, aplicado quando se busca evidência de efeitos positivos (valores significativamente maiores que o esperado sob $H_0$).

Figura 24.1: Representação gráfica de um teste de hipótese unicaudal à direita, aplicado quando se busca evidência de efeitos positivos (valores significativamente maiores que o esperado sob \(H_0\)).


Representação gráfica de um teste de hipótese unicaudal à esquerda, aplicado quando se busca evidência de efeitos negativos (valores significativamente menores que o esperado sob $H_0$).

Figura 24.2: Representação gráfica de um teste de hipótese unicaudal à esquerda, aplicado quando se busca evidência de efeitos negativos (valores significativamente menores que o esperado sob \(H_0\)).


Representação gráfica de um teste de hipótese bicaudal, aplicado quando se busca evidência de efeitos positivos ou negativos (valores significativamente diferentes do esperado sob $H_0$).

Figura 24.3: Representação gráfica de um teste de hipótese bicaudal, aplicado quando se busca evidência de efeitos positivos ou negativos (valores significativamente diferentes do esperado sob \(H_0\)).


24.4.6 O que reportar após um teste de hipótese?

  • P-valores, como estimativa da significância estatística.248

  • Tamanho do efeito, como estimativa de significância substantiva (clínica).248


24.5 Inferência visual


24.5.1 O que é inferência visual?

  • Inferência visual consiste na interpretação de dados apresentados em gráficos.249

  • Para inferência visual, recomenda-se a apresentação dos dados em gráficos com estimativas de tendência central e seu intervalo (preferencialmete intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido).249


24.5.2 Por que usar intervalos de confiança para inferência visual?

  • Intervalos de confiança fornecem estimativas pontuais e intervalares na mesma unidade de medida da variável.249

  • Existe uma relação entre o intervalo de confiança e o valor de P obtido pelo teste de significância de hipótese nula, em que ambos consideram o mesmo nível de significância \(\alpha\) pré-estabelecido.249


24.5.3 Como interpretar intervalos de confiança em uma figura?

  • Identifique o que as tendências centrais e as barras de erro representam. Qual é a variável dependente? É expressa em unidades originais ou é padronizada ? A figura mostra intervalos de confiança, erro-padrão ou desvio-padrão? Qual é o desenho experimental?249

  • Faça uma interpretação substantiva dos valores de tendência central e dos intervalos de confiança.249

  • O intervalo de confiança é uma faixa de valores plausíveis para a tendência central. Valores fora do intervalo são relativamente implausíveis, no nível de significância \(\alpha\) pré-estabelecido.249

  • Qualquer valor fora do intervalo de confiança, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P < \alpha\) pré-estabelecido (bicaudal).249

  • Qualquer valor dentro do intervalo, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P > \alpha\) pré-estabelecido (bicaudal).249


24.6 Interpretação de análise inferencial


24.6.1 Como interpretar uma análise inferencial?

  • Testes de hipótese nula (\(H_{0}\)) vs. alternativa (\(H_{1}\)) a partir de um nível de significância (\(\alpha\)) pré-especificado.250

  • P-valor como evidência estatística sobre (\(H_{0}\)).250

  • Estimação de intervalos de confiança de um nível de significância (\(\alpha\)) pré-especificado bicaudal (\(IC_{1-\alpha/2}\)) ou unicaudal (\(IC_{1-\alpha}\)).250

  • Análise Bayesiana.250


24.6.2 O que são resultados ‘positivos’ e ‘negativos’ ou inconclusivos em teste de hipótese?

  • Resultados ‘positivos’ compreendem um P-valor dentro da zona crítica estatisticamente significativa (ex.: \(P<0,05\) ou outro ponto de corte) e sugerem que os autores rejeitem a hipótese nula \(H_{0}\), confirmando assim sua hipótese científica.251

  • Resultados ‘negativos’ ou inconclusivos compreendem um P-valor fora da zona crítica estatisticamente significativa (ex.: \(P \geq 0,05\) ou outro ponto de corte) e sugerem que os autores não rejeitem a hipótese nula \(H_{0}\) porque o efeito observado é nulo (logo, negativo), ou porque o estudo não possui poder suficiente para detectá-lo, não permitindo portanto afirmar a hipótese científica (logo, inconclusivo).251


24.6.3 Qual a importância de resultados ‘negativos’?

  • Conhecer resultados negativos contribui com uma visão mais ampla do campo de estudo junto aos resultados positivos.252

  • Resultados negativos permitem um melhor planejamento das pesquisas futuras e pode aumentar suas chances de sucesso.252


24.6.4 Resultados inconclusivos: Ausência de evidência ou evidência de ausência?

  • Em estudos (geralmente com amostras grandes), resultados estatisticamente significativos (com P-valores menores do limiar pré-estabelecido, \(P<\alpha\)) podem não ser clinicamente relevantes.253

  • Em estudos (geralmente com amostras pequenas), resultados estatisticamente não significativos (com P-valores iguais ou maiores do limiar pré-estabelecido, \(P \geq \alpha\)) não devem ser interpretados como evidência de inexistência do efeito.253

  • Geralmente é razoável aceitar uma nova conclusão apenas quando há dados a seu favor (‘resultados positivos’). Também é razoável questionar se apenas a ausência de dados a seu favor (‘resultados negativos’) justifica suficientemente a rejeição de tal conclusão.253


24.7 Erros de inferência


24.7.1 O que são erros de inferência estatística?

  • Um erro de inferência é a tomada de decisão incorreta, seja a favor ou contra a hipótese nula \(H_{0}\).243


24.7.2 O que são erros Tipo I e Tipo II?

  • Erro Tipo I significa a rejeição de uma hipótese nula (\(H_{0}\)) quando esta é verdadeira.243

  • Erro Tipo II significa a não rejeição de uma hipótese nula (\(H_{0}\)) quando esta é falsa.243


Tabela 24.1: Tabela de erros tipos I e II de inferência estatística.
Hipótese nula \(H_{0}\) é falsa Hipótese nula \(H_{0}\) é verdadeira
Hipótese nula \(H_{0}\) foi rejeitada Decisão correta Decisão incorreta (erro tipo I)
Hipótese nula \(H_{0}\) não foi rejeitada Decisão incorreta (erro tipo II) Decisão correta


Representação gráfica dos erros tipo I e tipo II em um teste de hipótese (bicaudal).

Figura 24.4: Representação gráfica dos erros tipo I e tipo II em um teste de hipótese (bicaudal).


Erro tipo I: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 30. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.

Figura 24.5: Erro tipo I: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 30. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.


Erro tipo II: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 10. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.

Figura 24.6: Erro tipo II: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 10. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.


24.7.3 O que são erros Tipo S e Tipo M?

  • Erro Tipo S (do inglês sign) significa a identificação errônea da direção - positiva ou negativa - do efeito observado.254,255


Tabela 24.2: Tabela de erro tipo S de inferência estatística.
Sinal positivo Sinal negativo
Sinal positivo Decisão correta Decisão incorreta (erro tipo S)
Sinal negativo Decisão incorreta (erro tipo S) Decisão correta


Representação gráfica do erro tipo S (sinal) em um teste de hipótese (bicaudal).

Figura 24.7: Representação gráfica do erro tipo S (sinal) em um teste de hipótese (bicaudal).


  • Erro Tipo M (do inglês magnitude) significa a identificação errônea - em geral, exagerada - da magnitude do efeito observado.254,255


Tabela 24.3: Tabela de erro tipo M de inferência estatística.
Magnitude alta Magnitude baixa
Magnitude alta Decisão correta Decisão incorreta (erro tipo M)
Magnitude baixa Decisão incorreta (erro tipo M) Decisão correta


Representação gráfica do erro tipo M (magnitude) em um teste de hipótese (bicaudal).

Figura 24.8: Representação gráfica do erro tipo M (magnitude) em um teste de hipótese (bicaudal).



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

109.
Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375–1380. doi:10.1213/ane.0000000000002370
110.
Ali Z, Bhaskar Sb. Basic statistical tools in research and data analysis. Indian Journal of Anaesthesia. 2016;60(9):662. doi:10.4103/0019-5049.190623
133.
Smeden M van. A Very Short List of Common Pitfalls in Research Design, Data Analysis, and Reporting. PRiMER. 2022;6. doi:10.22454/PRiMER.2022.511416
142.
R Core Team. R: A Language and Environment for Statistical Computing.; 2023. https://www.R-project.org/.
217.
Kanji G. 100 Statistical Tests. SAGE Publications Ltd; 2006. doi:10.4135/9781849208499
243.
Curran-Everett D. Explorations in statistics: hypothesis tests and P values. Advances in Physiology Education. 2009;33(2):81–86. doi:10.1152/advan.90218.2008
244.
Goodman SN. Toward Evidence-Based Medical Statistics. 1: The P Value Fallacy. Annals of Internal Medicine. 1999;130(12):995. doi:10.7326/0003-4819-130-12-199906150-00008
245.
McCaskey K, Rainey C. Substantive Importance and the Veil of Statistical Significance. Statistics, Politics and Policy. 2015;6(1-2). doi:10.1515/spp-2015-0001
246.
Vandenbroucke JP, Pearce N. From ideas to studies: how to get ideas and sharpen them into research questions. Clinical Epidemiology. 2018;Volume 10:253–264. doi:10.2147/clep.s142940
247.
Lakens D, Scheel AM, Isager PM. Equivalence Testing for Psychological Research: A Tutorial. Advances in Methods and Practices in Psychological Science. 2018;1(2):259–269. doi:10.1177/2515245918770963
248.
Sullivan GM, Feinn R. Using Effect Sizeor Why the P Value Is Not Enough. Journal of Graduate Medical Education. 2012;4(3):279–282. doi:10.4300/jgme-d-12-00156.1
249.
Cumming G, Finch S. Inference by Eye: Confidence Intervals and How to Read Pictures of Data. American Psychologist. 2005;60(2):170–180. doi:10.1037/0003-066x.60.2.170
250.
Goodman SN. Aligning statistical and scientific reasoning. Science. 2016;352(6290):1180–1181. doi:10.1126/science.aaf5406
251.
Greenhalgh T. How to read a paper: Statistics for the non-statistician. II: ̈Significanẗ relations and their pitfalls. BMJ. 1997;315(7105):422–425. doi:10.1136/bmj.315.7105.422
252.
Weintraub PG. The Importance of Publishing Negative Results. Journal of Insect Science. 2016;16(1):109. doi:10.1093/jisesa/iew092
253.
Altman DG, Bland JM. Statistics notes: Absence of evidence is not evidence of absence. BMJ. 1995;311(7003):485–485. doi:10.1136/bmj.311.7003.485
254.
Gelman A, Carlin J. Beyond Power Calculations. Perspectives on Psychological Science. 2014;9(6):641–651. doi:10.1177/1745691614551642
255.
Lu J, Qiu Y, Deng A. A note on Type S/M errors in hypothesis testing. British Journal of Mathematical and Statistical Psychology. 2018;72(1):1–17. doi:10.1111/bmsp.12132