Capítulo 25 Análise inferencial


25.1 Raciocínio inferencial


25.1.1 O que é análise inferencial?

  • Na análise inferencial são utilizados dados da(s) amostra(s) para fazer uma inferência válida (isto é, estimativa) sobre os parâmetros populacionais desconhecidos.108

  • No paradigma de Jerzy Neyman e Egon Pearson, um teste de hipótese científica envolve a tomada de decisão sobre hipóteses nulas (\(H_{0}\)) e alternativa (\(H_{1}\)) concorrentes e mutuamente exclusivas.260


25.1.2 Quais são os tipos de raciocínio inferencial?

  • Inferência dedutiva: Uma dada hipótese inicial é utilizada para prever o que seria observado caso tal hipótese fosse verdadeira.261

  • Inferência indutiva: Com base nos dados observados, avalia-se qual hipótese é mais defensável (isto é, mais provável).261


25.1.3 Quais são as questões fundamentais da análise inferencial?

  • A direção do efeito262

  • A magnitude do efeito262

  • A importância do efeito262


25.2 Hipóteses científicas


25.2.1 O que é hipótese científica?

  • Hipótese científica é uma ideia que pode ser testada.260

  • Definir claramente os problemas e os objetivos da pesquisa são o ponto de partida de todos os estudos científicos.132

  • Além do papel técnico, os testes de hipótese carregam uma dimensão interpretativa que molda como os pesquisadores comunicam descobertas. Estudos recentes destacam o caráter pragmático e dicotômico dessas decisões.263


25.2.2 Quais são as fontes de ideias para gerar hipóteses científicas?

  • Revisão das práticas atuais.264

  • Desafio a ideias aceitas.264

  • Conflito entre ideias divergentes.264

  • Variações regionais, temporais e populacionais.264

  • Experiências dos próprios pesquisadores.264

  • Imaginação sem fronteiras ou limites convencionais.264


25.3 Hipóteses estatísticas


25.3.1 O que é hipótese nula?

  • A hipótese nula (\(H_{0}\)) é uma expressão que representa o estado atual do conhecimento (status quo), em geral a não existência de um determinado efeito.179


25.3.2 O que é hipótese alternativa?

  • A hipótese alternativa (\(H_{1}\)) é uma expressão que contém as situações que serão testadas, de modo que um resultado positivo indique alguma ação a ser conduzida.179


25.3.3 Qual hipótese está sendo testada?

  • A hipótese nula (\(H_{0}\)) é a hipótese sob teste em análises inferenciais.109

  • Pode-se concluir sobre rejeitar ou não rejeitar a hipótese nula (\(H_{0}\)).109

  • Não se conclui sobre a hipótese alternativa (\(H_{1}\)).179

  • Para testar a hipótese nula, deve-se selecionar o nível de significância crítica (P-valor de corte); a probabilidade de rejeitarmos uma hipótese nula verdadeira (\(\alpha\)); e a probabilidade de não rejeitarmos uma hipótese nula falsa (\(\beta\)).260


25.4 Testes de hipóteses


25.4.1 Quais são os tipos de teste de hipóteses?

  • Teste (clássico) de significância da hipótese nula: verifica evidência contra \(H_{0}\) usando P-valor.265

  • Teste de mínimos efeitos (MOTE/MOST/SESOI): testa se o efeito é pelo menos tão grande quanto um limiar de relevância (SESOI). Rejeitar \(H_{0}\) sugere efeito grande o suficiente.265

  • Teste de equivalência (TOST): testa se o efeito está dentro de uma margem de equivalência clinicamente irrelevante (entre \(\Delta\) e \(-\Delta\)). Rejeitar \(H_{0}\) sugere equivalência prática.265

  • Teste de superioridade: avalia se um tratamento/intervenção supera o controle por uma margem \(>0\) ou \(>\Delta\).265

  • Teste de não-inferioridade: avalia se o tratamento não é pior que o controle por mais do que \(-\Delta\).REF?

  • Teste de inferioridade: avalia se o tratamento é pior que o controle (por exemplo, para checar segurança).REF?


25.4.2 O que reportar após um teste de hipótese?

  • P-valores, como estimativa da significância estatística.266

  • Tamanho do efeito, como estimativa de significância substantiva.266


25.5 Comparações múltiplas


25.5.1 O que é uma família de hipóteses?

  • Família de hipóteses é um conjunto de comparações/inferências que, por desenho ou análise, devem ser consideradas juntas para controle do erro tipo I global (ex.: todas as comparações de um desfecho primário, todos os subgrupos pré-especificados, todos os desfechos coprimários).REF?

  • O controle do family-wise error rate (FWER) ou do false discovery rate (FDR) deve considerar a família pertinente, não comparações isoladas.REF?


25.5.2 O que são testes ad hoc e post hoc?

  • Ad hoc: análises/decisões não planejadas a priori, motivadas por inspeção dos dados. Úteis para gerar hipóteses, não para confirmá-las.REF?

  • Post hoc: procedimentos de comparações múltiplas aplicados após um teste global ter indicado efeito significativo. Visam controlar o erro tipo I em múltiplas comparações.REF?


25.5.3 Como ajustar a análise inferencial para hipóteses múltiplas?

  • Defina a família (o que entra no ajuste) e priorize desfechos (primário, coprimários, secundários).REF?

  • Aplique métodos de controle FWER (Bonferroni, Holm, Hochberg, Dunnett para múltiplos vs. controle) ou controle FDR (Benjamini–Hochberg) conforme o objetivo (confirmação vs. exploração).REF?

  • Em planos confirmatórios, use hierarquização/gatekeeping: testa-se em sequência; a alocação de \(\alpha\) passa adiante apenas se houver significância no nível anterior.REF?



25.5.4 O que são testes unicaudais e bicaudais?

  • Teste unicaudal procura evidência em uma direção específica (ex.: “maior que 0”). Toda a região crítica está numa só cauda; tem maior poder para aquela direção, mas não detecta sinal oposto.REF?


Representação gráfica de um teste de hipótese unicaudal à direita, aplicado quando se busca evidência de efeitos positivos (valores significativamente maiores que o esperado sob $H_0$).

Figura 25.1: Representação gráfica de um teste de hipótese unicaudal à direita, aplicado quando se busca evidência de efeitos positivos (valores significativamente maiores que o esperado sob \(H_0\)).


Representação gráfica de um teste de hipótese unicaudal à esquerda, aplicado quando se busca evidência de efeitos negativos (valores significativamente menores que o esperado sob $H_0$).

Figura 25.2: Representação gráfica de um teste de hipótese unicaudal à esquerda, aplicado quando se busca evidência de efeitos negativos (valores significativamente menores que o esperado sob \(H_0\)).


  • Teste bicaudal procura evidência em qualquer direção (ex.: “diferente de 0”). Divide \(\alpha\) em duas caudas (direita e esquerda). É a escolha padrão quando ambas as direções são plausíveis.REF?


Representação gráfica de um teste de hipótese bicaudal, aplicado quando se busca evidência de efeitos positivos ou negativos (valores significativamente diferentes do esperado sob $H_0$).

Figura 25.3: Representação gráfica de um teste de hipótese bicaudal, aplicado quando se busca evidência de efeitos positivos ou negativos (valores significativamente diferentes do esperado sob \(H_0\)).


25.6 Inferência visual


25.6.1 O que é inferência visual?

  • Inferência visual consiste na interpretação de dados apresentados em gráficos.267

  • Para inferência visual, recomenda-se a apresentação dos dados em gráficos com estimativas de tendência central e seu intervalo (preferencialmete intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido).267


25.6.2 Por que usar intervalos de confiança para inferência visual?

  • Intervalos de confiança fornecem estimativas pontuais e intervalares na mesma unidade de medida da variável.267

  • Existe uma relação entre o intervalo de confiança e o P-valor obtido pelo teste de significância de hipótese nula \(H_{0}\), em que ambos consideram o mesmo nível de significância \(\alpha\) pré-estabelecido.267


25.6.3 Como interpretar intervalos de confiança em uma figura?

  • Identifique o que as tendências centrais e as barras de erro representam. Qual é a variável dependente? É expressa em unidades originais ou é padronizada ? A figura mostra intervalos de confiança, erro-padrão ou desvio-padrão? Qual é o desenho experimental?267

  • Faça uma interpretação substantiva dos valores de tendência central e dos intervalos de confiança.267

  • O intervalo de confiança é uma faixa de valores plausíveis para a tendência central. Valores fora do intervalo são relativamente implausíveis, no nível de significância \(\alpha\) pré-estabelecido.267

  • Qualquer valor fora do intervalo de confiança, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P < \alpha\) pré-estabelecido (bicaudal).267

  • Qualquer valor dentro do intervalo, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P > \alpha\) pré-estabelecido (bicaudal).267


25.7 Interpretação de análise inferencial


25.7.1 Como interpretar uma análise inferencial?

  • Testes de hipótese nula (\(H_{0}\)) vs. alternativa (\(H_{1}\)) a partir de um nível de significância (\(\alpha\)) pré-especificado.268

  • P-valor como evidência estatística sobre (\(H_{0}\)).268

  • Estimação de intervalos de confiança de um nível de significância (\(\alpha\)) pré-especificado bicaudal (\(IC_{1-\alpha/2}\)) ou unicaudal (\(IC_{1-\alpha}\)).268

  • Análise Bayesiana.268


25.7.2 O que são resultados positivos” e “negativos” (inconclusivos) em teste de hipótese?

  • Resultados “positivos” compreendem um P-valor dentro da zona crítica estatisticamente significativa (ex.: \(P<0,05\) ou outro ponto de corte) e sugerem que os autores rejeitem a hipótese nula (\(H_{0}\)), confirmando assim sua hipótese científica.269

  • Resultados “negativos” ou inconclusivos compreendem um P-valor fora da zona crítica estatisticamente significativa (ex.: \(P \geq 0,05\) ou outro ponto de corte) e sugerem que os autores não rejeitem a hipótese nula (\(H_{0}\)) porque o efeito observado é nulo (logo, “negativo”), ou porque o estudo não possui poder suficiente para detectá-lo, não permitindo portanto afirmar a hipótese científica (logo, inconclusivo).269


25.7.3 Qual a importância de resultados “negativos”?

  • Conhecer resultados negativos contribui com uma visão mais ampla do campo de estudo junto aos resultados positivos.270

  • Resultados negativos permitem um melhor planejamento das pesquisas futuras e pode aumentar suas chances de sucesso.270


25.7.4 Resultados inconclusivos: Ausência de evidência ou evidência de ausência?

  • Em estudos (geralmente com amostras grandes), resultados estatisticamente significativos (com P-valores menores do limiar pré-estabelecido, \(P<\alpha\)) podem não ser clinicamente relevantes.271

  • Em estudos (geralmente com amostras pequenas), resultados estatisticamente não significativos (com P-valores iguais ou maiores do limiar pré-estabelecido, \(P \geq \alpha\)) não devem ser interpretados como evidência de inexistência do efeito.271

  • Geralmente é razoável aceitar uma nova conclusão apenas quando há dados a seu favor (‘resultados positivos’). Também é razoável questionar se apenas a ausência de dados a seu favor (‘resultados negativos’) justifica suficientemente a rejeição de tal conclusão.271

  • A prática estatística convencional tende a reduzir a incerteza científica a decisões docotômicas. Essa simplificação, embora pragmática, possui implicações epistemológicas importantes: os testes de hipótese produzem não apenas juízos empíricos, mas também atos de fala pragmáticos que comunicam graus de confiança e orientam ações científicas.263


25.8 Erros de inferência


25.8.1 O que são erros de inferência estatística?

  • Um erro de inferência é a tomada de decisão incorreta, seja a favor ou contra a hipótese nula (\(H_{0}\)).260


25.8.2 O que são erros Tipo I e Tipo II?

  • Erro Tipo I significa a rejeição de uma hipótese nula (\(H_{0}\)) quando esta é verdadeira.260

  • Erro Tipo II significa a não rejeição de uma hipótese nula (\(H_{0}\)) quando esta é falsa.260


Tabela 25.1: Tabela de erros tipos I e II de inferência estatística.
Hipótese nula \(H_{0}\) é falsa Hipótese nula \(H_{0}\) é verdadeira
Hipótese nula \(H_{0}\) foi rejeitada Decisão correta Decisão incorreta (erro tipo I)
Hipótese nula \(H_{0}\) não foi rejeitada Decisão incorreta (erro tipo II) Decisão correta


Representação gráfica dos erros tipo I e tipo II em um teste de hipótese (bicaudal).

Figura 25.4: Representação gráfica dos erros tipo I e tipo II em um teste de hipótese (bicaudal).


Erro tipo I: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 30. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.

Figura 25.5: Erro tipo I: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 30. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.


Erro tipo II: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 10. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.

Figura 25.6: Erro tipo II: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 10. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.


25.8.3 O que são erros Tipo S e Tipo M?

  • Erro Tipo S (do inglês sign) significa a identificação errônea da direção — positiva ou negativa — do efeito observado.272,273


Tabela 25.2: Tabela de erro tipo S de inferência estatística.
Sinal positivo Sinal negativo
Sinal positivo Decisão correta Decisão incorreta (erro tipo S)
Sinal negativo Decisão incorreta (erro tipo S) Decisão correta


Representação gráfica do erro tipo S (sinal) em um teste de hipótese (bicaudal).

Figura 25.7: Representação gráfica do erro tipo S (sinal) em um teste de hipótese (bicaudal).


  • Erro Tipo M (do inglês magnitude) significa a identificação errônea — em geral, exagerada — da magnitude do efeito observado.272,273


Tabela 25.3: Tabela de erro tipo M de inferência estatística.
Magnitude alta Magnitude baixa
Magnitude alta Decisão correta Decisão incorreta (erro tipo M)
Magnitude baixa Decisão incorreta (erro tipo M) Decisão correta


Representação gráfica do erro tipo M (magnitude) em um teste de hipótese (bicaudal).

Figura 25.8: Representação gráfica do erro tipo M (magnitude) em um teste de hipótese (bicaudal).



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

108.
Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375–1380. doi:10.1213/ane.0000000000002370
109.
Ali Z, Bhaskar Sb. Basic statistical tools in research and data analysis. Indian Journal of Anaesthesia. 2016;60(9):662. doi:10.4103/0019-5049.190623
132.
Smeden M van. A Very Short List of Common Pitfalls in Research Design, Data Analysis, and Reporting. PRiMER. 2022;6. doi:10.22454/PRiMER.2022.511416
141.
R Core Team. R: A Language and Environment for Statistical Computing.; 2023. https://www.R-project.org/.
179.
Kanji G. 100 Statistical Tests. SAGE Publications Ltd; 2006. doi:10.4135/9781849208499
260.
Curran-Everett D. Explorations in statistics: hypothesis tests and P values. Advances in Physiology Education. 2009;33(2):81–86. doi:10.1152/advan.90218.2008
261.
Goodman SN. Toward Evidence-Based Medical Statistics. 1: The P Value Fallacy. Annals of Internal Medicine. 1999;130(12):995. doi:10.7326/0003-4819-130-12-199906150-00008
262.
McCaskey K, Rainey C. Substantive Importance and the Veil of Statistical Significance. Statistics, Politics and Policy. 2015;6(1-2). doi:10.1515/spp-2015-0001
264.
Vandenbroucke JP, Pearce N. From ideas to studies: how to get ideas and sharpen them into research questions. Clinical Epidemiology. 2018;Volume 10:253–264. doi:10.2147/clep.s142940
265.
Lakens D, Scheel AM, Isager PM. Equivalence Testing for Psychological Research: A Tutorial. Advances in Methods and Practices in Psychological Science. 2018;1(2):259–269. doi:10.1177/2515245918770963
266.
Sullivan GM, Feinn R. Using Effect Sizeor Why the P Value Is Not Enough. Journal of Graduate Medical Education. 2012;4(3):279–282. doi:10.4300/jgme-d-12-00156.1
267.
Cumming G, Finch S. Inference by Eye: Confidence Intervals and How to Read Pictures of Data. American Psychologist. 2005;60(2):170–180. doi:10.1037/0003-066x.60.2.170
268.
Goodman SN. Aligning statistical and scientific reasoning. Science. 2016;352(6290):1180–1181. doi:10.1126/science.aaf5406
269.
Greenhalgh T. How to read a paper: Statistics for the non-statistician. II: ̈Significanẗ relations and their pitfalls. BMJ. 1997;315(7105):422–425. doi:10.1136/bmj.315.7105.422
270.
Weintraub PG. The Importance of Publishing Negative Results. Journal of Insect Science. 2016;16(1):109. doi:10.1093/jisesa/iew092
271.
Altman DG, Bland JM. Statistics notes: Absence of evidence is not evidence of absence. BMJ. 1995;311(7003):485–485. doi:10.1136/bmj.311.7003.485
272.
Gelman A, Carlin J. Beyond Power Calculations. Perspectives on Psychological Science. 2014;9(6):641–651. doi:10.1177/1745691614551642
273.
Lu J, Qiu Y, Deng A. A note on Type S/M errors in hypothesis testing. British Journal of Mathematical and Statistical Psychology. 2018;72(1):1–17. doi:10.1111/bmsp.12132