Capítulo 25 Análise inferencial
25.1 Raciocínio inferencial
25.1.1 O que é análise inferencial?
Na análise inferencial são utilizados dados da(s) amostra(s) para fazer uma inferência válida (isto é, estimativa) sobre os parâmetros populacionais desconhecidos.108
No paradigma de Jerzy Neyman e Egon Pearson, um teste de hipótese científica envolve a tomada de decisão sobre hipóteses nulas (\(H_{0}\)) e alternativa (\(H_{1}\)) concorrentes e mutuamente exclusivas.260
25.1.2 Quais são os tipos de raciocínio inferencial?
Inferência dedutiva: Uma dada hipótese inicial é utilizada para prever o que seria observado caso tal hipótese fosse verdadeira.261
Inferência indutiva: Com base nos dados observados, avalia-se qual hipótese é mais defensável (isto é, mais provável).261
25.2 Hipóteses científicas
25.2.1 O que é hipótese científica?
Hipótese científica é uma ideia que pode ser testada.260
Definir claramente os problemas e os objetivos da pesquisa são o ponto de partida de todos os estudos científicos.132
Além do papel técnico, os testes de hipótese carregam uma dimensão interpretativa que molda como os pesquisadores comunicam descobertas. Estudos recentes destacam o caráter pragmático e dicotômico dessas decisões.263
25.2.2 Quais são as fontes de ideias para gerar hipóteses científicas?
Revisão das práticas atuais.264
Desafio a ideias aceitas.264
Conflito entre ideias divergentes.264
Variações regionais, temporais e populacionais.264
Experiências dos próprios pesquisadores.264
Imaginação sem fronteiras ou limites convencionais.264
25.3 Hipóteses estatísticas
25.3.1 O que é hipótese nula?
- A hipótese nula (\(H_{0}\)) é uma expressão que representa o estado atual do conhecimento (status quo), em geral a não existência de um determinado efeito.179
25.3.2 O que é hipótese alternativa?
- A hipótese alternativa (\(H_{1}\)) é uma expressão que contém as situações que serão testadas, de modo que um resultado positivo indique alguma ação a ser conduzida.179
25.3.3 Qual hipótese está sendo testada?
A hipótese nula (\(H_{0}\)) é a hipótese sob teste em análises inferenciais.109
Pode-se concluir sobre rejeitar ou não rejeitar a hipótese nula (\(H_{0}\)).109
Não se conclui sobre a hipótese alternativa (\(H_{1}\)).179
Para testar a hipótese nula, deve-se selecionar o nível de significância crítica (P-valor de corte); a probabilidade de rejeitarmos uma hipótese nula verdadeira (\(\alpha\)); e a probabilidade de não rejeitarmos uma hipótese nula falsa (\(\beta\)).260
25.4 Testes de hipóteses
25.4.1 Quais são os tipos de teste de hipóteses?
Teste (clássico) de significância da hipótese nula: verifica evidência contra \(H_{0}\) usando P-valor.265
Teste de mínimos efeitos (MOTE/MOST/SESOI): testa se o efeito é pelo menos tão grande quanto um limiar de relevância (SESOI). Rejeitar \(H_{0}\) sugere efeito grande o suficiente.265
Teste de equivalência (TOST): testa se o efeito está dentro de uma margem de equivalência clinicamente irrelevante (entre \(\Delta\) e \(-\Delta\)). Rejeitar \(H_{0}\) sugere equivalência prática.265
Teste de superioridade: avalia se um tratamento/intervenção supera o controle por uma margem \(>0\) ou \(>\Delta\).265
Teste de não-inferioridade: avalia se o tratamento não é pior que o controle por mais do que \(-\Delta\).REF?
Teste de inferioridade: avalia se o tratamento é pior que o controle (por exemplo, para checar segurança).REF?
25.5 Comparações múltiplas
25.5.1 O que é uma família de hipóteses?
Família de hipóteses é um conjunto de comparações/inferências que, por desenho ou análise, devem ser consideradas juntas para controle do erro tipo I global (ex.: todas as comparações de um desfecho primário, todos os subgrupos pré-especificados, todos os desfechos coprimários).REF?
O controle do family-wise error rate (FWER) ou do false discovery rate (FDR) deve considerar a família pertinente, não comparações isoladas.REF?
25.5.2 O que são testes ad hoc e post hoc?
Ad hoc: análises/decisões não planejadas a priori, motivadas por inspeção dos dados. Úteis para gerar hipóteses, não para confirmá-las.REF?
Post hoc: procedimentos de comparações múltiplas aplicados após um teste global ter indicado efeito significativo. Visam controlar o erro tipo I em múltiplas comparações.REF?
25.5.3 Como ajustar a análise inferencial para hipóteses múltiplas?
Defina a família (o que entra no ajuste) e priorize desfechos (primário, coprimários, secundários).REF?
Aplique métodos de controle FWER (Bonferroni, Holm, Hochberg, Dunnett para múltiplos vs. controle) ou controle FDR (Benjamini–Hochberg) conforme o objetivo (confirmação vs. exploração).REF?
Em planos confirmatórios, use hierarquização/gatekeeping: testa-se em sequência; a alocação de \(\alpha\) passa adiante apenas se houver significância no nível anterior.REF?
25.5.4 O que são testes unicaudais e bicaudais?
- Teste unicaudal procura evidência em uma direção específica (ex.: “maior que 0”). Toda a região crítica está numa só cauda; tem maior poder para aquela direção, mas não detecta sinal oposto.REF?
Figura 25.1: Representação gráfica de um teste de hipótese unicaudal à direita, aplicado quando se busca evidência de efeitos positivos (valores significativamente maiores que o esperado sob \(H_0\)).
Figura 25.2: Representação gráfica de um teste de hipótese unicaudal à esquerda, aplicado quando se busca evidência de efeitos negativos (valores significativamente menores que o esperado sob \(H_0\)).
- Teste bicaudal procura evidência em qualquer direção (ex.: “diferente de 0”). Divide \(\alpha\) em duas caudas (direita e esquerda). É a escolha padrão quando ambas as direções são plausíveis.REF?
Figura 25.3: Representação gráfica de um teste de hipótese bicaudal, aplicado quando se busca evidência de efeitos positivos ou negativos (valores significativamente diferentes do esperado sob \(H_0\)).
25.6 Inferência visual
25.6.1 O que é inferência visual?
Inferência visual consiste na interpretação de dados apresentados em gráficos.267
Para inferência visual, recomenda-se a apresentação dos dados em gráficos com estimativas de tendência central e seu intervalo (preferencialmete intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido).267
25.6.2 Por que usar intervalos de confiança para inferência visual?
Intervalos de confiança fornecem estimativas pontuais e intervalares na mesma unidade de medida da variável.267
Existe uma relação entre o intervalo de confiança e o P-valor obtido pelo teste de significância de hipótese nula \(H_{0}\), em que ambos consideram o mesmo nível de significância \(\alpha\) pré-estabelecido.267
25.6.3 Como interpretar intervalos de confiança em uma figura?
Identifique o que as tendências centrais e as barras de erro representam. Qual é a variável dependente? É expressa em unidades originais ou é padronizada ? A figura mostra intervalos de confiança, erro-padrão ou desvio-padrão? Qual é o desenho experimental?267
Faça uma interpretação substantiva dos valores de tendência central e dos intervalos de confiança.267
O intervalo de confiança é uma faixa de valores plausíveis para a tendência central. Valores fora do intervalo são relativamente implausíveis, no nível de significância \(\alpha\) pré-estabelecido.267
Qualquer valor fora do intervalo de confiança, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P < \alpha\) pré-estabelecido (bicaudal).267
Qualquer valor dentro do intervalo, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P > \alpha\) pré-estabelecido (bicaudal).267
25.7 Interpretação de análise inferencial
25.7.1 Como interpretar uma análise inferencial?
Testes de hipótese nula (\(H_{0}\)) vs. alternativa (\(H_{1}\)) a partir de um nível de significância (\(\alpha\)) pré-especificado.268
P-valor como evidência estatística sobre (\(H_{0}\)).268
Estimação de intervalos de confiança de um nível de significância (\(\alpha\)) pré-especificado bicaudal (\(IC_{1-\alpha/2}\)) ou unicaudal (\(IC_{1-\alpha}\)).268
Análise Bayesiana.268
25.7.2 O que são resultados positivos” e “negativos” (inconclusivos) em teste de hipótese?
Resultados “positivos” compreendem um P-valor dentro da zona crítica estatisticamente significativa (ex.: \(P<0,05\) ou outro ponto de corte) e sugerem que os autores rejeitem a hipótese nula (\(H_{0}\)), confirmando assim sua hipótese científica.269
Resultados “negativos” ou inconclusivos compreendem um P-valor fora da zona crítica estatisticamente significativa (ex.: \(P \geq 0,05\) ou outro ponto de corte) e sugerem que os autores não rejeitem a hipótese nula (\(H_{0}\)) porque o efeito observado é nulo (logo, “negativo”), ou porque o estudo não possui poder suficiente para detectá-lo, não permitindo portanto afirmar a hipótese científica (logo, inconclusivo).269
25.7.3 Qual a importância de resultados “negativos”?
Conhecer resultados negativos contribui com uma visão mais ampla do campo de estudo junto aos resultados positivos.270
Resultados negativos permitem um melhor planejamento das pesquisas futuras e pode aumentar suas chances de sucesso.270
25.7.4 Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
Em estudos (geralmente com amostras grandes), resultados estatisticamente significativos (com P-valores menores do limiar pré-estabelecido, \(P<\alpha\)) podem não ser clinicamente relevantes.271
Em estudos (geralmente com amostras pequenas), resultados estatisticamente não significativos (com P-valores iguais ou maiores do limiar pré-estabelecido, \(P \geq \alpha\)) não devem ser interpretados como evidência de inexistência do efeito.271
Geralmente é razoável aceitar uma nova conclusão apenas quando há dados a seu favor (‘resultados positivos’). Também é razoável questionar se apenas a ausência de dados a seu favor (‘resultados negativos’) justifica suficientemente a rejeição de tal conclusão.271
A prática estatística convencional tende a reduzir a incerteza científica a decisões docotômicas. Essa simplificação, embora pragmática, possui implicações epistemológicas importantes: os testes de hipótese produzem não apenas juízos empíricos, mas também atos de fala pragmáticos que comunicam graus de confiança e orientam ações científicas.263
25.8 Erros de inferência
25.8.1 O que são erros de inferência estatística?
- Um erro de inferência é a tomada de decisão incorreta, seja a favor ou contra a hipótese nula (\(H_{0}\)).260
25.8.2 O que são erros Tipo I e Tipo II?
Erro Tipo I significa a rejeição de uma hipótese nula (\(H_{0}\)) quando esta é verdadeira.260
Erro Tipo II significa a não rejeição de uma hipótese nula (\(H_{0}\)) quando esta é falsa.260
| Hipótese nula \(H_{0}\) é falsa | Hipótese nula \(H_{0}\) é verdadeira | |
|---|---|---|
| Hipótese nula \(H_{0}\) foi rejeitada | Decisão correta | Decisão incorreta (erro tipo I) |
| Hipótese nula \(H_{0}\) não foi rejeitada | Decisão incorreta (erro tipo II) | Decisão correta |
Figura 25.4: Representação gráfica dos erros tipo I e tipo II em um teste de hipótese (bicaudal).
Figura 25.5: Erro tipo I: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 30. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.
Figura 25.6: Erro tipo II: Distribuição dos p-valores em 100 testes de hipótese de amostras aleatórias de tamanho 10. A linha vermelha pontilhada indica o nível de significância estatística de 0,05.
25.8.3 O que são erros Tipo S e Tipo M?
- Erro Tipo S (do inglês sign) significa a identificação errônea da direção — positiva ou negativa — do efeito observado.272,273
| Sinal positivo | Sinal negativo | |
|---|---|---|
| Sinal positivo | Decisão correta | Decisão incorreta (erro tipo S) |
| Sinal negativo | Decisão incorreta (erro tipo S) | Decisão correta |
Figura 25.7: Representação gráfica do erro tipo S (sinal) em um teste de hipótese (bicaudal).
- Erro Tipo M (do inglês magnitude) significa a identificação errônea — em geral, exagerada — da magnitude do efeito observado.272,273
| Magnitude alta | Magnitude baixa | |
|---|---|---|
| Magnitude alta | Decisão correta | Decisão incorreta (erro tipo M) |
| Magnitude baixa | Decisão incorreta (erro tipo M) | Decisão correta |
Figura 25.8: Representação gráfica do erro tipo M (magnitude) em um teste de hipótese (bicaudal).
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,