Capítulo 16 Análise inferencial
16.1 Raciocínio inferencial
16.1.1 O que é análise inferencial?
Na análise inferencial são utilizados dados da(s) amostra(s) para fazer uma inferência válida (isto é, estimativa) sobre os parâmetros populacionais desconhecidos.49
No paradigma de Jerzy Neyman e Egon Pearson, um teste de hipótese científica envolve a tomada de decisão sobre hipóteses nulas (\(H_{0}\)) e alternativa (\(H_{1}\)) concorrentes e mutuamente exclusivas.158
16.1.2 Quais são os tipos de raciocínio inferencial?
Inferência dedutiva: Uma dada hipótese inicial é utilizada para prever o que seria observado caso tal hipótese fosse verdadeira.159
Inferência indutiva: Com base nos dados observados, avalia-se qual hipótese é mais defensável (isto é, mais provável).159
16.2 Hipóteses científicas
16.2.1 O que é hipótese científica?
Hipótese científica é uma ideia que pode ser testada.158
Definir claramente os problemas e os objetivos da pesquisa são o ponto de partida de todos os estudos científicos.48
16.2.2 Quais são as fontes de ideias para gerar hipóteses científicas?
Revisão das práticas atuais.161
Desafio a ideias aceitas.161
Conflito entre ideias divergentes.161
Variações regionais, temporais e populacionais.161
Experiências dos próprios pesquisadores.161
Imaginação sem fronteiras ou limites convencionais.161
16.3 Hipóteses estatísticas
16.3.1 O que é hipótese nula?
- A hipótese nula (\(H_{0}\)) é uma expressão que representa o estado atual do conhecimento (status quo), em geral a não existência de um determinado efeito.110
16.3.2 O que é hipótese alternativa?
- A hipótese alternativa (\(H_{1}\)) é uma expressão que contém as situações que serão testadas, de modo que um resultado positivo indique alguma ação a ser conduzida.110
16.3.3 Qual hipótese está sendo testada?
A hipótese nula (\(H_{0}\)) é a hipótese sob teste em análises inferenciais.79
Pode-se concluir sobre rejeitar ou não rejeitar a hipótese nula (\(H_{0}\)).79
Não se conclui sobre a hipótese alternativa (\(H_{1}\)).110
Para testar a hipótese nula, deve-se selecionar o nível de significância crítica (P-valor de corte); a probabilidade de rejeitarmos uma hipótese nula verdadeira (\(\alpha\)); e a probabilidade de não rejeitarmos uma hipótese nula falsa (\(\beta\)).158
16.4 Testes de hipóteses
16.4.1 Quais são os tipos de teste de hipóteses?
Teste (clássico) de significância da hipótese nula.162
Teste de mínimos efeitos.162
Teste de equivalência.162
Teste de inferioridade.162
Teste de não-inferioridade.REF?
Teste de superioridade.REF?
16.5 Poder do teste
16.5.1 O que é poder do teste?
Poder do teste é a probabilidade de rejeitar corretamente a hipótese nula (\(H_{0}\)) quando esta é falsa.158
Poder do teste pode ser calculado como (\(1 - \beta\)).158
16.5.2 O que é análise de poder do teste?
Poder é a probabilidade de que um dado tamanho de efeito será observado em um experimento futuro sob um conjunto de hipóteses - tamanho de efeito real e erro tipo I - para um dado tamanho de amostra.164
O objetivo geral da análise de poder ao projetar um estudo é escolher um tamanho de amostra que controle os 2 tipos de erros de inferência estatística: tipo I (\(\alpha\), resultado falso-positivo) e tipo II (\(\beta\), resultado falso-negativo).164
Numericamente, o poder de um estudo é calculado como \(1-\beta\) e reportado em valor percentual.164
16.5.3 Quando realizar a análise de poder do teste?
Na fase de projeto de pesquisa: a análise de poder para determinar o tamanho da amostra objetiva que o tamanho da amostra permita uma probabilidade razoável de detectar um efeito significativo pré-especificado.164
Após a coleta de dados: a análise de poder objetiva informar estudos futuros a respeito do tamanho da amostra necessário para a detecção de um efeito significativo pré-especificado.164
O pacote pwr165 fornece a função pwr.2p.test para cálculo do poder do teste de proporção balanceado (2 amostras com mesmo número de participantes).
O pacote pwr165 fornece a função pwr.2p2n.test para cálculo do do poder do teste de proporção não balanceado (2 amostras com diferente número de participantes).
O pacote pwr165 fornece a função pwr.anova.test para cálculo do poder do teste de análise de variância balanceado (3 ou mais amostras com mesmo número de participantes).
O pacote pwr165 fornece a função pwr.chisq.test para cálculo do poder do teste de qui-quadrado \(\chi^2\).
O pacote pwr165 fornece a função pwr.f2.test para cálculo do poder do teste com modelo linear geral.
O pacote pwr165 fornece a função pwr.norm.test para cálculo do poder do teste de média de uma distribuição normal com variância conhecida.
O pacote pwr165 fornece a função pwr.p.test para cálculo do poder do teste de proporção (1 amostra).
O pacote pwr165 fornece a função pwr.r.test para cálculo do do poder to teste de correlação (1 amostra).
O pacote pwr165 fornece a função pwr.t.test para cálculo do poder do teste t de diferença de 1 amostra, 2 amostras dependentes ou 2 amostras independentes (grupos balanceados).
O pacote pwr165 fornece a função pwr.t2n.test para cálculo do poder do teste t de diferença de 2 amostras independentes (grupos não balanceados).
O pacote longpower166 fornece a função power.mmrm para calcular o poder de testes com análises por modelo de regressão linear misto.
O pacote Superpower167 fornece a função power.ftest para calcular o poder do teste por análise de testes F.
O pacote Superpower167 fornece a função power_oneway_between para calcular o poder do teste por análise de variância (ANOVA) de 1 fator entre-sujeitos.
O pacote Superpower167 fornece a função power_oneway_within para calcular o poder do teste por análise de variância (ANOVA) de 1 fator intra-sujeitos.
O pacote Superpower167 fornece a função power_oneway_ancova para calcular o poder do teste por análise de covariância (ANCOVA).
O pacote Superpower167 fornece a função power_twoway_between para calcular o poder do teste por análise de covariância (ANOVA) de 2 fatores entre-sujeitos.
O pacote Superpower167 fornece a função power_threeway_between para calcular o poder do teste por análise de covariância (ANOVA) de 3 fatores entre-sujeitos.
O pacote InteractionPoweR168 fornece a função power_interaction para calcular o poder do teste por análise de efeito de interações.
16.5.4 Por que a análise de poder do teste post hoc é inadequada?
- A análise do poder é teoricamente incorreta, uma vez que a probabilidade calculada \(1-\beta\) expressa a probabilidade de um evento futuro, o que não é mais relevante quando o evento de interesse já ocorreu.136,164
16.5.5 O que pode ser realizado ao invés da análise de poder?
- Após a coleta e análise de dados, recomenda-se realizar a análise e interpretação dos resultados a partir do tamanho do efeito e do seu intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido.164
16.6 Inferência visual
16.6.1 O que é inferência visual?
Inferência visual consiste na interpretação de dados apresentados em gráficos.169
Para inferência visual, recomenda-se a apresentação dos dados em gráficos com estimativas de tendência central e seu intervalo (preferencialmete intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido).169
16.6.2 Por que usar intervalos de confiança para inferência visual?
Intervalos de confiança fornecem estimativas pontuais e intervalares na mesma unidade de medida da variável.169
Existe uma relação entre o intervalo de confiança e o valor de P obtido pelo teste de significância de hipótese nula, em que ambos consideram o mesmo nível de significância \(\alpha\) pré-estabelecido.169
16.6.3 Como interpretar intervalos de confiança em uma figura?
Identifique o que as tendências centrais e as barras de erro representam. Qual é a variável dependente? É expressa em unidades originais ou é padronizada ? A figura mostra intervalos de confiança, erro-padrão ou desvio-padrão? Qual é o desenho experimental?169
Faça uma interpretação substantiva dos valores de tendência central e dos intervalos de confiança.169
O intervalo de confiança é uma faixa de valores plausíveis para a tendência central. Valores fora do intervalo são relativamente implausíveis, no nível de significância \(\alpha\) pré-estabelecido.169
Qualquer valor fora do intervalo de confiança, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P < \alpha\) pré-estabelecido (bicaudal).169
Qualquer valor dentro do intervalo, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P > \alpha\) pré-estabelecido (bicaudal).169
16.7 Interpretação de análise inferencial
16.7.1 Como interpretar uma análise inferencial?
Testes de hipótese nula (\(H_{0}\)) vs. alternativa (\(H_{1}\)) a partir de um nível de significância (\(\alpha\)) pré-especificado.170
P-valor como evidência estatística sobre (\(H_{0}\)).170
Estimação de intervalos de confiança de um nível de significância (\(\alpha\)) pré-especificado bicaudal (\(IC_{1-\alpha/2}\)) ou unicaudal (\(IC_{1-\alpha}\)).170
Análise Bayesiana.170
16.7.2 O que são resultados ‘positivos’ e ‘negativos’ ou inconclusivos em teste de hipótese?
Resultados ‘positivos’ compreendem um P-valor dentro da zona crítica estatisticamente significativa (ex.: \(P<0,05\) ou outro ponto de corte) e sugerem que os autores rejeitem a hipótese nula \(H_{0}\), confirmando assim sua hipótese científica.171
Resultados ‘negativos’ ou inconclusivos compreendem um P-valor fora da zona crítica estatisticamente significativa (ex.: \(P \geq 0,05\) ou outro ponto de corte) e sugerem que os autores não rejeitem a hipótese nula \(H_{0}\) porque o efeito observado é nulo (logo, negativo), ou porque o estudo não possui poder suficiente para detectá-lo, não permitindo portanto afirmar a hipótese científica (logo, inconclusivo).171
16.7.3 Qual a importância de resultados ‘negativos’?
Conhecer resultados negativos contribui com uma visão mais ampla do campo de estudo junto aos resultados positivos.172
Resultados negativos permitem um melhor planejamento das pesquisas futuras e pode aumentar suas chances de sucesso.172
16.7.4 Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
Em estudos (geralmente com amostras grandes), resultados estatisticamente significativos (com P-valores menores do limiar pré-estabelecido, \(P<\alpha\)) podem não ser clinicamente relevantes.173
Em estudos (geralmente com amostras pequenas), resultados estatisticamente não significativos (com P-valores iguais ou maiores do limiar pré-estabelecido, \(P \geq \alpha\)) não devem ser interpretados como evidência de inexistência do efeito.173
Geralmente é razoável aceitar uma nova conclusão apenas quando há dados a seu favor (‘resultados positivos’). Também é razoável questionar se apenas a ausência de dados a seu favor (‘resultados negativos’) justifica suficientemente a rejeição de tal conclusão.173
16.8 Erros de inferência
16.8.1 O que são erros de inferência estatística?
- Um erro de inferência é a tomada de decisão incorreta, seja a favor ou contra a hipótese nula \(H_{0}\).158
16.8.2 O que são erros Tipo I e Tipo II?
Erro Tipo I significa a rejeição de uma hipótese nula (\(H_{0}\)) quando esta é verdadeira.158
Erro Tipo II significa a não rejeição de uma hipótese nula (\(H_{0}\)) quando esta é falsa.158
Hipótese nula \(H_{0}\) é falsa | Hipótese nula \(H_{0}\) é verdadeira | |
---|---|---|
Hipótese nula \(H_{0}\) foi rejeitada | Decisão correta | Decisão incorreta (erro tipo I) |
Hipótese nula \(H_{0}\) não foi rejeitada | Decisão incorreta (erro tipo II) | Decisão correta |
16.8.3 O que são erros Tipo S e Tipo M?
- Erro Tipo S (do inglês sign) significa a identificação errônea da direção - positiva ou negativa - do efeito observado.174,175
Sinal positivo | Sinal negativo | |
---|---|---|
Sinal positivo | Decisão correta | Decisão incorreta (erro tipo S) |
Sinal negativo | Decisão incorreta (erro tipo S) | Decisão correta |
- Erro Tipo M (do inglês magnitude) significa a identificação errônea - em geral, exagerada - da magnitude do efeito observado.174,175
Magnitude alta | Magnitude baixa | |
---|---|---|
Magnitude alta | Decisão correta | Decisão incorreta (erro tipo M) |
Magnitude baixa | Decisão incorreta (erro tipo M) | Decisão correta |