Capítulo 18 Análise inferencial
18.1 Raciocínio inferencial
18.1.1 O que é análise inferencial?
Na análise inferencial são utilizados dados da(s) amostra(s) para fazer uma inferência válida (isto é, estimativa) sobre os parâmetros populacionais desconhecidos.76
No paradigma de Jerzy Neyman e Egon Pearson, um teste de hipótese científica envolve a tomada de decisão sobre hipóteses nulas (\(H_{0}\)) e alternativa (\(H_{1}\)) concorrentes e mutuamente exclusivas.182
18.1.2 Quais são os tipos de raciocínio inferencial?
Inferência dedutiva: Uma dada hipótese inicial é utilizada para prever o que seria observado caso tal hipótese fosse verdadeira.183
Inferência indutiva: Com base nos dados observados, avalia-se qual hipótese é mais defensável (isto é, mais provável).183
18.2 Hipóteses científicas
18.2.1 O que é hipótese científica?
Hipótese científica é uma ideia que pode ser testada.182
Definir claramente os problemas e os objetivos da pesquisa são o ponto de partida de todos os estudos científicos.75
18.2.2 Quais são as fontes de ideias para gerar hipóteses científicas?
Revisão das práticas atuais.185
Desafio a ideias aceitas.185
Conflito entre ideias divergentes.185
Variações regionais, temporais e populacionais.185
Experiências dos próprios pesquisadores.185
Imaginação sem fronteiras ou limites convencionais.185
18.3 Hipóteses estatísticas
18.3.1 O que é hipótese nula?
- A hipótese nula (\(H_{0}\)) é uma expressão que representa o estado atual do conhecimento (status quo), em geral a não existência de um determinado efeito.135
18.3.2 O que é hipótese alternativa?
- A hipótese alternativa (\(H_{1}\)) é uma expressão que contém as situações que serão testadas, de modo que um resultado positivo indique alguma ação a ser conduzida.135
18.3.3 Qual hipótese está sendo testada?
A hipótese nula (\(H_{0}\)) é a hipótese sob teste em análises inferenciais.105
Pode-se concluir sobre rejeitar ou não rejeitar a hipótese nula (\(H_{0}\)).105
Não se conclui sobre a hipótese alternativa (\(H_{1}\)).135
Para testar a hipótese nula, deve-se selecionar o nível de significância crítica (P-valor de corte); a probabilidade de rejeitarmos uma hipótese nula verdadeira (\(\alpha\)); e a probabilidade de não rejeitarmos uma hipótese nula falsa (\(\beta\)).182
18.4 Testes de hipóteses
18.4.1 Quais são os tipos de teste de hipóteses?
Teste (clássico) de significância da hipótese nula.186
Teste de mínimos efeitos.186
Teste de equivalência.186
Teste de inferioridade.186
Teste de não-inferioridade.REF?
Teste de superioridade.REF?
18.5 Poder do teste
18.5.1 O que é poder do teste?
Poder do teste é a probabilidade de rejeitar corretamente a hipótese nula (\(H_{0}\)) quando esta é falsa.182
Poder do teste pode ser calculado como (\(1 - \beta\)).182
18.5.2 O que é análise de poder do teste?
Poder é a probabilidade de que um dado tamanho de efeito será observado em um experimento futuro sob um conjunto de hipóteses - tamanho de efeito real e erro tipo I - para um dado tamanho de amostra.188
O objetivo geral da análise de poder ao projetar um estudo é escolher um tamanho de amostra que controle os 2 tipos de erros de inferência estatística: tipo I (\(\alpha\), resultado falso-positivo) e tipo II (\(\beta\), resultado falso-negativo).188
Numericamente, o poder de um estudo é calculado como \(1-\beta\) e reportado em valor percentual.188
18.5.3 Quando realizar a análise de poder do teste?
Na fase de projeto de pesquisa: a análise de poder para determinar o tamanho da amostra objetiva que o tamanho da amostra permita uma probabilidade razoável de detectar um efeito significativo pré-especificado.188
Após a coleta de dados: a análise de poder objetiva informar estudos futuros a respeito do tamanho da amostra necessário para a detecção de um efeito significativo pré-especificado.188
O pacote pwr189 fornece a função pwr.2p.test para cálculo do poder do teste de proporção balanceado (2 amostras com mesmo número de participantes).
O pacote pwr189 fornece a função pwr.2p2n.test para cálculo do do poder do teste de proporção não balanceado (2 amostras com diferente número de participantes).
O pacote pwr189 fornece a função pwr.anova.test para cálculo do poder do teste de análise de variância balanceado (3 ou mais amostras com mesmo número de participantes).
O pacote pwr189 fornece a função pwr.chisq.test para cálculo do poder do teste de qui-quadrado \(\chi^2\).
O pacote pwr189 fornece a função pwr.f2.test para cálculo do poder do teste com modelo linear geral.
O pacote pwr189 fornece a função pwr.norm.test para cálculo do poder do teste de média de uma distribuição normal com variância conhecida.
O pacote pwr189 fornece a função pwr.p.test para cálculo do poder do teste de proporção (1 amostra).
O pacote pwr189 fornece a função pwr.r.test para cálculo do do poder to teste de correlação (1 amostra).
O pacote pwr189 fornece a função pwr.t.test para cálculo do poder do teste t de diferença de 1 amostra, 2 amostras dependentes ou 2 amostras independentes (grupos balanceados).
O pacote pwr189 fornece a função pwr.t2n.test para cálculo do poder do teste t de diferença de 2 amostras independentes (grupos não balanceados).
O pacote longpower190 fornece a função power.mmrm para calcular o poder de testes com análises por modelo de regressão linear misto.
O pacote Superpower191 fornece a função power.ftest para calcular o poder do teste por análise de testes F.
O pacote Superpower191 fornece a função power_oneway_between para calcular o poder do teste por análise de variância (ANOVA) de 1 fator entre-sujeitos.
O pacote Superpower191 fornece a função power_oneway_within para calcular o poder do teste por análise de variância (ANOVA) de 1 fator intra-sujeitos.
O pacote Superpower191 fornece a função power_oneway_ancova para calcular o poder do teste por análise de covariância (ANCOVA).
O pacote Superpower191 fornece a função power_twoway_between para calcular o poder do teste por análise de covariância (ANOVA) de 2 fatores entre-sujeitos.
O pacote Superpower191 fornece a função power_threeway_between para calcular o poder do teste por análise de covariância (ANOVA) de 3 fatores entre-sujeitos.
O pacote InteractionPoweR192 fornece a função power_interaction para calcular o poder do teste por análise de efeito de interações.
18.5.4 Por que a análise de poder do teste post hoc é inadequada?
- A análise do poder é teoricamente incorreta, uma vez que a probabilidade calculada \(1-\beta\) expressa a probabilidade de um evento futuro, o que não é mais relevante quando o evento de interesse já ocorreu.157,188
18.5.5 O que pode ser realizado ao invés da análise de poder?
- Após a coleta e análise de dados, recomenda-se realizar a análise e interpretação dos resultados a partir do tamanho do efeito e do seu intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido.188
18.6 Inferência visual
18.6.1 O que é inferência visual?
Inferência visual consiste na interpretação de dados apresentados em gráficos.193
Para inferência visual, recomenda-se a apresentação dos dados em gráficos com estimativas de tendência central e seu intervalo (preferencialmete intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido).193
18.6.2 Por que usar intervalos de confiança para inferência visual?
Intervalos de confiança fornecem estimativas pontuais e intervalares na mesma unidade de medida da variável.193
Existe uma relação entre o intervalo de confiança e o valor de P obtido pelo teste de significância de hipótese nula, em que ambos consideram o mesmo nível de significância \(\alpha\) pré-estabelecido.193
18.6.3 Como interpretar intervalos de confiança?
Identifique o que as tendências centrais e as barras de erro representam. Qual é a variável dependente? É expressa em unidades originais ou é padronizada ? A figura mostra intervalos de confiança, erro-padrão ou desvio-padrão? Qual é o desenho experimental?193
Faça uma interpretação substantiva dos valores de tendência central e dos intervalos de confiança.193
O intervalo de confiança é uma faixa de valores plausíveis para a tendência central. Valores fora do intervalo são relativamente implausíveis, no nível de significância \(\alpha\) pré-estabelecido.193
Qualquer valor fora do intervalo de confiança, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P < \alpha\) pré-estabelecido (bicaudal). Qualquer valor dentro do intervalo, quando considerado como hipótese nula (\(H_{0}\)), equivale a \(P > \alpha\) pré-estabelecido (bicaudal).
18.7 Interpretação de análise inferencial
18.7.1 Como interpretar uma análise inferencial?
Testes de hipótese nula (\(H_{0}\)) vs. alternativa (\(H_{1}\)) a partir de um nível de significância (\(\alpha\)) pré-especificado.194
P-valor como evidência estatística sobre (\(H_{0}\)).194
Estimação de intervalos de confiança de um nível de significância (\(\alpha\)) pré-especificado bicaudal (\(IC_{1-\alpha/2}\)) ou unicaudal (\(IC_{1-\alpha}\)).194
Análise Bayesiana.194
18.7.2 O que são resultados ‘positivos’ e ‘negativos’ ou inconclusivos em teste de hipótese?
Resultados ‘positivos’ compreendem um P-valor dentro da zona crítica estatisticamente significativa (ex.: \(P<0,05\) ou outro ponto de corte) e sugerem que os autores rejeitem a hipótese nula \(H_{0}\), confirmando assim sua hipótese científica.195
Resultados ‘negativos’ ou inconclusivos compreendem um P-valor fora da zona crítica estatisticamente significativa (ex.: \(P \geq 0,05\) ou outro ponto de corte) e sugerem que os autores não rejeitem a hipótese nula \(H_{0}\) porque o efeito observado é nulo (logo, negativo), ou porque o estudo não possui poder suficiente para detectá-lo, não permitindo portanto afirmar a hipótese científica (logo, inconclusivo).195
18.7.3 Qual a importância de resultados ‘negativos’?
Conhecer resultados negativos contribui com uma visão mais ampla do campo de estudo junto aos resultados positivos.196
Resultados negativos permitem um melhor planejamento das pesquisas futuras e pode aumentar suas chances de sucesso.196
18.7.4 Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
Em estudos (geralmente com amostras grandes), resultados estatisticamente significativos (com P-valores menores do limiar pré-estabelecido, \(P<\alpha\)) podem não ser clinicamente relevantes.197
Em estudos (geralmente com amostras pequenas), resultados estatisticamente não significativos (com P-valores iguais ou maiores do limiar pré-estabelecido, \(P \geq \alpha\)) não devem ser interpretados como evidência de inexistência do efeito.197
Geralmente é razoável aceitar uma nova conclusão apenas quando há dados a seu favor (‘resultados positivos’). Também é razoável questionar se apenas a ausência de dados a seu favor (‘resultados negativos’) justifica suficientemente a rejeição de tal conclusão.197
18.8 Erros de inferência
18.8.1 O que são erros de inferência estatística?
- Um erro de inferência é a tomada de decisão incorreta, seja a favor ou contra a hipótese nula \(H_{0}\).182
18.8.2 O que são erros Tipo I e Tipo II?
Erro Tipo I significa a rejeição de uma hipótese nula (\(H_{0}\)) quando esta é verdadeira.182
Erro Tipo II significa a não rejeição de uma hipótese nula (\(H_{0}\)) quando esta é falsa.182
Hipótese nula \(H_{0}\) é falsa | Hipótese nula \(H_{0}\) é verdadeira | |
---|---|---|
Hipótese nula \(H_{0}\) foi rejeitada | Decisão correta | Decisão incorreta (erro tipo I) |
Hipótese nula \(H_{0}\) não foi rejeitada | Decisão incorreta (erro tipo II) | Decisão correta |
18.8.3 O que são erros Tipo S e Tipo M?
- Erro Tipo S (do inglês sign) significa a identificação errônea da direção - positiva ou negativa - do efeito observado.198,199
Sinal positivo | Sinal negativo | |
---|---|---|
Sinal positivo | Decisão correta | Decisão incorreta (erro tipo S) |
Sinal negativo | Decisão incorreta (erro tipo S) | Decisão correta |
- Erro Tipo M (do inglês magnitude) significa a identificação errônea - em geral, exagerada - da magnitude do efeito observado.198,199
Magnitude alta | Magnitude baixa | |
---|---|---|
Magnitude alta | Decisão correta | Decisão incorreta (erro tipo M) |
Magnitude baixa | Decisão incorreta (erro tipo M) | Decisão correta |