Capítulo 25 Tamanho do efeito e P-valor
25.1 Tamanho do efeito
25.1.1 O que é o tamanho do efeito?
- Tamanho do efeito quantifica a magnitude de um efeito real da análise, expressando uma importância descritiva dos resultados.256
25.1.2 Quais são os tipos de tamanho do efeito?
Diferenças padronizadas entre grupos:248,256
Cohen’s d
Glass’s \(\Delta\)
Razão de chances (\(RC\) ou \(OR\))
Risco relativo ou razão de risco (\(RR\))
-
Coeficiente de correlação de Pearson (\(r\)), ponto-bisserial (\(r_{s}\)), Spearman (\(\rho\)), Kendall (\(\tau\)), Cramér (\(V\)) e \(\phi\).
Coeficiente de determinação (\(R^2\))
25.1.3 Como converter um tamanho de efeito em outro?
- .256
O pacote effectsize257 fornece diversas funções para conversão de diferentes estimativas de tamanhos de efeito.
25.1.4 Como interpretar um tamanho do efeito?
- Tamanhos de efeito podem ser comparadores entre diferentes estudos.248
O pacote effectsize257 fornece a função rules para criar regras de interpretação de tamanhos de efeito.
O pacote effectsize257 fornece a função interpret para interpretar os tamanhos de efeito com base em uma lista de regras pré-definidas.
O pacote pwr258 fornece a função cohen.ES para obter os tamanhos de efeito “pequeno”, “médio” e “grande” para diversos testes de hipóteses.
25.4 Efeito de interação
25.4.1 O que é efeito de interação?
A interação - representada pelo símbolo * - é o termo estatístico empregado para representar a heterogeneidade de um determinado efeito.262
.261

Figura 25.1: Análise de efeito de interação (direta) entre grupos e tempo. Retas paralelas sugerem ausência de efeito de interação.

Figura 25.2: Análise de efeito de interação (inversa) entre grupos e tempo. Retas paralelas sugerem ausência de efeito de interação.
O pacote emmeans265 fornece a função emmeans para calcular as médias marginais dos fatores e suas combinações de um modelo de regressão misto linear.
25.7 P-valor
25.7.1 O que é significância estatística?
- A expressão “significância estatística”267 ou “evidência estatística de significância” sugere apenas que um experimento merece ser repetido, uma vez que um baixo P-valor (calculado a partir dos dados, modelos e demais suposições do estudo) sugere ser improvável que os dados coletados sejam coletados no contexto de que a hipótese nula \(H_{0}\) assumida é verdadeira.268
25.7.2 Como justificar o nível de significância estatística de um teste?
- .REF?
O pacote Superpower269 fornece a função optimal_alpha para calcular e justificar o nível de significância \(\alpha\) por balanço dos erros tipo I e II.
O pacote Superpower269 fornece a função ANOVA_compromise para calcular e justificar o nível de significância \(\alpha\) por balanço dos erros tipo I e II em análise de variância (ANOVA).
25.7.3 O que é o P-valor?
P-valor é a probabilidade, assumindo-se um dado modelo estatístico, de que um efeito calculado a partir dos dados seria igual ou mais extremo do que o seu valor observado.270
P-valor é uma variável aleatória que possui distribuição uniforme quando a hipótese nula \(H_{0}\) é verdadeira.271
25.7.4 Como interpretar o P-valor?
P-valores abaixo de um nível de significância estatística pré-especificado representam que um experimento merece ser repetido, com a rejeição da hipótese nula \(H_{0}\)) justificada apenas quando experimentos adicionais frequentemente reportem igualmente resultados positivos (rejeição da hipótese nula \(H_{0}\)).250
P-valor resulta da coleta e análise de dados, e assim quantifica a plausibilidade dos dados observados sob a hipótese nula \(H_{0}\).272
P-valores podem indicar quantitativamente a incompatibilidade entre os dados obtidos e o modelo estatístico especificado a priori (geralmente constituído pela hipótese nula \(H_{0}\)).270
P-valores menores/maiores do que o nível de significância estatístico pré-estabelecido não devem ser utilizados como única fonte de informação para tomada de decisão em ciência.270
25.7.5 O que o P-valor não é?
P-valor não representa a probabilidade de que a hipótese nula \(H_{0}\)) seja verdadeira, nem a probabilidade de que os dados tenham sido produzidos pelo acaso.270
P-valor não mede o tamanho do efeito ou a relevância da sua observação.270
P-valor sozinho não provê informação suficiente sobre a evidência sobre um modelo teórico. A sua interpretação correta requer uma descrição ampla sobre o delineamento, métodos e análises estatísticas aplicados no estudo.270
Evidência estatística de significância não provê informação sobre a magnitude do efeito observado e não necessariamente implica que o efeito é robusto.171,271
25.7.6 Qual a origem do ‘P<0,05’?
A origem do P<0,05 remonta aos trabalhos de R. A. Fisher nas décadas de 1920 e 1930. Fisher introduziu o conceito de valor-P dentro de uma abordagem frequentista de inferência estatística.250
O P<0,05 foi sugerido por Ronald A. Fisher como um limiar prático para indicar que um resultado era “estatisticamente significativo”.250
Para Ronald A. Fisher, a significância estatística não era prova definitiva, mas um sinal de que o resultado merecia investigação adicional. A rejeição da hipótese nula só deveria ocorrer após repetidas observações significativas, e não com base em um único teste.250

Figura 25.3: Visualização espacial de p < 0,05 (5 quadrados aleatórios em 100).
25.7.7 Quais são os complementos ou alternativas ao P-valor?
Intervalos de confiança, credibilidade ou predição.270
Razão de verossimilhança.270
Métodos Bayesianos, fator Bayes.270
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,