Capítulo 25 Correlação
25.1 Análise inferencial de correlação
25.1.3 Qual é a interpretação das medidas de correlação?
Os valores de correlação estão no intervalo [−1;1].108,226,227
Valores de correlação positivos representam uma relação direta entre as variáveis, tal que valores maiores de uma variável estão associados a valores maiores de outra variável.226,227
Valores de correlação negativos representam uma relação indireta (ou inversa) entre as variáveis, tal que valores maiores (menores) de uma variável estão associados a valores maiores (menores) de outra variável.226,227
Valores de correlação próximos de 0 representam a inexistência de relação entre as variáveis.226,227

Figura 25.1: Exemplo de diferentes forças e direção de correlação entre duas variáveis X e Y.
25.1.4 Quais precauções devem ser tomadas na interpretação de medidas de correlação?
Tamanhos de efeito grande (ou qualquer outro) não representam necessariamente uma relação causa-efeito entre as variáveis.226
Tamanhos de efeito grande (ou qualquer outro) não representam necessariamente uma relação de concordância ou confiabilidade entre as variáveis.226
Uma escala de medição com representação agregada do constructo na coleta de dados pode subestimar o tamanho do efeito da correlação r em de cerca de 13% e do coeficiente de determinação R2 de cerca de 30%.68 Neste caso, a correlação desatenuada rx′y′ pode ser calculada pela equação (25.1), utilizando a correlação observada rxy e os fatores de correção rxx′ e ryy′ para o número de intervalos nas variáveis X e Y, respectivamennte:68
O pacote psychmeta228 fornece a função correct_r_coarseness para calcular o coeficiente de correlação desatenuado (rx′y′).
O pacote psychmeta228 fornece a função correct_r para calcular o coeficiente de correlação em escala restrita e/ou com erro de mensuração (rx′y′).
Os coeficientes de correlação possuem suposições que, se violadas, podem levar a interpretações equivocadas. Nestes cenários, visualizar os dados e as relações entre as variáveis pode contribuir com a interpretação e utilidade dos coeficientes de correlação.229
O quarteto de Anscombe é um conjunto de quatro bancos de dados bivariados que possuem a mesma média, variância, correlação e regressão linear (até a 2a casa decimal), mas que são visualmente diferentes e, assim, demonstram a importância da análise gráfica da correlação.229
ID | x1 | x2 | x3 | x4 | y1 | y2 | y3 | y4 |
---|---|---|---|---|---|---|---|---|
1 | 10 | 10 | 10 | 8 | 8.04 | 9.14 | 7.46 | 6.58 |
2 | 8 | 8 | 8 | 8 | 6.95 | 8.14 | 6.77 | 5.76 |
3 | 13 | 13 | 13 | 8 | 7.58 | 8.74 | 12.74 | 7.71 |
4 | 9 | 9 | 9 | 8 | 8.81 | 8.77 | 7.11 | 8.84 |
5 | 11 | 11 | 11 | 8 | 8.33 | 9.26 | 7.81 | 8.47 |
6 | 14 | 14 | 14 | 8 | 9.96 | 8.10 | 8.84 | 7.04 |
7 | 6 | 6 | 6 | 8 | 7.24 | 6.13 | 6.08 | 5.25 |
8 | 4 | 4 | 4 | 19 | 4.26 | 3.10 | 5.39 | 12.50 |
9 | 12 | 12 | 12 | 8 | 10.84 | 9.13 | 8.15 | 5.56 |
10 | 7 | 7 | 7 | 8 | 4.82 | 7.26 | 6.42 | 7.91 |
11 | 5 | 5 | 5 | 8 | 5.68 | 4.74 | 5.73 | 6.89 |
X1Y1 | X2Y2 | X3Y3 | X4Y4 | |
---|---|---|---|---|
Observações | 11.00 | 11.00 | 11.00 | 11.00 |
Média x | 9.00 | 9.00 | 9.00 | 9.00 |
Média y | 7.50 | 7.50 | 7.50 | 7.50 |
Variância x | 11.00 | 11.00 | 11.00 | 11.00 |
Variância y | 4.13 | 4.13 | 4.12 | 4.12 |
Correlação | 0.82 | 0.82 | 0.82 | 0.82 |
Coeficiente angular | 0.50 | 0.50 | 0.50 | 0.50 |
Coeficiente linear | 3.00 | 3.00 | 3.00 | 3.00 |
Coeficiente de determinação | 0.67 | 0.67 | 0.67 | 0.67 |

Figura 25.2: Gráfico de dispersão do Quarteto de Anscombe para representação gráfica de conjuntos de dados bivariados com parâmetros quase idênticos e relações muito distintas.
O pacote anscombiser230 fornece a função anscombise para gerar bancos de dados que compartilham os mesmos valores de parâmetros do Quarteto de Anscombe.
25.2 Coeficientes de correlação
25.2.1 Quais coeficientes podem ser usados em análises de correlação?
O pacote stats71 fornece a função cor.test para calcular o coeficiente de correlação de Pearson (r).
O pacote correlation231 do projeto easystats232 fornece a função correlation para calcular o coeficiente de correlação de Pearson (r).
Coeficiente de correlação ponto-bisserial (rs).226
O pacote stats71 fornece a função cor.test para calcular o coeficiente de correlação ponto-bisserial (rs).
O pacote correlation231 do projeto easystats232 fornece a função correlation para calcular o coeficiente de correlação ponto-bisserial (rs).
Coeficiente de correlação de Spearman (ρ).226,227
O coeficiente de correlação de Spearman (ρ) avalia a força e direção da relação monotônica entre duas variáveis quantitativas.226,227
O coeficiente de correlação de Spearman (ρ) pode ser também definida como a correlação de Pearson (r) entre as classificações (ranks) das duas variáveis quantitativas.226,227
-
Nula (H0): ρ=0
Alternativa (H1): ρ≠0
-
- Coeficiente de correlação de Spearman (ρ)
O pacote stats71 fornece a função cor.test para calcular o coeficiente de correlação de Spearman (ρ).
O pacote correlation231 do projeto easystats232 fornece a função correlation para calcular o coeficiente de correlação de Spearman (ρ).
Coeficiente de Kendall (τ).226,227
O coeficiente Kendall τ avalia a força e direção da relação monotônica entre duas variáveis quantitativas ou qualitativas.226,227
O coeficiente Kendall τ é definido como a proporção de todos os pares concordantes menos a proporção de todos os pares discordantes.226,227
-
Nula (H0): τ=0
Alternativa (H1): τ≠0
-
- Kendall τ
O pacote correlation231 do projeto easystats232 fornece a função correlation para calcular o coeficiente coeficiente Kendall τ.
Coeficiente de Cramér (V).REF?
Coeficiente de Sheperd ϕ.REF?
O pacote correlation231 do projeto easystats232 fornece a função correlation para calcular o coeficiente coeficiente Sheperd ϕ.
O pacote corrplot175 fornece a função cor.mtest para calcular os P-valores e intervalos de confiança da matriz de correlação.