Capítulo 24 Correlação
24.1 Análise inferencial de correlação
24.1.3 Qual é a interpretação das medidas de correlação?
Os valores de correlação estão no intervalo \([-1; 1]\).92,231,232
Valores de correlação positivos representam uma relação direta entre as variáveis, tal que valores maiores de uma variável estão associados a valores maiores de outra variável.231,232
Valores de correlação negativos representam uma relação indireta (ou inversa) entre as variáveis, tal que valores maiores (menores) de uma variável estão associados a valores maiores (menores) de outra variável.231,232
Valores de correlação próximos de \(0\) representam a inexistência de relação entre as variáveis.231,232

Figura 24.1: Exemplo de diferentes forças e direção de correlação entre duas variáveis X e Y.
24.1.4 Quais precauções devem ser tomadas na interpretação de medidas de correlação?
Tamanhos de efeito grande (ou qualquer outro) não representam necessariamente uma relação causa-efeito entre as variáveis.231
Tamanhos de efeito grande (ou qualquer outro) não representam necessariamente uma relação de concordância ou confiabilidade entre as variáveis.231
Uma escala de medição com representação agregada do constructo na coleta de dados pode subestimar o tamanho do efeito da correlação \(r\) em de cerca de 13% e do coeficiente de determinação \(R^2\) de cerca de 30%.69 Neste caso, a correlação desatenuada \(r_{x'y'}\) pode ser calculada pela equação (24.1), utilizando a correlação observada \(r_{xy}\) e os fatores de correção \(r_{xx'}\) e \(r_{yy'}\) para o número de intervalos nas variáveis X e Y, respectivamennte:69
O pacote psychmeta233 fornece a função correct_r_coarseness para calcular o coeficiente de correlação desatenuado (\(r_{x'y'}\)).
O pacote psychmeta233 fornece a função correct_r para calcular o coeficiente de correlação em escala restrita e/ou com erro de mensuração (\(r_{x'y'}\)).
Os coeficientes de correlação possuem suposições que, se violadas, podem levar a interpretações equivocadas. Nestes cenários, visualizar os dados e as relações entre as variáveis pode contribuir com a interpretação e utilidade dos coeficientes de correlação.234
O quarteto de Anscombe é um conjunto de quatro bancos de dados bivariados que possuem a mesma média, variância, correlação e regressão linear (até a 2a casa decimal), mas que são visualmente diferentes e, assim, demonstram a importância da análise gráfica da correlação.234
ID | x1 | x2 | x3 | x4 | y1 | y2 | y3 | y4 |
---|---|---|---|---|---|---|---|---|
1 | 10 | 10 | 10 | 8 | 8.04 | 9.14 | 7.46 | 6.58 |
2 | 8 | 8 | 8 | 8 | 6.95 | 8.14 | 6.77 | 5.76 |
3 | 13 | 13 | 13 | 8 | 7.58 | 8.74 | 12.74 | 7.71 |
4 | 9 | 9 | 9 | 8 | 8.81 | 8.77 | 7.11 | 8.84 |
5 | 11 | 11 | 11 | 8 | 8.33 | 9.26 | 7.81 | 8.47 |
6 | 14 | 14 | 14 | 8 | 9.96 | 8.10 | 8.84 | 7.04 |
7 | 6 | 6 | 6 | 8 | 7.24 | 6.13 | 6.08 | 5.25 |
8 | 4 | 4 | 4 | 19 | 4.26 | 3.10 | 5.39 | 12.50 |
9 | 12 | 12 | 12 | 8 | 10.84 | 9.13 | 8.15 | 5.56 |
10 | 7 | 7 | 7 | 8 | 4.82 | 7.26 | 6.42 | 7.91 |
11 | 5 | 5 | 5 | 8 | 5.68 | 4.74 | 5.73 | 6.89 |
X1Y1 | X2Y2 | X3Y3 | X4Y4 | |
---|---|---|---|---|
Observações | 11.00 | 11.00 | 11.00 | 11.00 |
Média x | 9.00 | 9.00 | 9.00 | 9.00 |
Média y | 7.50 | 7.50 | 7.50 | 7.50 |
Variância x | 11.00 | 11.00 | 11.00 | 11.00 |
Variância y | 4.13 | 4.13 | 4.12 | 4.12 |
Correlação | 0.82 | 0.82 | 0.82 | 0.82 |
Coeficiente angular | 0.50 | 0.50 | 0.50 | 0.50 |
Coeficiente linear | 3.00 | 3.00 | 3.00 | 3.00 |
Coeficiente de determinação | 0.67 | 0.67 | 0.67 | 0.67 |

Figura 24.2: Gráfico de dispersão do Quarteto de Anscombe para representação gráfica de conjuntos de dados bivariados com parâmetros quase idênticos e relações muito distintas.
O pacote anscombiser235 fornece a função anscombise para gerar bancos de dados que compartilham os mesmos valores de parâmetros do Quarteto de Anscombe.
24.2 Coeficientes de correlação
24.2.1 Quais coeficientes podem ser usados em análises de correlação?
O pacote stats72 fornece a função cor.test para calcular o coeficiente de correlação de Pearson (\(r\)).
O pacote correlation236 do projeto easystats237 fornece a função correlation para calcular o coeficiente de correlação de Pearson (\(r\)).
Coeficiente de correlação ponto-bisserial (\(r_{s}\)).231
O coeficiente de correlação ponto-bisserial (\(r_{s}\)) avalia a força e direção da relação linear entre uma variável quantitativa e outra dicotômica.231
Tipo: paramétrico.231
Hipóteses:231
Nula (\(H_{0}\)): \(r_{s}=0\)
Alternativa (\(H_{1}\)): \(r_{s}≠0\)
Tamanho do efeito:231
- Coeficiente de correlação ponto-bisserial (\(r_{s}\))
O pacote stats72 fornece a função cor.test para calcular o coeficiente de correlação ponto-bisserial (\(r_{s}\)).
O pacote correlation236 do projeto easystats237 fornece a função correlation para calcular o coeficiente de correlação ponto-bisserial (\(r_{s}\)).
Coeficiente de correlação de Spearman (\(\rho\)).231,232
O coeficiente de correlação de Spearman (\(\rho\)) avalia a força e direção da relação monotônica entre duas variáveis quantitativas.231,232
O coeficiente de correlação de Spearman (\(\rho\)) pode ser também definida como a correlação de Pearson (\(r\)) entre as classificações (ranks) das duas variáveis quantitativas.231,232
-
Nula (\(H_{0}\)): \(\rho=0\)
Alternativa (\(H_{1}\)): \(\rho≠0\)
-
- Coeficiente de correlação de Spearman (\(\rho\))
O pacote stats72 fornece a função cor.test para calcular o coeficiente de correlação de Spearman (\(\rho\)).
O pacote correlation236 do projeto easystats237 fornece a função correlation para calcular o coeficiente de correlação de Spearman (\(\rho\)).
Coeficiente de Kendall (\(\tau\)).231,232
O coeficiente Kendall \(\tau\) avalia a força e direção da relação monotônica entre duas variáveis quantitativas ou qualitativas.231,232
O coeficiente Kendall \(\tau\) é definido como a proporção de todos os pares concordantes menos a proporção de todos os pares discordantes.231,232
-
Nula (\(H_{0}\)): \(\tau=0\)
Alternativa (\(H_{1}\)): \(\tau≠0\)
-
- Kendall \(\tau\)
O pacote correlation236 do projeto easystats237 fornece a função correlation para calcular o coeficiente coeficiente Kendall \(\tau\).
Coeficiente de Cramér (\(V\)).REF?
Coeficiente de Sheperd \(\phi\).REF?
O pacote correlation236 do projeto easystats237 fornece a função correlation para calcular o coeficiente coeficiente Sheperd \(\phi\).
O pacote corrplot182 fornece a função cor.mtest para calcular os P-valores e intervalos de confiança da matriz de correlação.
24.3 Colinearidade
24.3.2 Como identificar colinearidade na matriz de correlação?
O pacote GGally238 fornece a função ggally_cor para estimar a correlação bivariada e exibir o coeficiente de correlação e o P-valor na matriz de correlação.238