Capítulo 29 Correlação
29.1 Análise inferencial de correlação
29.1.3 Qual é a interpretação das medidas de correlação?
Os valores de correlação estão no intervalo \([-1; 1]\).113,276,277
Valores de correlação positivos representam uma relação direta entre as variáveis, tal que valores maiores de uma variável estão associados a valores maiores de outra variável.276,277
Valores de correlação negativos representam uma relação indireta (ou inversa) entre as variáveis, tal que valores maiores (menores) de uma variável estão associados a valores maiores (menores) de outra variável.276,277
Valores de correlação próximos de \(0\) representam a inexistência de relação entre as variáveis.276,277

Figura 29.1: Exemplo de diferentes forças e direção de correlação entre duas variáveis X e Y.
29.1.4 Quais precauções devem ser tomadas na interpretação de medidas de correlação?
Tamanhos de efeito grande (ou qualquer outro) não representam necessariamente uma relação causa-efeito entre as variáveis.276
Tamanhos de efeito grande (ou qualquer outro) não representam necessariamente uma relação de concordância ou confiabilidade entre as variáveis.276
Uma escala de medição com representação agregada do constructo na coleta de dados pode subestimar o tamanho do efeito da correlação \(r\) em de cerca de 13% e do coeficiente de determinação \(R^2\) de cerca de 30%.126 Neste caso, a correlação desatenuada \(r_{x'y'}\) pode ser calculada pela equação (29.1), utilizando a correlação observada \(r_{xy}\) e os fatores de correção \(r_{xx'}\) e \(r_{yy'}\) para o número de intervalos nas variáveis X e Y, respectivamennte:126
O pacote psychmeta278 fornece a função correct_r_coarseness para calcular o coeficiente de correlação desatenuado (\(r_{x'y'}\)).
O pacote psychmeta278 fornece a função correct_r para calcular o coeficiente de correlação em escala restrita e/ou com erro de mensuração (\(r_{x'y'}\)).
Os coeficientes de correlação possuem suposições que, se violadas, podem levar a interpretações equivocadas. Nestes cenários, visualizar os dados e as relações entre as variáveis pode contribuir com a interpretação e utilidade dos coeficientes de correlação.279
O quarteto de Anscombe é um conjunto de quatro bancos de dados bivariados que possuem a mesma média, variância, correlação e regressão linear (até a 2a casa decimal), mas que são visualmente diferentes e, assim, demonstram a importância da análise gráfica da correlação.279
ID | x1 | x2 | x3 | x4 | y1 | y2 | y3 | y4 |
---|---|---|---|---|---|---|---|---|
1 | 10 | 10 | 10 | 8 | 8.04 | 9.14 | 7.46 | 6.58 |
2 | 8 | 8 | 8 | 8 | 6.95 | 8.14 | 6.77 | 5.76 |
3 | 13 | 13 | 13 | 8 | 7.58 | 8.74 | 12.74 | 7.71 |
4 | 9 | 9 | 9 | 8 | 8.81 | 8.77 | 7.11 | 8.84 |
5 | 11 | 11 | 11 | 8 | 8.33 | 9.26 | 7.81 | 8.47 |
6 | 14 | 14 | 14 | 8 | 9.96 | 8.10 | 8.84 | 7.04 |
7 | 6 | 6 | 6 | 8 | 7.24 | 6.13 | 6.08 | 5.25 |
8 | 4 | 4 | 4 | 19 | 4.26 | 3.10 | 5.39 | 12.50 |
9 | 12 | 12 | 12 | 8 | 10.84 | 9.13 | 8.15 | 5.56 |
10 | 7 | 7 | 7 | 8 | 4.82 | 7.26 | 6.42 | 7.91 |
11 | 5 | 5 | 5 | 8 | 5.68 | 4.74 | 5.73 | 6.89 |
X1Y1 | X2Y2 | X3Y3 | X4Y4 | |
---|---|---|---|---|
Observações | 11.00 | 11.00 | 11.00 | 11.00 |
Média x | 9.00 | 9.00 | 9.00 | 9.00 |
Média y | 7.50 | 7.50 | 7.50 | 7.50 |
Variância x | 11.00 | 11.00 | 11.00 | 11.00 |
Variância y | 4.13 | 4.13 | 4.12 | 4.12 |
Correlação | 0.82 | 0.82 | 0.82 | 0.82 |
Coeficiente angular | 0.50 | 0.50 | 0.50 | 0.50 |
Coeficiente linear | 3.00 | 3.00 | 3.00 | 3.00 |
Coeficiente de determinação | 0.67 | 0.67 | 0.67 | 0.67 |

Figura 29.2: Gráfico de dispersão do Quarteto de Anscombe para representação gráfica de conjuntos de dados bivariados com parâmetros quase idênticos e relações muito distintas.
O pacote anscombiser280 fornece a função anscombise para gerar bancos de dados que compartilham os mesmos valores de parâmetros do Quarteto de Anscombe.
29.2 Coeficientes de correlação
29.2.1 Quais coeficientes podem ser usados em análises de correlação?
O pacote stats142 fornece a função cor.test para calcular o coeficiente de correlação de Pearson (\(r\)).
O pacote correlation281 do projeto easystats282 fornece a função correlation para calcular o coeficiente de correlação de Pearson (\(r\)).
Coeficiente de correlação ponto-bisserial (\(r_{s}\)).276
O coeficiente de correlação ponto-bisserial (\(r_{s}\)) avalia a força e direção da relação linear entre uma variável quantitativa e outra dicotômica.276
Tipo: paramétrico.276
Hipóteses:276
Nula (\(H_{0}\)): \(r_{s}=0\)
Alternativa (\(H_{1}\)): \(r_{s}≠0\)
Tamanho do efeito:276
- Coeficiente de correlação ponto-bisserial (\(r_{s}\))
O pacote stats142 fornece a função cor.test para calcular o coeficiente de correlação ponto-bisserial (\(r_{s}\)).
O pacote correlation281 do projeto easystats282 fornece a função correlation para calcular o coeficiente de correlação ponto-bisserial (\(r_{s}\)).
Coeficiente de correlação de Spearman (\(\rho\)).276,277
O coeficiente de correlação de Spearman (\(\rho\)) avalia a força e direção da relação monotônica entre duas variáveis quantitativas.276,277
O coeficiente de correlação de Spearman (\(\rho\)) pode ser também definida como a correlação de Pearson (\(r\)) entre as classificações (ranks) das duas variáveis quantitativas.276,277
-
Nula (\(H_{0}\)): \(\rho=0\)
Alternativa (\(H_{1}\)): \(\rho≠0\)
-
- Coeficiente de correlação de Spearman (\(\rho\))
O pacote stats142 fornece a função cor.test para calcular o coeficiente de correlação de Spearman (\(\rho\)).
O pacote correlation281 do projeto easystats282 fornece a função correlation para calcular o coeficiente de correlação de Spearman (\(\rho\)).
Coeficiente de Kendall (\(\tau\)).276,277
O coeficiente Kendall \(\tau\) avalia a força e direção da relação monotônica entre duas variáveis quantitativas ou qualitativas.276,277
O coeficiente Kendall \(\tau\) é definido como a proporção de todos os pares concordantes menos a proporção de todos os pares discordantes.276,277
-
Nula (\(H_{0}\)): \(\tau=0\)
Alternativa (\(H_{1}\)): \(\tau≠0\)
-
- Kendall \(\tau\)
O pacote correlation281 do projeto easystats282 fornece a função correlation para calcular o coeficiente coeficiente Kendall \(\tau\).
Coeficiente de Cramér (\(V\)).REF?
Coeficiente de Sheperd \(\phi\).REF?
O pacote correlation281 do projeto easystats282 fornece a função correlation para calcular o coeficiente coeficiente Sheperd \(\phi\).
O pacote corrplot202 fornece a função cor.mtest para calcular os P-valores e intervalos de confiança da matriz de correlação.
29.3 Colinearidade
29.3.1 O que é colinearidade?
Colinearidade representa a correlação entre duas variáveis.283
Colinearidade exata indica uma relação linear perfeita entre duas variáveis.283
29.3.2 Como identificar colinearidade na matriz de correlação?
A colinearidade pode ser identificada na matriz de correlação por meio da análise dos coeficientes de correlação entre as variáveis.283
Valores de correlação próximos de \(1\) ou \(-1\) indicam colinearidade entre as variáveis.283
O pacote GGally284 fornece a função ggally_cor para estimar a correlação bivariada e exibir o coeficiente de correlação e o P-valor na matriz de correlação.284
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,