Capítulo 34 Redes


34.1 Análise de redes


34.1.1 O que é análise de rede?

  • A análise de redes é uma abordagem estatística gráfica baseada na teoria dos grafos que permite representar, explorar e interpretar relações complexas entre múltiplas variáveis analisadas simultaneamente.307

  • Nessa abordagem, as variáveis são representadas por nodos (ou nós) e as relações entre elas por arestas, formando uma estrutura relacional que evidencia padrões de associação, interdependência e organização do sistema estudado.307

  • Diferentemente de métodos tradicionais, como análises univariadas ou modelos de regressão clássicos, a análise de redes não foca relações isoladas entre variáveis, mas sim o comportamento conjunto do sistema, permitindo observar fenômenos emergentes que não seriam detectáveis individualmente.307

  • A análise de redes representa uma mudança conceitual importante em relação às abordagens estatísticas tradicionais, ao enfatizar sistemas, interações e complexidade.307


34.1.2 Por que a análise de redes é útil em pesquisa científica?

  • Muitos fenômenos científicos, especialmente nas ciências da saúde, são multifatoriais, interdependentes e não lineares, envolvendo variáveis biológicas, comportamentais, psicológicas e sociais.307

  • Análises univariadas tendem a simplificar esses fenômenos ao avaliar efeitos médios ou relações diretas entre pares de variáveis, o que pode ocultar padrões relevantes.307

  • A análise de redes permite: visualizar associações simultâneas entre diversas variáveis; identificar variáveis centrais em um sistema; detectar subestruturas densas ou agrupamentos de variáveis fortemente associadas; explorar potenciais mecanismos intermediários ou mediadores.307


34.1.3 Quais são as limitações da análise de redes?

Apesar de seu potencial, a interpretação dos resultados deve ser cuidadosa, especialmente em estudos observacionais, evitando inferências causais indevidas.307


34.2 Matriz de incidência


34.2.1 O que é uma matriz de incidência?

  • Uma matriz de incidência é uma representação tabular que descreve a relação entre dois conjuntos distintos de entidades, como nodos e arestas em uma rede.307

  • Em uma matriz de incidência, as linhas representam um conjunto de entidades (nodos) e as colunas representam outro conjunto (arestas). A presença ou ausência de uma relação entre as entidades é indicada por valores binários (0 ou 1) ou por pesos numéricos que refletem a intensidade da relação.307


Tabela 34.1: Exemplo de dados categóricos para criação de matriz de incidência.
Sexo Tabagismo Atividade
F Sim Baixa
M Não Alta
F Não Moderada
F Sim Baixa
M Não Alta


Tabela 34.2: Matriz de incidência criada a partir de dados categóricos.
SexoF SexoM TabagismoSim AtividadeBaixa AtividadeModerada
1 0 1 1 0
0 1 0 0 0
1 0 0 0 1
1 0 1 1 0
0 1 0 0 0



34.3 Elementos da rede


34.3.1 Quais são os principais elementos de uma rede?

  • Nodos (nós): representam as variáveis do estudo, como sintomas, doenças, características clínicas, sociais ou psicológicas.307

  • Arestas: representam as relações entre os nodos. Podem indicar correlação, associação parcial, dependência condicional ou outro tipo de relação estatística.307

  • Peso das arestas: em redes ponderadas, a espessura da aresta indica a magnitude da relação; relações mais fortes são representadas por conexões mais espessas.307

  • Sinal das arestas: geralmente codificado por cores, indicando associações positivas ou negativas.307


Exemplo de grafo de rede com nodos e arestas ponderadas.

Figura 34.1: Exemplo de grafo de rede com nodos e arestas ponderadas.


34.3.2 Como as redes podem ser classificadas?

  • Redes não ponderadas: indicam apenas a presença ou ausência de relação entre os nodos.307

  • Redes ponderadas: representam também a intensidade da relação.307

  • Redes direcionais: possuem setas nas arestas, indicando direção da relação (por exemplo, causalidade hipotética).307

  • Redes não direcionais: não assumem direção causal e são mais apropriadas para estudos observacionais e transversais.307

  • Em pesquisas transversais, especialmente em saúde, redes não direcionais e ponderadas são geralmente preferidas, pois evitam inferências causais indevidas quando não há informação temporal adequada.307


34.3.3 O que define a posição dos nodos em um grafo de rede?

  • A posição espacial dos nodos é determinada por algoritmos de disposição (layout), que organizam a rede de modo a facilitar a interpretação visual.307

  • Um dos algoritmos mais utilizados é o Fruchterman–Reingold308, que simula forças de atração e repulsão entre os nodos, posicionando nodos mais fortemente associados mais próximos entre si. A proximidade entre nodos em um grafo geralmente reflete maior associação estatística.307


34.4 Tipos de redes


34.4.1 Quais são os principais tipos de redes estatísticas?

  • Redes de correlação: baseadas em matrizes de correlação simples; são fáceis de interpretar, mas podem conter associações espúrias.307

  • Redes de correlação parcial: representam relações entre dois nodos controlando todas as demais variáveis do sistema, reduzindo associações indiretas.307

  • Modelos gráficos gaussianos: uma forma específica de rede de correlação parcial, muito utilizada em psicometria e epidemiologia.307

  • Modelos gráficos mistos: permitem a análise conjunta de variáveis contínuas, ordinais e dicotômicas, comuns em dados reais de saúde.307


34.4.2 Como reduzir associações espúrias em redes?

  • Em conjuntos de dados com muitas variáveis, redes podem se tornar densas e difíceis de interpretar. Para contornar esse problema, utiliza-se penalização estatística, como o método LASSO (Least Absolute Shrinkage and Selection Operator).307

  • Na análise de redes, o Graphical LASSO (gLASSO) elimina associações fracas, resultando em redes mais parcimoniosas e interpretáveis.307


34.5 Métricas de rede


34.5.1 O que são medidas de centralidade?

  • Medidas de centralidade quantificam a importância relativa de cada nodo no sistema.307

  • Grau: número de conexões diretas de um nodo.307

  • Força: soma dos pesos das conexões de um nodo, sendo uma das medidas mais utilizadas em redes ponderadas.307

  • Intermediação: frequência com que um nodo atua como ponte entre outros nodos.307

  • Proximidade: quão próximo um nodo está de todos os outros.307

  • Agrupamento: tendência de um nodo formar grupos com seus vizinhos.307


Exemplo de grafo de rede com tamanho dos nodos proporcional à força.

Figura 34.2: Exemplo de grafo de rede com tamanho dos nodos proporcional à força.


Tabela 34.3: Tabela com principais métricas de centralidade dos nodos.
Grau Força Intermediação Proximidade Agrupamento
A A 3 3 0.167 1.00 0.667
B B 2 2 0.000 0.75 1.000
C C 3 3 0.167 1.00 0.667
D D 2 2 0.000 0.75 1.000






Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

144.
R Core Team. R: A Language and Environment for Statistical Computing.; 2025. https://www.R-project.org/.
307.
Leme DE da C, Alves EV da C, Lemos V do CO, Fattori A. NETWORK ANALYSIS: A MULTIVARIATE STATISTICAL APPROACH FOR HEALTH SCIENCE RESEARCH. Geriatrics, Gerontology and Aging. 2020;14(1):43–51. doi:10.5327/z2447-212320201900073
308.
Fruchterman TMJ, Reingold EM. Graph drawing by force-directed placement. Software: Practice and Experience. 1991;21(11):1129–1164. doi:10.1002/spe.4380211102
309.
Csárdi G, Nepusz T. The igraph software package for complex network research. Vol Complex Systems.; 2006:1695. https://igraph.org.
310.
Epskamp S, Borsboom D, Fried EI. Estimating Psychological Networks and their Accuracy: A Tutorial Paper. Vol 50.; 2018.
311.
Haslbeck JMB, Waldorp LJ. mgm: Estimating Time-Varying Mixed Graphical Models in High-Dimensional Data. Vol 93.; 2020. doi:10.18637/jss.v093.i08