Capítulo 40 Redes
40.1 Análise de redes
40.1.1 O que é análise de rede?
A análise de redes é uma abordagem estatística gráfica baseada na teoria dos grafos que permite representar, explorar e interpretar relações complexas entre múltiplas variáveis analisadas simultaneamente.369
Nessa abordagem, as variáveis são representadas por nodos (ou nós) e as relações entre elas por arestas, formando uma estrutura relacional que evidencia padrões de associação, interdependência e organização do sistema estudado.369
Diferentemente de métodos tradicionais, como análises univariadas ou modelos de regressão clássicos, a análise de redes não foca relações isoladas entre variáveis, mas sim o comportamento conjunto do sistema, permitindo observar fenômenos emergentes que não seriam detectáveis individualmente.369
A análise de redes representa uma mudança conceitual importante em relação às abordagens estatísticas tradicionais, ao enfatizar sistemas, interações e complexidade.369
40.1.2 Por que a análise de redes é útil em pesquisa científica?
Muitos fenômenos científicos, especialmente nas ciências da saúde, são multifatoriais, interdependentes e não lineares, envolvendo variáveis biológicas, comportamentais, psicológicas e sociais.369
Análises univariadas tendem a simplificar esses fenômenos ao avaliar efeitos médios ou relações diretas entre pares de variáveis, o que pode ocultar padrões relevantes.369
A análise de redes permite: visualizar associações simultâneas entre diversas variáveis; identificar variáveis centrais em um sistema; detectar subestruturas densas ou agrupamentos de variáveis fortemente associadas; explorar potenciais mecanismos intermediários ou mediadores.369
40.1.3 Quais são as limitações da análise de redes?
Apesar de seu potencial, a interpretação dos resultados deve ser cuidadosa, especialmente em estudos observacionais, evitando inferências causais indevidas.369
40.2 Matriz de incidência
40.2.1 O que é uma matriz de incidência?
Uma matriz de incidência é uma representação tabular que descreve a relação entre dois conjuntos distintos de entidades, como nodos e arestas em uma rede.369
Em uma matriz de incidência, as linhas representam um conjunto de entidades (nodos) e as colunas representam outro conjunto (arestas).369
A presença ou ausência de uma relação entre as entidades é indicada por valores binários (0 ou 1) ou por pesos numéricos que refletem a intensidade da relação.369
| Sexo | Tabagismo | Atividade |
|---|---|---|
| F | Sim | Baixa |
| M | Não | Alta |
| F | Não | Moderada |
| F | Sim | Baixa |
| M | Não | Alta |
| SexoF | SexoM | TabagismoSim | AtividadeBaixa | AtividadeModerada |
|---|---|---|---|---|
| 1 | 0 | 1 | 1 | 0 |
| 0 | 1 | 0 | 0 | 0 |
| 1 | 0 | 0 | 0 | 1 |
| 1 | 0 | 1 | 1 | 0 |
| 0 | 1 | 0 | 0 | 0 |
O pacote stats159 fornece a função model.matrix para criar uma matrix de incidência por expansão de variáveis indicadoras.
40.3 Elementos da rede
40.3.1 Quais são os principais elementos de uma rede?
Nodos (nós): representam as variáveis do estudo, como sintomas, doenças, características clínicas, sociais ou psicológicas.369
Arestas: representam as relações entre os nodos. Podem indicar correlação, associação parcial, dependência condicional ou outro tipo de relação estatística.369
Peso das arestas: em redes ponderadas, a espessura da aresta indica a magnitude da relação; relações mais fortes são representadas por conexões mais espessas.369
Sinal das arestas: geralmente codificado por cores, indicando associações positivas ou negativas.369
Figura 40.1: Grafo de rede com nodos e arestas ponderadas.
40.3.2 Como as redes podem ser classificadas?
Redes não ponderadas: indicam apenas a presença ou ausência de relação entre os nodos.369
Redes ponderadas: representam também a intensidade da relação.369
Redes direcionais: possuem setas nas arestas, indicando direção da relação (por exemplo, causalidade hipotética).369
Redes não direcionais: não assumem direção causal e são mais apropriadas para estudos observacionais e transversais.369
Em pesquisas transversais, especialmente em saúde, redes não direcionais e ponderadas são geralmente preferidas, pois evitam inferências causais indevidas quando não há informação temporal adequada.369
40.3.3 O que define a posição dos nodos em um grafo de rede?
A posição espacial dos nodos é determinada por algoritmos de disposição (layout), que organizam a rede de modo a facilitar a interpretação visual.369
Um dos algoritmos mais utilizados é o Fruchterman–Reingold370, que simula forças de atração e repulsão entre os nodos, posicionando nodos mais fortemente associados mais próximos entre si.369
40.4 Tipos de redes
40.4.1 Quais são os principais tipos de redes estatísticas?
Redes de correlação: baseadas em matrizes de correlação simples; são fáceis de interpretar, mas podem conter associações espúrias.369
Redes de correlação parcial: representam relações entre dois nodos controlando todas as demais variáveis do sistema, reduzindo associações indiretas.369
Modelos gráficos gaussianos: uma forma específica de rede de correlação parcial, muito utilizada em psicometria e epidemiologia.369
Modelos gráficos mistos: permitem a análise conjunta de variáveis contínuas, ordinais e dicotômicas, comuns em dados reais de saúde.369
40.4.2 Como reduzir associações espúrias em redes?
Em conjuntos de dados com muitas variáveis, redes podem se tornar densas e difíceis de interpretar.369
Para contornar esse problema, utiliza-se penalização estatística, como o método Least Absolute Shrinkage and Selection Operator (LASSO), que elimina associações fracas, resultando em redes mais parcimoniosas e interpretáveis.369
40.5 Métricas de rede
40.5.1 O que são medidas de centralidade?
Medidas de centralidade quantificam a importância relativa de cada nodo no sistema.369
Grau: número de conexões diretas de um nodo.369
Força: soma dos pesos das conexões de um nodo, sendo uma das medidas mais utilizadas em redes ponderadas.369
Intermediação: frequência com que um nodo atua como ponte entre outros nodos.369
Proximidade: quão próximo um nodo está de todos os outros.369
Agrupamento: tendência de um nodo formar grupos com seus vizinhos.369
Figura 40.2: Grafo de rede com tamanho dos nodos proporcional à força.
| Nó | Grau | Força | Intermediação | Proximidade | Agrupamento | |
|---|---|---|---|---|---|---|
| A | A | 3 | 3 | 0.167 | 1.00 | 0.667 |
| B | B | 2 | 2 | 0.000 | 0.75 | 1.000 |
| C | C | 3 | 3 | 0.167 | 1.00 | 0.667 |
| D | D | 2 | 2 | 0.000 | 0.75 | 1.000 |
O pacote igraph371 fornece a função graph_from_incidence_matrix para criar uma rede a partir de uma matriz de incidência.
O pacote bootnet372 fornece a função bootnet para avaliação da estabilidade e precisão das redes por reamostragem.
O pacote mgm373 fornece a função mgm para estimação de modelos gráficos mistos.
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,