Capítulo 33 Redes
33.1 Análise de redes
33.1.1 O que é análise de rede?
A análise de redes é uma abordagem estatística gráfica baseada na teoria dos grafos que permite representar, explorar e interpretar relações complexas entre múltiplas variáveis analisadas simultaneamente.313
Nessa abordagem, as variáveis são representadas por nodos (ou nós) e as relações entre elas por arestas, formando uma estrutura relacional que evidencia padrões de associação, interdependência e organização do sistema estudado.313
Diferentemente de métodos tradicionais, como análises univariadas ou modelos de regressão clássicos, a análise de redes não foca relações isoladas entre variáveis, mas sim o comportamento conjunto do sistema, permitindo observar fenômenos emergentes que não seriam detectáveis individualmente.313
A análise de redes representa uma mudança conceitual importante em relação às abordagens estatísticas tradicionais, ao enfatizar sistemas, interações e complexidade.313
33.1.2 Por que a análise de redes é útil em pesquisa científica?
Muitos fenômenos científicos, especialmente nas ciências da saúde, são multifatoriais, interdependentes e não lineares, envolvendo variáveis biológicas, comportamentais, psicológicas e sociais.313
Análises univariadas tendem a simplificar esses fenômenos ao avaliar efeitos médios ou relações diretas entre pares de variáveis, o que pode ocultar padrões relevantes.313
A análise de redes permite: visualizar associações simultâneas entre diversas variáveis; identificar variáveis centrais em um sistema; detectar subestruturas densas ou agrupamentos de variáveis fortemente associadas; explorar potenciais mecanismos intermediários ou mediadores.313
33.1.3 Quais são as limitações da análise de redes?
Apesar de seu potencial, a interpretação dos resultados deve ser cuidadosa, especialmente em estudos observacionais, evitando inferências causais indevidas.313
33.2 Matriz de incidência
33.2.1 O que é uma matriz de incidência?
Uma matriz de incidência é uma representação tabular que descreve a relação entre dois conjuntos distintos de entidades, como nodos e arestas em uma rede.313
Em uma matriz de incidência, as linhas representam um conjunto de entidades (nodos) e as colunas representam outro conjunto (arestas). A presença ou ausência de uma relação entre as entidades é indicada por valores binários (0 ou 1) ou por pesos numéricos que refletem a intensidade da relação.313
| Sexo | Tabagismo | Atividade |
|---|---|---|
| F | Sim | Baixa |
| M | Não | Alta |
| F | Não | Moderada |
| F | Sim | Baixa |
| M | Não | Alta |
| SexoF | SexoM | TabagismoSim | AtividadeBaixa | AtividadeModerada |
|---|---|---|---|---|
| 1 | 0 | 1 | 1 | 0 |
| 0 | 1 | 0 | 0 | 0 |
| 1 | 0 | 0 | 0 | 1 |
| 1 | 0 | 1 | 1 | 0 |
| 0 | 1 | 0 | 0 | 0 |
O pacote stats156 fornece a função model.matrix para criar uma matrix de incidência por expansão de variáveis indicadoras.
33.3 Elementos da rede
33.3.1 Quais são os principais elementos de uma rede?
Nodos (nós): representam as variáveis do estudo, como sintomas, doenças, características clínicas, sociais ou psicológicas.313
Arestas: representam as relações entre os nodos. Podem indicar correlação, associação parcial, dependência condicional ou outro tipo de relação estatística.313
Peso das arestas: em redes ponderadas, a espessura da aresta indica a magnitude da relação; relações mais fortes são representadas por conexões mais espessas.313
Sinal das arestas: geralmente codificado por cores, indicando associações positivas ou negativas.313
Figura 33.1: Exemplo de grafo de rede com nodos e arestas ponderadas.
33.3.2 Como as redes podem ser classificadas?
Redes não ponderadas: indicam apenas a presença ou ausência de relação entre os nodos.313
Redes ponderadas: representam também a intensidade da relação.313
Redes direcionais: possuem setas nas arestas, indicando direção da relação (por exemplo, causalidade hipotética).313
Redes não direcionais: não assumem direção causal e são mais apropriadas para estudos observacionais e transversais.313
Em pesquisas transversais, especialmente em saúde, redes não direcionais e ponderadas são geralmente preferidas, pois evitam inferências causais indevidas quando não há informação temporal adequada.313
33.3.3 O que define a posição dos nodos em um grafo de rede?
A posição espacial dos nodos é determinada por algoritmos de disposição (layout), que organizam a rede de modo a facilitar a interpretação visual.313
Um dos algoritmos mais utilizados é o Fruchterman–Reingold314, que simula forças de atração e repulsão entre os nodos, posicionando nodos mais fortemente associados mais próximos entre si. A proximidade entre nodos em um grafo geralmente reflete maior associação estatística.313
33.4 Tipos de redes
33.4.1 Quais são os principais tipos de redes estatísticas?
Redes de correlação: baseadas em matrizes de correlação simples; são fáceis de interpretar, mas podem conter associações espúrias.313
Redes de correlação parcial: representam relações entre dois nodos controlando todas as demais variáveis do sistema, reduzindo associações indiretas.313
Modelos gráficos gaussianos: uma forma específica de rede de correlação parcial, muito utilizada em psicometria e epidemiologia.313
Modelos gráficos mistos: permitem a análise conjunta de variáveis contínuas, ordinais e dicotômicas, comuns em dados reais de saúde.313
33.4.2 Como reduzir associações espúrias em redes?
Em conjuntos de dados com muitas variáveis, redes podem se tornar densas e difíceis de interpretar. Para contornar esse problema, utiliza-se penalização estatística, como o método LASSO (Least Absolute Shrinkage and Selection Operator).313
Na análise de redes, o Graphical LASSO (gLASSO) elimina associações fracas, resultando em redes mais parcimoniosas e interpretáveis.313
33.5 Métricas de rede
33.5.1 O que são medidas de centralidade?
Medidas de centralidade quantificam a importância relativa de cada nodo no sistema.313
Grau: número de conexões diretas de um nodo.313
Força: soma dos pesos das conexões de um nodo, sendo uma das medidas mais utilizadas em redes ponderadas.313
Intermediação: frequência com que um nodo atua como ponte entre outros nodos.313
Proximidade: quão próximo um nodo está de todos os outros.313
Agrupamento: tendência de um nodo formar grupos com seus vizinhos.313
Figura 33.2: Exemplo de grafo de rede com tamanho dos nodos proporcional à força.
| Nó | Grau | Força | Intermediação | Proximidade | Agrupamento | |
|---|---|---|---|---|---|---|
| A | A | 3 | 3 | 0.167 | 1.00 | 0.667 |
| B | B | 2 | 2 | 0.000 | 0.75 | 1.000 |
| C | C | 3 | 3 | 0.167 | 1.00 | 0.667 |
| D | D | 2 | 2 | 0.000 | 0.75 | 1.000 |
O pacote igraph315 fornece a função graph_from_incidence_matrix para criar uma rede a partir de uma matriz de incidência.
O pacote bootnet316 fornece a função bootnet para avaliação da estabilidade e precisão das redes por reamostragem.
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,