Capítulo 34 Redes
34.1 Análise de redes
34.1.1 O que é análise de rede?
A análise de redes é uma abordagem estatística gráfica baseada na teoria dos grafos que permite representar, explorar e interpretar relações complexas entre múltiplas variáveis analisadas simultaneamente.307
Nessa abordagem, as variáveis são representadas por nodos (ou nós) e as relações entre elas por arestas, formando uma estrutura relacional que evidencia padrões de associação, interdependência e organização do sistema estudado.307
Diferentemente de métodos tradicionais, como análises univariadas ou modelos de regressão clássicos, a análise de redes não foca relações isoladas entre variáveis, mas sim o comportamento conjunto do sistema, permitindo observar fenômenos emergentes que não seriam detectáveis individualmente.307
A análise de redes representa uma mudança conceitual importante em relação às abordagens estatísticas tradicionais, ao enfatizar sistemas, interações e complexidade.307
34.1.2 Por que a análise de redes é útil em pesquisa científica?
Muitos fenômenos científicos, especialmente nas ciências da saúde, são multifatoriais, interdependentes e não lineares, envolvendo variáveis biológicas, comportamentais, psicológicas e sociais.307
Análises univariadas tendem a simplificar esses fenômenos ao avaliar efeitos médios ou relações diretas entre pares de variáveis, o que pode ocultar padrões relevantes.307
A análise de redes permite: visualizar associações simultâneas entre diversas variáveis; identificar variáveis centrais em um sistema; detectar subestruturas densas ou agrupamentos de variáveis fortemente associadas; explorar potenciais mecanismos intermediários ou mediadores.307
34.1.3 Quais são as limitações da análise de redes?
Apesar de seu potencial, a interpretação dos resultados deve ser cuidadosa, especialmente em estudos observacionais, evitando inferências causais indevidas.307
34.2 Matriz de incidência
34.2.1 O que é uma matriz de incidência?
Uma matriz de incidência é uma representação tabular que descreve a relação entre dois conjuntos distintos de entidades, como nodos e arestas em uma rede.307
Em uma matriz de incidência, as linhas representam um conjunto de entidades (nodos) e as colunas representam outro conjunto (arestas). A presença ou ausência de uma relação entre as entidades é indicada por valores binários (0 ou 1) ou por pesos numéricos que refletem a intensidade da relação.307
| Sexo | Tabagismo | Atividade |
|---|---|---|
| F | Sim | Baixa |
| M | Não | Alta |
| F | Não | Moderada |
| F | Sim | Baixa |
| M | Não | Alta |
| SexoF | SexoM | TabagismoSim | AtividadeBaixa | AtividadeModerada |
|---|---|---|---|---|
| 1 | 0 | 1 | 1 | 0 |
| 0 | 1 | 0 | 0 | 0 |
| 1 | 0 | 0 | 0 | 1 |
| 1 | 0 | 1 | 1 | 0 |
| 0 | 1 | 0 | 0 | 0 |
O pacote stats144 fornece a função model.matrix para criar uma matrix de incidência por expansão de variáveis indicadoras.
34.3 Elementos da rede
34.3.1 Quais são os principais elementos de uma rede?
Nodos (nós): representam as variáveis do estudo, como sintomas, doenças, características clínicas, sociais ou psicológicas.307
Arestas: representam as relações entre os nodos. Podem indicar correlação, associação parcial, dependência condicional ou outro tipo de relação estatística.307
Peso das arestas: em redes ponderadas, a espessura da aresta indica a magnitude da relação; relações mais fortes são representadas por conexões mais espessas.307
Sinal das arestas: geralmente codificado por cores, indicando associações positivas ou negativas.307
Figura 34.1: Exemplo de grafo de rede com nodos e arestas ponderadas.
34.3.2 Como as redes podem ser classificadas?
Redes não ponderadas: indicam apenas a presença ou ausência de relação entre os nodos.307
Redes ponderadas: representam também a intensidade da relação.307
Redes direcionais: possuem setas nas arestas, indicando direção da relação (por exemplo, causalidade hipotética).307
Redes não direcionais: não assumem direção causal e são mais apropriadas para estudos observacionais e transversais.307
Em pesquisas transversais, especialmente em saúde, redes não direcionais e ponderadas são geralmente preferidas, pois evitam inferências causais indevidas quando não há informação temporal adequada.307
34.3.3 O que define a posição dos nodos em um grafo de rede?
A posição espacial dos nodos é determinada por algoritmos de disposição (layout), que organizam a rede de modo a facilitar a interpretação visual.307
Um dos algoritmos mais utilizados é o Fruchterman–Reingold308, que simula forças de atração e repulsão entre os nodos, posicionando nodos mais fortemente associados mais próximos entre si. A proximidade entre nodos em um grafo geralmente reflete maior associação estatística.307
34.4 Tipos de redes
34.4.1 Quais são os principais tipos de redes estatísticas?
Redes de correlação: baseadas em matrizes de correlação simples; são fáceis de interpretar, mas podem conter associações espúrias.307
Redes de correlação parcial: representam relações entre dois nodos controlando todas as demais variáveis do sistema, reduzindo associações indiretas.307
Modelos gráficos gaussianos: uma forma específica de rede de correlação parcial, muito utilizada em psicometria e epidemiologia.307
Modelos gráficos mistos: permitem a análise conjunta de variáveis contínuas, ordinais e dicotômicas, comuns em dados reais de saúde.307
34.4.2 Como reduzir associações espúrias em redes?
Em conjuntos de dados com muitas variáveis, redes podem se tornar densas e difíceis de interpretar. Para contornar esse problema, utiliza-se penalização estatística, como o método LASSO (Least Absolute Shrinkage and Selection Operator).307
Na análise de redes, o Graphical LASSO (gLASSO) elimina associações fracas, resultando em redes mais parcimoniosas e interpretáveis.307
34.5 Métricas de rede
34.5.1 O que são medidas de centralidade?
Medidas de centralidade quantificam a importância relativa de cada nodo no sistema.307
Grau: número de conexões diretas de um nodo.307
Força: soma dos pesos das conexões de um nodo, sendo uma das medidas mais utilizadas em redes ponderadas.307
Intermediação: frequência com que um nodo atua como ponte entre outros nodos.307
Proximidade: quão próximo um nodo está de todos os outros.307
Agrupamento: tendência de um nodo formar grupos com seus vizinhos.307
Figura 34.2: Exemplo de grafo de rede com tamanho dos nodos proporcional à força.
| Nó | Grau | Força | Intermediação | Proximidade | Agrupamento | |
|---|---|---|---|---|---|---|
| A | A | 3 | 3 | 0.167 | 1.00 | 0.667 |
| B | B | 2 | 2 | 0.000 | 0.75 | 1.000 |
| C | C | 3 | 3 | 0.167 | 1.00 | 0.667 |
| D | D | 2 | 2 | 0.000 | 0.75 | 1.000 |
O pacote igraph309 fornece a função graph_from_incidence_matrix para criar uma rede a partir de uma matriz de incidência.
O pacote bootnet310 fornece a função bootnet para avaliação da estabilidade e precisão das redes por reamostragem.
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,