Capítulo 15 Vinculação e pareamento de dados


15.1 Vinculação e pareamento de dados


15.1.1 O que é vinculação e pareamento de dados?

  • A vinculação de dados combina informações de múltiplas fontes referentes ao mesmo indivíduo, criando uma base enriquecida para pesquisa.181


15.2 Abordagens de vinculação


15.2.1 Quais são as abordagens de vinculação?

  • Vinculação determinística – baseada em regras exatas de concordância entre identificadores (ex.: número do NHS, data de nascimento).181

  • Vinculação probabilística – utiliza pesos de concordância e estima a probabilidade de dois registros pertencerem à mesma pessoa.181


15.3 Erros de vinculação


15.3.1 Quais são os erros comuns na vinculação de dados?

  • Falso pareamento.181

  • Pareamento perdido.181

  • Esses erros podem ser interpretados sob a lógica de sensibilidade, especificidade e valor preditivo positivo.181


15.4 Controle de qualidade


15.4.1 Como controlar a qualidade da vinculação de dados?

  • Avaliar qualidade dos identificadores.181

  • Realizar análises de sensibilidade.181

  • Reportar métodos com transparência.181

  • Considerar erro de vinculação como problema semelhante a dados ausentes.181



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

181.
Harron K. Data linkage in medical research. BMJ Medicine. 2022;1(1):e000087. doi:10.1136/bmjmed-2021-000087