Capítulo 14 Vinculação e pareamento de dados


14.1 Vinculação e pareamento de dados


14.1.1 O que é vinculação e pareamento de dados?

  • A vinculação de dados combina informações de múltiplas fontes referentes ao mesmo indivíduo, criando uma base enriquecida para pesquisa.165


14.2 Abordagens de vinculação


14.2.1 Quais são as abordagens de vinculação?

  • Vinculação determinística – baseada em regras exatas de concordância entre identificadores (ex.: número do NHS, data de nascimento).165

  • Vinculação probabilística – utiliza pesos de concordância e estima a probabilidade de dois registros pertencerem à mesma pessoa.165


14.3 Erros de vinculação


14.3.1 Quais são os erros comuns na vinculação de dados?

  • Falso pareamento.165

  • Pareamento perdido.165

  • Esses erros podem ser interpretados sob a lógica de sensibilidade, especificidade e valor preditivo positivo.165


14.4 Controle de qualidade


14.4.1 Como controlar a qualidade da vinculação de dados?

  • Avaliar qualidade dos identificadores.165

  • Realizar análises de sensibilidade.165

  • Reportar métodos com transparência.165

  • Considerar erro de vinculação como problema semelhante a dados ausentes.165



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

165.
Harron K. Data linkage in medical research. BMJ Medicine. 2022;1(1):e000087. doi:10.1136/bmjmed-2021-000087