Capítulo 14 Vinculação e pareamento de dados
14.1 Vinculação e pareamento de dados
14.1.1 O que é vinculação e pareamento de dados?
- A vinculação de dados combina informações de múltiplas fontes referentes ao mesmo indivíduo, criando uma base enriquecida para pesquisa.165
14.2 Abordagens de vinculação
14.2.1 Quais são as abordagens de vinculação?
Vinculação determinística – baseada em regras exatas de concordância entre identificadores (ex.: número do NHS, data de nascimento).165
Vinculação probabilística – utiliza pesos de concordância e estima a probabilidade de dois registros pertencerem à mesma pessoa.165
14.4 Controle de qualidade
14.4.1 Como controlar a qualidade da vinculação de dados?
Avaliar qualidade dos identificadores.165
Realizar análises de sensibilidade.165
Reportar métodos com transparência.165
Considerar erro de vinculação como problema semelhante a dados ausentes.165
Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,
Referências
165.
Harron K. Data linkage in medical research. BMJ Medicine. 2022;1(1):e000087. doi:10.1136/bmjmed-2021-000087