Capítulo 14 Vinculação e pareamento de dados
14.1 Vinculação e pareamento de dados
14.1.1 O que é vinculação e pareamento de dados?
- A vinculação de dados combina informações de múltiplas fontes referentes ao mesmo indivíduo, criando uma base enriquecida para pesquisa.178
14.2 Abordagens de vinculação
14.2.1 Quais são as abordagens de vinculação?
Vinculação determinística – baseada em regras exatas de concordância entre identificadores (ex.: número do NHS, data de nascimento).178
Vinculação probabilística – utiliza pesos de concordância e estima a probabilidade de dois registros pertencerem à mesma pessoa.178
14.4 Controle de qualidade
14.4.1 Como controlar a qualidade da vinculação de dados?
Avaliar qualidade dos identificadores.178
Realizar análises de sensibilidade.178
Reportar métodos com transparência.178
Considerar erro de vinculação como problema semelhante a dados ausentes.178
Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,
Referências
178.
Harron K. Data linkage in medical research. BMJ Medicine. 2022;1(1):e000087. doi:10.1136/bmjmed-2021-000087