Capítulo 15 Vinculação e pareamento de dados
15.1 Vinculação e pareamento de dados
15.1.1 O que é vinculação e pareamento de dados?
- A vinculação de dados combina informações de múltiplas fontes referentes ao mesmo indivíduo, criando uma base enriquecida para pesquisa.181
15.2 Abordagens de vinculação
15.2.1 Quais são as abordagens de vinculação?
Vinculação determinística – baseada em regras exatas de concordância entre identificadores (ex.: número do NHS, data de nascimento).181
Vinculação probabilística – utiliza pesos de concordância e estima a probabilidade de dois registros pertencerem à mesma pessoa.181
15.4 Controle de qualidade
15.4.1 Como controlar a qualidade da vinculação de dados?
Avaliar qualidade dos identificadores.181
Realizar análises de sensibilidade.181
Reportar métodos com transparência.181
Considerar erro de vinculação como problema semelhante a dados ausentes.181
Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,
Referências
181.
Harron K. Data linkage in medical research. BMJ Medicine. 2022;1(1):e000087. doi:10.1136/bmjmed-2021-000087