Si les deux ensembles de données sont de taille semblable, celui qui comporte le plus grand nombre de variables intéressantes devrait être le fichier cible.
Pour procéder à l'appariement statistique des enquêtes sur la main-d'œuvre et des enquête sur le revenu des ménages, il faut tout d'abord déterminer les fichiers source et cible.
Étant donné que les variables distinctes du fichier source seront imputées dans le fichier cible, il est préférable de choisir l'ensemble de données de la plus grande dimension comme fichier cible.
Il convient de comparer les distributions à une et à plusieurs variables des variables Z imputées et la relation entre les variables X et Z dans l'ensemble de données synthétique et le fichier source.