More

    Le moyen le plus simple de supprimer les données en double dans Excel

    La duplication de vos données peut entraîner des erreurs de calcul, de statistiques ou de visualisation des données. La suppression des doublons est la première étape pour garantir l’intégrité de vos données.

    Excel est l’une des applications de tableur les plus populaires et les plus polyvalentes au monde. Excel peut être utilisé à diverses fins, de l’analyse de données et de la génération de rapports à la gestion de l’information. Cependant, un problème souvent rencontré par les utilisateurs d’Excel est la duplication de leurs données.

    Un doublon est une donnée identique ou similaire qui apparaît plusieurs fois dans une ou plusieurs colonnes ou lignes. Les doublons peuvent entraîner des erreurs de calcul, des incohérences de données ou une diminution des performances d’Excel.

    Pour éviter ces problèmes, vous devez savoir comment supprimer les doublons dans Excel facilement et rapidement. Il existe plusieurs façons de supprimer les doublons dans Excel, en fonction de vos besoins et de vos préférences. Dans cet article, nous discuterons de trois façons principales de supprimer les doublons dans Excel, à savoir :

    remove duplicate
    remove duplicate
    • Utiliser les fonctionnalités “Remove Duplicates” disponibles dans Excel
    • Use “COUNTIF” or “COUNTIFS” formulas to mark duplicates
    • Use “Pivot Table” to filter out duplicates

    Examinons chacun d’entre eux plus en détail.

    Utilisation de la fonction Supprimer les doublons

    Le moyen le plus simple et le plus rapide de supprimer les doublons dans Excel est d’utiliser la fonctionnalité “Remove Duplicates” disponible dans Excel. Cette fonctionnalité vous permet de sélectionner les colonnes ou les lignes que vous souhaitez supprimer des doublons, puis de supprimer toutes les données identiques ou similaires dans ces colonnes ou lignes. Voici les étapes à suivre pour utiliser la fonctionnalité “Remove Duplicates” :

    1. Sélectionnez toutes les données que vous souhaitez dédupliquer. Vous pouvez utiliser le raccourci “Ctrl + A” pour sélectionner toutes les données d’une feuille de calcul, ou cliquer et faire glisser la souris pour sélectionner une plage de données spécifique.
    2. Cliquez sur l’ onglet “Data” du ruban, puis cliquez sur le bouton “Remove Duplicates” dans le groupe “Data Tools”.
    3. Dans la boîte de dialogue “Remove Duplicates”, sélectionnez la colonne ou la ligne que vous souhaitez supprimer des doublons. Vous pouvez sélectionner plusieurs colonnes ou lignes en appuyant sur la touche “Ctrl” lorsque vous cliquez sur le nom de la colonne ou de la ligne. Si vous souhaitez supprimer les doublons en fonction de toutes les colonnes ou lignes, cochez la case “Select All”.
    4. Cliquez sur le bouton “OK” pour supprimer les doublons. Excel affichera un message vous indiquant combien de doublons ont été supprimés et combien de données uniques il reste.
    5. Cliquez à nouveau sur le bouton “OK” pour fermer la boîte de dialogue.

    Par exemple, supposons que vous disposiez des données suivantes :

    NomÂgeVille
    Budi25Jakarta
    Andi30Surabaya
    Budi25Jakarta
    Cici28Bandung
    Dedi32Semarang
    Andi30Surabaya

    Si vous souhaitez supprimer les doublons en fonction de la colonne Nom, procédez comme suit :

    1. Sélectionnez toutes les données, puis cliquez sur le bouton “Remove Duplicates” dans l’ onglet “Data”.
    2. In the “Remove Duplicates” dialog box, check the Name column, then click the “OK” button.
    3. Excel affichera une boîte de dialogue indiquant qu’il y a 2 doublons supprimés et 4 données uniques restantes.
    4. Click the “OK” button to close the dialog box.

    Notez qu’Excel supprime uniquement les lignes qui ont la même valeur dans la colonne Nom, quelle que soit la valeur dans les autres colonnes. Si vous souhaitez supprimer les doublons basés sur plusieurs colonnes, par exemple, les colonnes Nom et Âge, vous pouvez cocher les deux colonnes dans la boîte de dialogue “Remove Duplicates”.

    Cette fonctionnalité est “Remove Duplicates” très utile si vous souhaitez supprimer définitivement les doublons de vos données. Cependant, il y a quelques points auxquels vous devez faire attention lorsque vous utilisez cette fonctionnalité, à savoir :

    • Cette fonctionnalité supprimera les doublons directement de vos données d’origine, sans avoir à faire de copies ou de sauvegardes au préalable. Par conséquent, nous vous recommandons de faire une copie de vos données avant d’utiliser cette fonctionnalité, ou d’utiliser la fonction “Undo (Ctrl + Z)” si vous souhaitez annuler la suppression des doublons.
    • Cette fonctionnalité ne peut supprimer que les doublons identiques, à l’exclusion des doublons qui présentent des différences dans les lettres majuscules ou minuscules, les espaces ou la ponctuation. Par exemple, “Budi” et “budi” ne seront pas considérés comme des doublons par cette fonctionnalité. Si vous souhaitez supprimer les doublons qui présentent ces différences, vous devez effectuer quelques étapes supplémentaires, telles que l’utilisation de formules “UPPER”, “LOWER” ou “TRIM” pour égaliser le format de vos données avant d’utiliser “Remove Duplicates” fonctionnalité.
    • Cette fonctionnalité ne peut supprimer les doublons que dans une feuille de calcul, à l’exclusion des doublons existants dans d’autres feuilles de calcul du même classeur ou de classeurs différents. Si vous souhaitez supprimer les doublons existants dans d’autres feuilles de calcul, vous devez d’abord copier ou déplacer ces données vers la même feuille de calcul ou utiliser d’autres méthodes dont nous parlerons ci-dessous.

    Utilisation de la formule COUNTIF ou COUNTIFS

    La deuxième façon de supprimer les doublons dans Excel consiste à utiliser la formule “COUNTIF” ou “COUNTIFS”. Cette formule peut être utilisée pour compter le nombre de fois qu’une valeur apparaît dans une ou plusieurs colonnes ou lignes. À l’aide de cette formule, vous pouvez marquer les doublons en fournissant des valeurs spécifiques, telles que 1 pour les données uniques et 0 pour les données dupliquées. Ensuite, vous pouvez filtrer ou supprimer les données marquées comme doublons en fonction de vos besoins. Voici les étapes à suivre pour utiliser la formule “COUNTIF” ou “COUNTIFS” :

    1. Sélectionnez toutes les données que vous souhaitez dédupliquer. Vous pouvez utiliser le raccourci “Ctrl + A” pour sélectionner toutes les données d’une feuille de calcul, ou cliquer et faire glisser la souris pour sélectionner une plage de données spécifique.
    2. Sélectionnez une cellule vide à droite ou en bas de vos données, selon que vous souhaitez marquer les doublons en fonction des colonnes ou des lignes.
    3. Tapez la formule “COUNTIF” ou “COUNTIFS” selon les critères souhaités. “COUNTIF” formules sont utilisées pour marquer les doublons en fonction d’une seule colonne ou ligne uniquement, tandis que les formules “COUNTIFS” sont utilisées pour marquer les doublons en fonction de plusieurs colonnes ou lignes. Le format général de cette formule est le suivant :

    =COUNTIF(plage,critère)

    =COUNTIFS(criteria_range1,criteria1,criteria_range2,criteria2,…)

    Où:

    1. range est la plage de cellules que vous souhaitez compter le nombre de fois qu’une valeur y apparaît.
    2. criteria est la valeur que vous souhaitez rechercher dans cette plage de cellules. Vous pouvez utiliser des valeurs directes, des références de cellule ou des expressions logiques pour définir des critères. Par exemple, “Budi”, A2 ou “>25”.
    3. criteria_range1, criteria_range2,… correspond à la plage de cellules que vous souhaitez utiliser comme critère pour marquer les doublons. Vous pouvez utiliser plusieurs plages de cellules en les séparant par des virgules.
    4. Critères1, Critères2,… est la valeur que vous souhaitez rechercher dans cette plage de cellules de critères. Vous pouvez utiliser des valeurs directes, des références de cellule ou des expressions logiques pour définir des critères.
    1. Appuyez sur le bouton “Enter” pour afficher le résultat de la formule. Si le résultat est supérieur à 1, il y a des doublons dans vos données. Si le résultat est 1, l’enregistrement est unique. Si le résultat est 0, les données n’existent pas dans la plage de cellules que vous avez spécifiée.
    2. Répétez les étapes 3 et 4 pour tous les enregistrements que vous souhaitez marquer comme doublons. Vous pouvez utiliser la fonction “Fill (Ctrl + R)” ou “(Ctrl + D” ) pour remplir automatiquement des formules dans d’autres cellules.
    3. Une fois que toutes les données sont marquées avec des formules, vous pouvez filtrer ou supprimer les données dont la valeur est 0 ou supérieure à 1 en fonction de vos besoins. Vous pouvez utiliser la fonction “Filter” de l’onglet “Data” pour filtrer les données en fonction d’une valeur spécifique ou utiliser la fonction “Sort” de l’onglet “Home” pour trier les données en fonction d’une valeur spécifique. Ensuite, vous pouvez supprimer les données indésirables en appuyant sur le bouton “Delete”.

    Par exemple, supposons que vous disposiez des données comme dans le tableau précédent.

    Si vous souhaitez marquer les doublons en fonction de la colonne Nom, procédez comme suit :

    1. Sélectionnez l’intégralité des données, puis sélectionnez la cellule vide à droite de vos données.
    2. Tapez la formule =COUNTIF($A$2 :$A$7,A2) dans la cellule vide. Cette formule compte le nombre de fois que la valeur de la cellule A2 apparaît dans la plage A2 :A7. Si la valeur apparaît plus d’une fois, il s’agit d’un doublon. Si la valeur n’apparaît qu’une seule fois, il s’agit de données uniques.
    3. Appuyez sur le bouton “Enter” pour afficher le résultat de la formule. Ici, le résultat est 2, car il y a deux “Budi” dans la colonne Nom.
    4. Répétez les étapes 2 et 3 pour tous les enregistrements que vous souhaitez marquer comme doublons. Vous pouvez utiliser la fonction “Fill” pour remplir automatiquement des formules dans d’autres cellules.
    5. Après tout, les données sont marquées par des formules, vous pouvez filtrer ou supprimer les données qui ont des valeurs supérieures à 1 en fonction de vos besoins. Par exemple, si vous souhaitez filtrer des données uniques, vous pouvez utiliser la fonction “Filter” pour sélectionner 1 seule valeur dans le champ de formule.

    Par conséquent, vos données ressembleront à ceci :

    NomÂgeVilleFormule
    Budi25Jakarta2
    Andi30Surabaya2
    Budi25Jakarta2
    Cici28Bandung1
    Dedi32Semarang1
    Andi30Surabaya2

    Dernières articles