Duplikate in Ihren Daten können zu Fehlern bei Berechnungen, Statistiken oder Datenvisualisierungen führen. Das Entfernen von Duplikaten ist der erste Schritt, um die Integrität Ihrer Daten zu gewährleisten.
Excel ist eine der beliebtesten und vielseitigsten Tabellenkalkulationsanwendungen der Welt. Excel kann für eine Vielzahl von Zwecken verwendet werden, von der Datenanalyse über die Erstellung von Berichten bis hin zum Informationsmanagement. Ein Problem, mit dem Excel-Benutzer häufig konfrontiert sind, sind jedoch Duplikate in ihren Daten.
Ein Duplikat sind gleiche oder ähnliche Daten, die mehr als einmal in einer oder mehreren Spalten oder Zeilen vorkommen. Duplikate können zu Berechnungsfehlern, Dateninkonsistenzen oder einer verminderten Excel-Leistung führen.
Um diese Probleme zu vermeiden, müssen Sie wissen, wie Sie Duplikate in Excel einfach und schnell entfernen können. Es gibt mehrere Möglichkeiten, Duplikate in Excel zu entfernen, je nach Ihren Anforderungen und Vorlieben. In diesem Artikel werden wir drei Hauptmöglichkeiten zum Entfernen von Duplikaten in Excel besprechen, nämlich:
- Verwenden Sie die “Remove Duplicates” Funktionen, die in Excel verfügbar sind
- Verwenden Sie “COUNTIF” oder “COUNTIFS” Formeln, um Duplikate zu markieren
- Verwenden Sie “Pivot Table”, um Duplikate herauszufiltern
Schauen wir uns jeden von ihnen genauer an.
Verwenden der Funktion „Duplikate entfernen“
Der einfachste und schnellste Weg, Duplikate in Excel zu entfernen, ist die Verwendung der “Remove Duplicates” Funktion, die in Excel verfügbar ist. Mit dieser Funktion können Sie die Spalten oder Zeilen auswählen, deren Duplikate Sie entfernen möchten, und dann alle gleichen oder ähnliche Daten in diesen Spalten oder Zeilen löschen. Im Folgenden finden Sie die Schritte zur Verwendung der “Remove Duplicates” -Funktion:
- Wählen Sie alle Daten aus, die Sie deduplizieren möchten. Sie können die Tastenkombination “Ctrl + A” verwenden, um alle Daten in einem Arbeitsblatt auszuwählen, oder klicken und ziehen Sie die Maus, um einen bestimmten Datenbereich auszuwählen.
- Klicken Sie im Menüband auf die Registerkarte “Data”, und klicken Sie dann in der Gruppe “Data Tools” auf die Schaltfläche “Remove Duplicates”.
- Wählen Sie im Dialogfeld “Remove Duplicates” die Spalte oder Zeile aus, aus der Sie Duplikate entfernen möchten. Sie können mehr als eine Spalte oder Zeile auswählen, indem Sie beim Klicken auf den Spalten- oder Zeilennamen die Taste “Ctrl” drücken. Wenn Sie Duplikate basierend auf allen Spalten oder Zeilen entfernen möchten, aktivieren Sie das “Select All” Kontrollkästchen.
- Klicken Sie auf die Schaltfläche “OK”, um Duplikate zu entfernen. Excel zeigt eine Meldung an, die Ihnen mitteilt, wie viele Duplikate entfernt wurden und wie viele eindeutige Daten noch vorhanden sind.
- Klicken Sie erneut auf die Schaltfläche “OK”, um das Dialogfeld zu schließen.
Angenommen, Sie verfügen über die folgenden Daten:
Name | Alter | Stadt |
Budi | 25 | Jakarta |
Andi | 30 | Surabaya |
Budi | 25 | Jakarta |
Cici | 28 | Bandung |
Dedi | 32 | Semarang |
Andi | 30 | Surabaya |
Wenn Sie Duplikate basierend auf der Spalte Name entfernen möchten, können Sie wie folgt vorgehen:
- Wählen Sie alle Daten aus, und klicken Sie dann auf der Registerkarte “Data” auf die Schaltfläche “Remove Duplicates”.
- Aktivieren Sie im Dialogfeld “Remove Duplicates” die Spalte Name, und klicken Sie dann auf die Schaltfläche “OK”.
- Excel zeigt ein Meldungsdialogfeld an, dass 2 Duplikate entfernt wurden und 4 eindeutige Daten verbleiben.
- Klicken Sie auf die Schaltfläche “OK”, um das Dialogfeld zu schließen.
Beachten Sie, dass Excel nur Zeilen löscht, die den gleichen Wert in der Spalte Name aufweisen, unabhängig vom Wert in den anderen Spalten. Wenn Sie Duplikate basierend auf mehr als einer Spalte entfernen möchten, z. B. die Spalten „Name“ und „Alter„, können Sie beide Spalten im Dialogfeld “ “Remove Duplicates” “ aktivieren.
Diese Funktion ist “Remove Duplicates” sehr nützlich, wenn Sie Duplikate dauerhaft aus Ihren Daten entfernen möchten. Es gibt jedoch ein paar Dinge, auf die Sie achten müssen, wenn Sie diese Funktion verwenden, nämlich:
- Diese Funktion entfernt Duplikate direkt aus Ihren Originaldaten, ohne zuerst Kopien oder Sicherungen zu erstellen. Daher empfehlen wir Ihnen, eine Kopie Ihrer Daten zu erstellen, bevor Sie diese Funktion verwenden, oder die Funktion “Undo (Ctrl + Z)” zu verwenden, wenn Sie das Löschen von Duplikaten rückgängig machen möchten.
- Mit dieser Funktion können nur Duplikate entfernt werden, die identisch sind, mit Ausnahme von Duplikaten, die Unterschiede in Groß- oder Kleinbuchstaben, Leerzeichen oder Satzzeichen aufweisen. Beispielsweise werden “Budi” und “budi” von dieser Funktion nicht als Duplikate betrachtet. Wenn Sie Duplikate mit diesen Unterschieden entfernen möchten, müssen Sie einige zusätzliche Schritte ausführen, z. B. “UPPER”, “LOWER” oder “TRIM” Formeln, um das Format Ihrer Daten auszugleichen, bevor Sie “Remove Duplicates” Funktion verwenden.
- Mit dieser Funktion können nur Duplikate in einem Arbeitsblatt entfernt werden, mit Ausnahme von Duplikaten, die in anderen Arbeitsblättern in derselben oder anderen Arbeitsmappen vorhanden sind. Wenn Sie Duplikate entfernen möchten, die in anderen Arbeitsblättern vorhanden sind, müssen Sie diese Daten zuerst in dasselbe Arbeitsblatt kopieren oder verschieben oder andere Methoden verwenden, die im Folgenden erläutert werden.
Weitere interessante Artikel
Verwenden der ZÄHLENWENN- oder ZÄHLENWENNS-Formel
Die zweite Möglichkeit, Duplikate in Excel zu entfernen, besteht darin, die Formel “COUNTIF” oder “COUNTIFS” zu verwenden. Diese Formel kann verwendet werden, um zu zählen, wie oft ein Wert in einer oder mehreren Spalten oder Zeilen vorkommt. Mit dieser Formel können Sie Duplikate markieren, indem Sie bestimmte Werte angeben, z. B. 1 für eindeutige Daten und 0 für doppelte Daten. Anschließend können Sie die als Duplikat markierten Daten nach Bedarf filtern oder entfernen. Im Folgenden finden Sie die Schritte zur Verwendung der “COUNTIF” – oder “COUNTIFS” Formel:
- Wählen Sie alle Daten aus, die Sie deduplizieren möchten. Sie können die Tastenkombination “Ctrl + A” verwenden, um alle Daten in einem Arbeitsblatt auszuwählen, oder klicken und ziehen Sie die Maus, um einen bestimmten Datenbereich auszuwählen.
- Wählen Sie eine leere Zelle rechts oder unten neben Ihren Daten aus, je nachdem, ob Sie Duplikate basierend auf Spalten oder Zeilen markieren möchten.
- Geben Sie die Formel “COUNTIF” oder “COUNTIFS” gemäß den gewünschten Kriterien ein. “COUNTIF” Formeln werden verwendet, um Duplikate nur auf der Grundlage einer einzelnen Spalte oder Zeile zu markieren, während “COUNTIFS” Formeln verwendet werden, um Duplikate basierend auf mehr als einer Spalte oder Zeile zu markieren. Das allgemeine Format dieser Formel lautet wie folgt:
=ZÄHLENWENN(Bereich;Kriterien)
=ZÄHLENWENNS(criteria_range1;Kriterien1;criteria_range2;Kriterien2,…)
Wo:
- Bereich ist der Zellbereich, in dem Sie zählen möchten, wie oft ein Wert darin angezeigt wird.
- criteria ist der Wert, den Sie in diesem Zellbereich finden möchten. Sie können direkte Werte, Zellbezüge oder logische Ausdrücke verwenden, um Kriterien zu definieren. Beispiel: “Budi”, A2 oder “>25”.
- criteria_range1, criteria_range2,… ist der Zellbereich, den Sie als Kriterium zum Markieren von Duplikaten verwenden möchten. Sie können mehr als einen Zellbereich verwenden, indem Sie sie durch Kommas trennen.
- Kriterien1, Kriterien2,… ist der Wert, den Sie in diesem Bereich von Kriterienzellen durchsuchen möchten. Sie können direkte Werte, Zellbezüge oder logische Ausdrücke verwenden, um Kriterien zu definieren.
- Drücken Sie die Taste “Enter”, um das Formelergebnis anzuzeigen. Wenn das Ergebnis größer als 1 ist, gibt es Duplikate in Ihren Daten. Wenn das Ergebnis 1 ist, ist der Datensatz eindeutig. Wenn das Ergebnis 0 ist, sind die Daten in dem von Ihnen angegebenen Zellbereich nicht vorhanden.
- Wiederholen Sie die Schritte 3 und 4 für alle Datensätze, die Sie als Duplikate markieren möchten. Sie können die Funktion “Fill (Ctrl + R)” oder “(Ctrl + D” ) verwenden, um Formeln automatisch in andere Zellen zu füllen.
- Nachdem alle Daten mit Formeln markiert wurden, können Sie die Daten, die einen Wert von 0 oder größer als 1 haben, je nach Bedarf filtern oder löschen. Sie können die “Filter” Funktion auf der Registerkarte “Data” verwenden, um Daten nach einem bestimmten Wert zu filtern, oder die Funktion “Sort” auf der Registerkarte “Home” verwenden, um Daten nach einem bestimmten Wert zu sortieren. Anschließend können Sie die unerwünschten Daten löschen, indem Sie auf die “Delete” -Taste klicken.
Angenommen, Sie verfügen über Daten wie in der vorherigen Tabelle.
Wenn Sie Duplikate basierend auf der Spalte Name markieren möchten, können Sie wie folgt vorgehen:
- Markieren Sie die gesamten Daten, und wählen Sie dann die leere Zelle rechts neben den Daten aus.
- Geben Sie die Formel =ZÄHLENWENN($A$2:$A$7;A2) in die leere Zelle ein. Diese Formel zählt, wie oft der Wert in Zelle A2 im Bereich A2:A7 angezeigt wird. Wenn der Wert mehr als einmal vorkommt, handelt es sich um ein Duplikat. Wenn der Wert nur einmal vorkommt, handelt es sich um eindeutige Daten.
- Drücken Sie die Taste “Enter”, um das Formelergebnis anzuzeigen. Hier ist das Ergebnis 2, da die Spalte Name zwei “Budi” enthält.
- Wiederholen Sie die Schritte 2 und 3 für alle Datensätze, die Sie als Duplikate markieren möchten. Sie können die “Fill” Funktion verwenden, um Formeln automatisch in andere Zellen zu füllen.
- Da Daten mit Formeln gekennzeichnet sind, können Sie die Daten, die Werte über 1 haben, nach Ihren Bedürfnissen filtern oder löschen. Wenn Sie z. B. eindeutige Daten filtern möchten, können Sie die “Filter” Funktion verwenden, um nur 1 Wert im Formelfeld auszuwählen.
Als Ergebnis sehen Ihre Daten wie folgt aus:
Name | Alter | Stadt | Formel |
Budi | 25 | Jakarta | 2 |
Andi | 30 | Surabaya | 2 |
Budi | 25 | Jakarta | 2 |
Cici | 28 | Bandung | 1 |
Dedi | 32 | Semarang | 1 |
Andi | 30 | Surabaya | 2 |