Duplikasi dalam data Anda bisa menyebabkan kesalahan dalam perhitungan, statistik, atau visualisasi data. Menghapus duplikasi adalah langkah pertama untuk memastikan integritas data Anda.
Excel adalah salah satu aplikasi spreadsheet yang paling populer dan serbaguna di dunia. Excel dapat digunakan untuk berbagai keperluan, mulai dari analisis data, pembuatan laporan, hingga pengelolaan informasi. Namun, salah satu masalah yang sering dihadapi oleh pengguna Excel adalah adanya duplikat dalam data mereka.
Duplikat adalah data yang sama atau mirip yang muncul lebih dari sekali dalam satu atau lebih kolom atau baris. Duplikat dapat menyebabkan kesalahan perhitungan, inkonsistensi data, atau penurunan kinerja Excel.
Untuk menghindari masalah-masalah tersebut, Anda perlu mengetahui cara menghapus duplikat di excel dengan mudah dan cepat. Ada beberapa cara yang dapat Anda gunakan untuk menghapus duplikat di excel, tergantung pada kebutuhan dan preferensi Anda. Dalam artikel ini, kami akan membahas tiga cara utama untuk menghapus duplikat di excel, yaitu:
- Menggunakan fitur ”Remove Duplicates“ yang tersedia di Excel
- Menggunakan formula ”COUNTIF“ atau ”COUNTIFS“ untuk menandai duplikat
- Menggunakan ”Pivot Table“ untuk menyaring duplikat
Mari kita lihat masing-masing cara tersebut secara lebih detail.
Menggunakan Fitur Remove Duplicates
Cara termudah dan tercepat untuk menghapus duplikat di excel adalah dengan menggunakan fitur ”Remove Duplicates“ yang tersedia di Excel. Fitur ini memungkinkan Anda untuk memilih kolom atau baris yang ingin Anda hapus duplikatnya, dan kemudian menghapus semua data yang sama atau mirip dalam kolom atau baris tersebut. Berikut ini adalah langkah-langkah untuk menggunakan fitur ”Remove Duplicates“:
- Pilih seluruh data yang ingin Anda hapus duplikatnya. Anda dapat menggunakan shortcut ”Ctrl + A“ untuk memilih semua data dalam lembar kerja, atau klik dan seret mouse untuk memilih rentang data tertentu.
- Klik tab ”Data“ pada ribbon, lalu klik tombol ”Remove Duplicates“ pada grup ”Data Tools“.
- Pada kotak dialog ”Remove Duplicates“, pilih kolom atau baris yang ingin Anda hapus duplikatnya. Anda dapat memilih lebih dari satu kolom atau baris dengan menekan tombol ”Ctrl“ saat mengklik nama kolom atau baris. Jika Anda ingin menghapus duplikat berdasarkan semua kolom atau baris, centang kotak ”Select All“.
- Klik tombol ”OK“ untuk mulai menghapus duplikat. Excel akan menampilkan pesan yang memberitahu Anda berapa banyak duplikat yang telah dihapus dan berapa banyak data unik yang tersisa.
- Klik tombol ”OK“ lagi untuk menutup kotak dialog.
Sebagai contoh, misalkan Anda memiliki data berikut ini:
Nama | Umur | Kota |
Budi | 25 | Jakarta |
Andi | 30 | Surabaya |
Budi | 25 | Jakarta |
Cici | 28 | Bandung |
Dedi | 32 | Semarang |
Andi | 30 | Surabaya |
Jika Anda ingin menghapus duplikat berdasarkan kolom Nama, maka Anda dapat melakukan langkah-langkah berikut:
- Pilih seluruh data, lalu klik tombol ”Remove Duplicates“ pada tab ”Data“.
- Pada kotak dialog ”Remove Duplicates“, centang kolom Nama, lalu klik tombol ”OK“.
- Excel akan menampilkan kotak dialog pesan bahwa ada 2 duplikat yang dihapus dan 4 data unik yang tersisa.
- Klik tombol ”OK“ untuk menutup kotak dialog.
Perhatikan bahwa Excel hanya menghapus baris yang memiliki nilai yang sama pada kolom Nama, tanpa memperhatikan nilai pada kolom lainnya. Jika Anda ingin menghapus duplikat berdasarkan lebih dari satu kolom, misalnya kolom Nama dan Umur, maka Anda dapat mencentang kedua kolom tersebut pada kotak dialog ”Remove Duplicates“.
Fitur ”Remove Duplicates“ sangat berguna jika Anda ingin menghapus duplikat secara permanen dari data Anda. Namun, ada beberapa hal yang perlu Anda perhatikan saat menggunakan fitur ini, yaitu:
- Fitur ini akan menghapus duplikat secara langsung dari data asli Anda, tanpa membuat salinan atau backup terlebih dahulu. Oleh karena itu, sebaiknya Anda membuat salinan data Anda sebelum menggunakan fitur ini, atau menggunakan fitur ”Undo (Ctrl + Z)” jika Anda ingin membatalkan penghapusan duplikat.
- Fitur ini hanya dapat menghapus duplikat yang persis sama, tidak termasuk duplikat yang memiliki perbedaan huruf besar atau kecil, spasi, atau tanda baca. Misalnya, “Budi” dan “budi” tidak akan dianggap sebagai duplikat oleh fitur ini. Jika Anda ingin menghapus duplikat yang memiliki perbedaan tersebut, Anda perlu melakukan beberapa langkah tambahan, seperti menggunakan formula ”UPPER“, ”LOWER“, atau ”TRIM“ untuk menyamakan format data Anda sebelum menggunakan fitur ”Remove Duplicates“.
- Fitur ini hanya dapat menghapus duplikat dalam satu lembar kerja saja, tidak termasuk duplikat yang ada di lembar kerja lain dalam buku kerja yang sama atau berbeda. Jika Anda ingin menghapus duplikat yang ada di lembar kerja lain, Anda perlu menyalin atau memindahkan data tersebut ke lembar kerja yang sama terlebih dahulu, atau menggunakan cara lain yang akan kami bahas di bawah ini.
Artikel Menarik Lainnya
Menggunakan Formula COUNTIF atau COUNTIFS
Cara kedua untuk menghapus duplikat di excel adalah dengan menggunakan formula ”COUNTIF“ atau ”COUNTIFS“. Formula ini dapat digunakan untuk menghitung berapa kali suatu nilai muncul dalam satu atau lebih kolom atau baris. Dengan menggunakan formula ini, Anda dapat menandai duplikat dengan memberikan nilai tertentu, misalnya 1 untuk data unik dan 0 untuk data duplikat. Kemudian, Anda dapat menyaring atau menghapus data yang ditandai sebagai duplikat sesuai dengan kebutuhan Anda. Berikut ini adalah langkah-langkah untuk menggunakan formula ”COUNTIF“ atau ”COUNTIFS“:
- Pilih seluruh data yang ingin Anda hapus duplikatnya. Anda dapat menggunakan shortcut ”Ctrl + A“ untuk memilih semua data dalam lembar kerja, atau klik dan seret mouse untuk memilih rentang data tertentu.
- Pilih sel kosong di sebelah kanan atau bawah data Anda, tergantung pada apakah Anda ingin menandai duplikat berdasarkan kolom atau baris.
- Ketik formula ”COUNTIF“ atau ”COUNTIFS“ sesuai dengan kriteria yang Anda inginkan. Formula ”COUNTIF“ digunakan untuk menandai duplikat berdasarkan satu kolom atau baris saja, sedangkan formula ”COUNTIFS“ digunakan untuk menandai duplikat berdasarkan lebih dari satu kolom atau baris. Format umum dari formula ini adalah sebagai berikut:
=COUNTIF(range,criteria) =COUNTIFS(criteria_range1,criteria1,criteria_range2,criteria2,…)
Di mana:
- range adalah rentang sel yang ingin Anda hitung berapa kali suatu nilai muncul di dalamnya.
- criteria adalah nilai yang ingin Anda cari dalam rentang sel tersebut. Anda dapat menggunakan nilai langsung, sel referensi, atau ekspresi logika untuk menentukan criteria. Misalnya, “Budi”, A2, atau “>25”.
- criteria_range1, criteria_range2, … adalah rentang sel yang ingin Anda gunakan sebagai kriteria untuk menandai duplikat. Anda dapat menggunakan lebih dari satu rentang sel dengan memisahkannya dengan koma.
- criteria1, criteria2, … adalah nilai yang ingin Anda cari dalam rentang sel kriteria tersebut. Anda dapat menggunakan nilai langsung, sel referensi, atau ekspresi logika untuk menentukan criteria.
- Tekan tombol “Enter“ untuk menampilkan hasil formula. Jika hasilnya lebih dari 1, berarti ada duplikat dalam data Anda. Jika hasilnya 1, berarti data tersebut unik. Jika hasilnya 0, berarti data tersebut tidak ada dalam rentang sel yang Anda tentukan.
- Ulangi langkah 3 dan 4 untuk semua data yang ingin Anda tandai duplikatnya. Anda dapat menggunakan fitur “Fill (Ctrl + R)“ atau “(Ctrl + D“) untuk mengisi formula ke sel-sel lain secara otomatis.
- Setelah semua data ditandai dengan formula, Anda dapat menyaring atau menghapus data yang memiliki nilai 0 atau lebih dari 1 sesuai dengan kebutuhan Anda. Anda dapat menggunakan fitur “Filter“ pada tab “Data“ untuk menyaring data berdasarkan nilai tertentu, atau menggunakan fitur “Sort“ pada tab “Home“ untuk mengurutkan data berdasarkan nilai tertentu. Kemudian, Anda dapat menghapus data yang tidak diinginkan dengan menekan tombol “Delete“.
Sebagai contoh, misalkan Anda memiliki data seperti pada tabel sebelumnya.
Jika Anda ingin menandai duplikat berdasarkan kolom Nama, maka Anda dapat melakukan langkah-langkah berikut:
- Pilih seluruh data, lalu pilih sel kosong di sebelah kanan data Anda.
- Ketik formula =COUNTIF($A$2:$A$7,A2) pada sel kosong tersebut. Formula ini akan menghitung berapa kali nilai pada sel A2 muncul dalam rentang A2:A7. Jika nilai tersebut muncul lebih dari sekali, maka itu adalah duplikat. Jika nilai tersebut muncul sekali saja, maka itu adalah data unik.
- Tekan tombol “Enter“ untuk menampilkan hasil formula. Dalam hal ini, hasilnya adalah 2, karena ada dua “Budi” dalam kolom Nama.
- Ulangi langkah 2 dan 3 untuk semua data yang ingin Anda tandai duplikatnya. Anda dapat menggunakan fitur “Fill“ untuk mengisi formula ke sel-sel lain secara otomatis.
- Setelah semua data ditandai dengan formula, Anda dapat menyaring atau menghapus data yang memiliki nilai lebih dari 1 sesuai dengan kebutuhan Anda. Misalnya, jika Anda ingin menyaring data unik saja, maka Anda dapat menggunakan fitur “Filter“ untuk memilih nilai 1 saja pada kolom formula.
Hasilnya, data Anda akan menjadi seperti ini:
Nama | Umur | Kota | Formula |
Budi | 25 | Jakarta | 2 |
Andi | 30 | Surabaya | 2 |
Budi | 25 | Jakarta | 2 |
Cici | 28 | Bandung | 1 |
Dedi | 32 | Semarang | 1 |
Andi | 30 | Surabaya | 2 |