La duplicación de los datos puede dar lugar a errores en los cálculos, las estadísticas o la visualización de datos. Eliminar la duplicación es el primer paso para garantizar la integridad de sus datos.
Excel es una de las aplicaciones de hojas de cálculo más populares y versátiles del mundo. Excel se puede utilizar para una variedad de propósitos, desde el análisis de datos y la generación de informes hasta la gestión de la información. Sin embargo, un problema al que se enfrentan a menudo los usuarios de Excel son los duplicados en sus datos.
Un duplicado es el mismo dato o uno similar que aparece más de una vez en una o más columnas o filas. Los duplicados pueden causar errores de cálculo, incoherencias en los datos o disminución del rendimiento de Excel.
Para evitar esos problemas, debe saber cómo eliminar duplicados en Excel de manera fácil y rápida. Hay varias formas que puede usar para eliminar duplicados en Excel, según sus necesidades y preferencias. En este artículo, discutiremos tres formas principales de eliminar duplicados en Excel, a saber:
- Usar las “Remove Duplicates” características disponibles en Excel
- Usar fórmulas “COUNTIF” o “COUNTIFS” para marcar duplicados
- Usar “Pivot Table” para filtrar duplicados
Veamos cada uno de ellos con más detalle.
Otros artículos interesantes
Uso de la función Eliminar duplicados
La forma más fácil y rápida de eliminar duplicados en Excel es usar la función “Remove Duplicates” disponible en Excel. Esta característica le permite seleccionar las columnas o filas que desea eliminar duplicados y, a continuación, eliminar todos los datos iguales o similares en esas columnas o filas. Los siguientes son los pasos para usar la función “Remove Duplicates” :
- Seleccione todos los datos que desea desduplicar. Puede utilizar el método abreviado “Ctrl + A” para seleccionar todos los datos de una hoja de cálculo, o hacer clic y arrastrar el ratón para seleccionar un rango específico de datos.
- Haga clic en la pestaña “Data” de la cinta de opciones y, a continuación, haga clic en el botón “Remove Duplicates” del grupo “Data Tools”.
- En el cuadro de diálogo “Remove Duplicates”, seleccione la columna o fila que desea eliminar los duplicados. Puede seleccionar más de una columna o fila pulsando la tecla “Ctrl” al hacer clic en el nombre de la columna o fila. Si desea eliminar duplicados en función de todas las columnas o filas, marque la casilla “Select All”.
- Haga clic en el botón “OK” para eliminar los duplicados. Excel mostrará un mensaje que le indicará cuántos duplicados se han eliminado y cuántos datos únicos quedan.
- Vuelva a hacer clic en el botón “OK” para cerrar el cuadro de diálogo.
Por ejemplo, supongamos que tiene los siguientes datos:
Nombre | Edad | Ciudad |
Budi | 25 | Yakarta |
Andi | 30 | Surabaya |
Budi | 25 | Yakarta |
Cici | 28 | Bandung |
Dedi | 32 | Semarang |
Andi | 30 | Surabaya |
Si desea eliminar duplicados en función de la columna Nombre, puede seguir estos pasos:
- Seleccione todos los datos y, a continuación, haga clic en el botón “Remove Duplicates” de la pestaña “Data”.
- En el cuadro de diálogo “Remove Duplicates”, marque la columna Nombre y, a continuación, haga clic en el botón “OK”.
- Excel mostrará un cuadro de diálogo de mensaje que indica que hay 2 duplicados eliminados y 4 datos únicos restantes.
- Haga clic en el botón “OK” para cerrar el cuadro de diálogo.
Tenga en cuenta que Excel solo elimina las filas que tienen el mismo valor en la columna Nombre, independientemente del valor de las otras columnas. Si desea eliminar duplicados basados en más de una columna, por ejemplo, las columnas Nombre y Antigüedad, puede marcar ambas columnas en el cuadro de diálogo “Remove Duplicates”.
Esta función “Remove Duplicates” es muy útil si desea eliminar permanentemente los duplicados de sus datos. Sin embargo, hay algunas cosas a las que debe prestar atención al usar esta función, a saber:
- Esta función eliminará los duplicados directamente de sus datos originales, sin hacer copias o copias de seguridad primero. Por lo tanto, le recomendamos que haga una copia de sus datos antes de usar esta función o que use la característica “Undo (Ctrl + Z)” si desea recuperar duplicados.
- Esta función solo puede eliminar duplicados que sean iguales, excluyendo los duplicados que tengan diferencias en letras mayúsculas o minúsculas, espacios o signos de puntuación. Por ejemplo, “Budi” y “budi” no se considerarán duplicados por esta característica. Si desea eliminar los duplicados que tienen estas diferencias, deberá realizar algunos pasos adicionales, como usar fórmulas “UPPER”, “LOWER” o “TRIM” para igualar el formato de los datos antes de usar “Remove Duplicates” característica.
- Esta característica solo puede eliminar duplicados en una hoja de cálculo, excluyendo los duplicados existentes en otras hojas de cálculo en el mismo libro o en libros diferentes. Si desea eliminar los duplicados existentes en otras hojas de cálculo, primero debe copiar o mover esos datos a la misma hoja de cálculo o utilizar otras formas que analizaremos a continuación.
Uso de la fórmula CONTAR.SI o CONTAR.SI
La segunda forma de eliminar duplicados en Excel es usar la fórmula “COUNTIF” o “COUNTIFS”. Esta fórmula se puede utilizar para contar el número de veces que aparece un valor en una o varias columnas o filas. Con esta fórmula, puede marcar duplicados proporcionando valores específicos, como 1 para datos únicos y 0 para datos duplicados. Luego, puede filtrar o eliminar los datos marcados como duplicados según sus necesidades. Los siguientes son los pasos para usar la fórmula “COUNTIF” o “COUNTIFS” :
- Seleccione todos los datos que desea desduplicar. Puede utilizar el método abreviado “Ctrl + A” para seleccionar todos los datos de una hoja de cálculo, o hacer clic y arrastrar el ratón para seleccionar un rango específico de datos.
- Seleccione una celda vacía a la derecha o en la parte inferior de los datos, en función de si desea marcar duplicados en función de columnas o filas.
- Escriba la fórmula “COUNTIF” o “COUNTIFS” según los criterios que desee. “COUNTIF” fórmulas se utilizan para marcar duplicados en función de una sola columna o fila, mientras que las fórmulas “COUNTIFS” se utilizan para marcar duplicados en función de más de una columna o fila. El formato general de esta fórmula es el siguiente:
=CONTAR.SI(rango,criterios)
=CONTAR.SI(criteria_range1,criterio1,criteria_range2,criterio2,…)
Dónde:
- range es el rango de celdas que desea contar el número de veces que aparece un valor en él.
- criteria es el valor que desea encontrar en ese rango de celdas. Puede utilizar valores directos, referencias de celda o expresiones lógicas para definir criterios. Por ejemplo, “Budi”, A2 o “>25”.
- criteria_range1, criteria_range2,… es el rango de celdas que desea utilizar como criterio para marcar duplicados. Puede utilizar más de un rango de celdas separándolas con comas.
- criterio1, criterio2,… es el valor que desea buscar en ese rango de celdas de criterios. Puede utilizar valores directos, referencias de celda o expresiones lógicas para definir criterios.
- Presione el botón “Enter” para mostrar el resultado de la fórmula. Si el resultado es mayor que 1, hay duplicados en los datos. Si el resultado es 1, el registro es único. Si el resultado es 0, los datos no existen en el rango de celdas especificado.
- Repita los pasos 3 y 4 para todos los registros que desee marcar como duplicados. Puede utilizar la función “Fill (Ctrl + R)” o “(Ctrl + D” ) para rellenar fórmulas en otras celdas automáticamente.
- Una vez marcados todos los datos con fórmulas, puede filtrar o eliminar los datos que tengan un valor de 0 o más de 1 según sus necesidades. Puede usar la función “Filter” de la pestaña “Data” para filtrar los datos por un valor específico o usar la función “Sort” de la pestaña “Home” para ordenar los datos por un valor específico. Luego, puede eliminar los datos no deseados presionando el botón “Delete”.
Por ejemplo, supongamos que tiene datos como los de la tabla anterior.
Si desea marcar duplicados en función de la columna Nombre, puede seguir estos pasos:
- Seleccione todos los datos y, a continuación, seleccione la celda en blanco situada a la derecha de los datos.
- Escriba la fórmula =CONTAR.SI($A$2:$A$7,A2) en la celda en blanco. Esta fórmula cuenta el número de veces que el valor de la celda A2 aparece en el rango A2:A7. Si el valor aparece más de una vez, entonces es un duplicado. Si el valor aparece solo una vez, entonces se trata de datos únicos.
- Presione el botón “Enter” para mostrar el resultado de la fórmula. Aquí, el resultado es 2, porque hay dos “Budi” en la columna Nombre.
- Repita los pasos 2 y 3 para todos los registros que desee marcar como duplicados. Puede utilizar la función “Fill” para rellenar fórmulas en otras celdas automáticamente.
- Después de todo, los datos están marcados con fórmulas, puede filtrar o eliminar los datos que tienen valores superiores a 1 según sus necesidades. Por ejemplo, si desea filtrar datos únicos, puede utilizar la función “Filter” para seleccionar solo 1 valor en el campo de fórmula.
Como resultado, los datos tendrán el siguiente aspecto:
Nombre | Edad | Ciudad | Fórmula |
Budi | 25 | Yakarta | 2 |
Andi | 30 | Surabaya | 2 |
Budi | 25 | Yakarta | 2 |
Cici | 28 | Bandung | 1 |
Dedi | 32 | Semarang | 1 |
Andi | 30 | Surabaya | 2 |