- datos faltantes: ejecutaría estadísticas descriptivas y / o crearía visualización de datos para encontrar datos faltantes
- Datos parciales y no estandarizados: es posible que los datos no falten por completo, es posible que no tengan el apellido para toda la lista de clientes, por ejemplo, o que falten códigos postales para algunas direcciones. Así que es una tetina para verificar si hay datos parciales. Y es posible que los datos no estén estandarizados, por lo que la lista de empresas puede tener google, gooogle inc y alfabeto cuando todo eso sea lo mismo.
- Incompleto: sabe que tiene 100k clientes, pero por alguna razón, los datos tienen solo 25k registros, por lo que debe asegurarse de tener a mano un conjunto de datos completo.
- Erróneo: un campo de ventas tiene un valor AAA, que es un error, por lo que debe descubrir errores como este en el conjunto de datos.
¡Espero que ayude!