El procesamiento de datos está llevando los datos a un formato utilizable Los datos generalmente vienen en forma muy desordenada, por ejemplo, en la columna de ‘Ventas totales’, un dato incorrecto contendría alfabetos que en realidad no tiene sentido ya que esperaría que los datos de ventas fueran numéricos. Ahora procesar estos datos significaría imputar esta forma de valor de carácter como faltante (o media o mediana, etc.). Esto es necesario ya que el software (o incluso los humanos) no entenderá el valor (alfabetos en lugar de números).
Análisis de datos: una vez que los datos están limpios, se pueden usar para analizar (¿Por qué las ventas son tan bajas o tan altas? ¿Qué se puede hacer al respecto? Etc.)
Hablando casualmente, el procesamiento de datos se convierte en la etapa inicial de Data Analytics, ya que los datos nunca llegan a estar limpios.
- ¿Qué odias de la ciencia de datos?
- ¿Cuáles son ejemplos concretos de misiones de Data Scientist dentro de las empresas?
- Hay tantas cosas en Python. ¿Qué conceptos necesito saber para el análisis de datos?
- ¿Qué calificaciones se requieren para un profesional de la ciencia de datos?
- Cómo documentar un proyecto de ciencia de datos
Metafóricamente, si tiene pollo crudo, primero lo cocinará o lo procesará en forma comestible . Una vez que está cocinado, Sanjeev Kumar (o cualquier crítico de comida) puede probar / analizar y comentar lo que falta (es sal, luego agrega un poco más). Espero que haya ayudado.