Bueno, echemos un vistazo. ¿En qué consiste realmente la limpieza de los datos? Si estamos hablando de formatear datos para que sean legibles por máquina, ese es realmente un trabajo de manipulación de datos. Las personas que lo hacen merecen muchos elogios como ingenieros de software, no como científicos de datos.
Si estamos hablando de la preparación de datos para algoritmos de ML, eso requiere las mismas habilidades de ciencia de datos, y generalmente al mismo nivel, que aquellos que desarrollan y usan los algoritmos.
En otras palabras, hay dos carreras para científicos de datos: analistas de datos y analistas de dominio.
- Cómo obtener una comprensión profunda y exhaustiva de la optimización de algoritmos en C ++
- Cómo encontrar un segmento en una matriz con un número máximo de elementos con suma S
- ¿Cuál es la diferencia entre analizar un archivo CSV y JSON? ¿Qué algoritmos comunes usarías en ambos?
- ¿Cuál sería el mejor enfoque para encontrar la distancia entre dos nodos de un árbol?
- ¿Es necesario aprender un algoritmo antes de aprender cualquier lenguaje de programación?
Ambos merecen reconocimiento, pero seamos sinceros: los analistas de dominio no solo tienen análisis de datos, sino también experiencia en el dominio. Hablan con las PYME su idioma y con los estadísticos, el suyo; Por supuesto, obtienen más visibilidad en los niveles superiores.