Aunque otras respuestas ya parecen haber hecho justicia a la pregunta, también podríamos considerar a DS como un dominio de aplicación de técnicas de ML. DS es más como una práctica y dado que es una palabra de moda relativamente nueva para describir la tarea de derivar ideas a partir de los datos, independientemente del volumen, la variedad, la velocidad y el espacio para la toma de decisiones accionables , apenas se usa en los contextos teóricos. Entonces, hasta hace poco, difícilmente encontraría programas académicos o de investigación en DS. Este no es el caso de ML. Si bien DS abarca todas las fases de análisis de datos de extremo a extremo (por ejemplo, preprocesamiento, análisis, validación, interpretación y despliegue), ML, por otro lado, pone más énfasis en las técnicas utilizadas en las fases de análisis, validación e interpretación.
En la investigación académica, los investigadores de ML, en su mayoría con experiencia en ciencias de la computación, matemáticas, estadísticas o physiscs , desarrollan nuevos algoritmos de agrupamiento, regresión, selección de modelos y validación, por ejemplo, o mejoran las técnicas existentes, como el diseño de estrategias novedosas para determinar estructuras óptimas de red profunda. . Los investigadores de DS, por otro lado, pueden tener diversos antecedentes técnicos y a menudo se preocupan por la aplicación de técnicas estadísticas y ML para abordar problemas en diversos dominios.
En la industria, los dominios de DS y ML se superponen delicadamente con límites bastante confusos. Los primeros usuarios tendrán roles de trabajo como Ingeniero de Aprendizaje Automático o Científico para referirse a una gran cantidad de responsabilidades que requieren una competencia técnica variable. Recientemente, hemos visto la separación de inquietudes o responsabilidades que llevan a roles más específicos, por ejemplo, ingeniero de datos, sistemas y herramientas de ingeniería para mover / almacenar datos y la implementación de modelos predictivos de los científicos de datos, científicos de datos , identificando necesidades y brechas de datos organizacionales, construyendo predicciones modelos basados en objetivos de organización de alto nivel y análisis de datos de productos utilizando técnicas de ML, llevan a cabo experimentos, por ejemplo, pruebas A / B, convirtiendo ideas en recomendaciones accionables e informes para gerentes de alto nivel.
- ¿Cuál es la relación entre aprendizaje automático, procesamiento de imágenes y visión por computadora?
- ¿En qué punto se considera una máquina un robot?
- ¿Dónde exactamente en el sótano de Maxwell Dworkin está la impresora que imprime gratis?
- ¿Cómo le explicarías P vs. NP a un niño?
- ¿Qué son los objetos de valor?
A continuación, relaciono una figura que considera las complejidades de DS, ML y otros campos aliados y cómo encaja en la resolución de problemas en muchas organizaciones.
Aquí hay otro hilo de reddit sobre el tema:
Ingeniero de aprendizaje automático vs Científico de datos • r / Aprendizaje automático