Gracias por el A2A.
Hay una gran diferencia entre los dos, aunque demasiado de lo que lees en línea hace que suenen igual. Como otros han señalado, el aprendizaje automático es una disciplina que involucra estadísticas, ciencias de la computación y matemáticas.
La ciencia de datos es un campo amplio que abarca mucho más. Un científico de datos debe trabajar con (generalmente) un experto en la materia que no sabe mucho, si es que sabe algo, sobre ciencia de datos. Por lo tanto, tendrá que traducir el problema que quieren resolver en uno de ciencia de datos. Tendrá que codificar su conocimiento en su formulación de alguna manera. Y es posible que tenga que hacer todo esto con cierto grado de inteligencia, ya que muchas pymes insistirán en que saben cuál es el problema, incluso si se dan cuenta de que hay algo más que debe abordarse / considerarse para obtener el resultado que desean.
- ¿Cuáles son los métodos actuales o estándar de combinación de datos estructurados y no estructurados en redes neuronales convolucionales?
- ¿Cómo se puede usar el aprendizaje profundo para la detección de eventos anormales en los videos?
- ¿Cuál es el número mínimo de árboles que debo usar en un bosque aleatorio?
- ¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?
- ¿Cuáles son los temas de investigación sobre aprendizaje profundo para la tesis de maestría?
Un científico de datos pasará gran parte de su tiempo remodelando y limpiando los datos, lo que no cae dentro del ámbito del aprendizaje automático. Y a menudo también se quedará atascado con la obtención de datos.
La ciencia de datos también implica bastante perspicacia comercial. Debe saber cuándo detenerse, cuándo una respuesta es “suficientemente buena” y cuándo es necesario repensar el proyecto desde el principio. Debe pensar continuamente en el objetivo comercial, no en la “respuesta” al problema del aprendizaje automático.
La ciencia de datos incluye algunas áreas de las matemáticas que no entran en el ámbito del aprendizaje automático. La analítica prescriptiva requiere optimización, modelación causal y / o teoría de la decisión para llegar a un curso de acción recomendado.
Y luego, cuando la parte técnica del problema está completa, todavía queda la pequeña cuestión de explicar sus resultados de una manera clara y convincente para que los tomadores de decisiones tomen el curso de acción recomendado. Como mínimo, eso requiere habilidad con la visualización de datos, que está muy fuera del alcance del aprendizaje automático. Pero en un entorno empresarial, puede terminar en la posición en la que tiene que decirle a algún ejecutivo con décadas de experiencia que su intuición es incorrecta. No hace falta decir que tendrá que hacer esto de una manera políticamente sensible o lo rechazarán como teórico. Si usted es serio acerca de aportar valor a su cliente, necesita saber algo acerca de la psicología, la persuasión y simplemente las habilidades de las personas.
No se confunda con todos los MOOC que sugieren que todo lo que necesita hacer es tener experiencia con algunos algoritmos de aprendizaje automático y de repente es un científico de datos. La ciencia de datos requiere muchas habilidades, el aprendizaje automático es solo una de ellas.