¿En qué medida deberían los roles de la ciencia de datos requerir familiaridad con el aprendizaje automático?
Las estadísticas tienen muchas herramientas básicas que todos los científicos de datos usan regularmente, como pruebas de comparación, GLM, reducción de dimensionalidad y distribuciones de probabilidad.
Machine Learning tiene un conjunto similar de herramientas básicas. Bosques aleatorios, SVM y algoritmos de agrupamiento por nombrar algunos. Como es un requisito mínimo, cualquier científico de datos debe saber cómo funcionan estos algoritmos (en sus formas básicas) y cómo aplicarlos.
- ¿Cuáles son algunos ejemplos de cómo se aplica la ciencia de datos en la inversión?
- A los 28 años, y aprendiendo a programar. ¿Me he perdido la oportunidad de conseguir un trabajo en ciencia de datos y aprendizaje automático en el Reino Unido?
- ¿Dónde puedo encontrar datos para construir un modelo de prepago de hipoteca usando conceptos de ciencia de datos?
- Ciencia de datos: ¿Cuál es el mejor método para comparar dos bases de datos, una en Hortonworks y la otra en Teradata?
- ¿Cómo utilizan las empresas de alquiler el aprendizaje automático?
Esta es la calificación mínima para ser considerado un científico de datos en mi opinión. No puedo concebir roles que llamaría Data Science que no utilizan estas herramientas.
La mayoría, pero no todos, los científicos de datos deben estar familiarizados con los algoritmos de ML para la reducción de la dimensionalidad. También redes neuronales, redes neuronales convolucionales y otros temas de investigación candentes en el campo. A diferencia de lo básico, muchos científicos de datos (pero aún la minoría) no necesitarán una comprensión exhaustiva de cómo funcionan las NN bajo el capó. Siempre que comprendan las implicaciones de conceptos como la propagación inversa y la adición de capas ocultas en las aplicaciones.