Una búsqueda rápida en Google para “scala machine learning” arroja muchos resultados. Una que encontré particularmente interesante fue esta ¿Cuáles son las mejores bibliotecas de Scala para el aprendizaje automático? que responde tu pregunta
Como usuario de R y Python que tiene el lujo de tener la mayoría de los trabajos pesados de datos manejados por nuestro increíble equipo de ingeniería de datos, rara vez tengo que preocuparme por usar un lenguaje como Scala. Además, no soy fanático de mezclar las palabras Big Data con Analytics o Science. Pero si tuviera que elegir un par de idiomas donde los grandes datos se cruzan con el análisis de datos y la ciencia de datos, esos serían Python y Scala.
La razón por la cual Python y R son más conocidos es doble:
- Uso mucho Python y R, y me gustaría comenzar una empresa que ofrezca servicios de análisis de datos. ¿Cómo puedo monetizar big data? ¿Donde debería empezar?
- ¿Cómo se procesan y visualizan los grandes datos? ¿Qué herramientas se usan?
- Cómo dominar la programación de Python para trabajos de ciencia de datos
- ¿Por qué elegiste trabajar en ciencia de datos sobre finanzas cuantitativas?
- ¿Hay un programa de maestría para ciencia de datos / aprendizaje automático en ETH Zurich? ¿Qué tan bueno es en comparación con los de las universidades de los Estados Unidos, por ejemplo, Berkeley, etc.?
- Por un lado, la gran mayoría de las personas que aprendieron ciencia de datos en línea lo hicieron a través de MOOC que se centran principalmente en Python y R. Hay muy pocos que usan Scala e incluso menos (ninguno que yo recuerde, si conoce alguno, deje un comentario !) para Scala en Spark, donde realmente se produce la belleza de Scala ML en grandes cuerpos de datos.
- Por otro lado, me parece que una configuración corporativa en la que se separa la ingeniería del análisis y la ciencia es más común que lo que a menudo se denomina científicos de datos de “pila completa” o de “extremo a extremo” que combinan ambas funciones. . No estoy completamente seguro de que esto sea cierto, pero parece que ese es el caso.
Dicho esto, Python y R comienzan desde un punto de ventaja. Son más fáciles de configurar y aprender que Scala y ambos son más buscados que Scala en el mercado laboral. Como ejemplo, no recomendaría a nadie que comience a codificar o practicar análisis de datos o aprendizaje automático con Scala, excepto si la persona tiene experiencia en Java.