¿Es Ruby un buen lenguaje para la ciencia de datos?

Esta pregunta de 2015 tiene una respuesta, y la odio. No existe el “mejor” lenguaje para la ciencia de datos, y Ruby ciertamente no es un lenguaje “malo” para la ciencia de datos.

El lenguaje de elección es menos importante que la productividad del analista. Si conoce Ruby, codifique en Ruby. Decir que solo puedes usar Python o R para la ciencia de datos es como decir que solo debes enfocarte en aprender C / C ++ para la ciencia de datos. Aprenda los idiomas y use las herramientas más apropiadas para el desarrollador y el problema en cuestión.

No creo que Python sea inherentemente “mejor” en ciencia de datos que Ruby, es solo que más personas que hacen ciencia de datos han adoptado Python en lugar de Ruby. No terminado, no en lugar de, sino “en lugar” de. Si Ruby tuviera un mayor número de seguidores cuando se estaba promocionando el aprendizaje automático, tal vez habría despegado más. Quién sabe. Lo que sí sé es que cualquiera que le diga, prescriptivamente, qué lenguaje usar para la ciencia de datos se está mintiendo a sí mismo sobre la eficacia de sus propias prácticas de desarrollo.

En resumen, usa lo que quieras. Ruby está perfectamente bien para la ciencia de datos. Lo que es más importante que la herramienta que está utilizando es que se siente cómodo con la herramienta que elija.

Como Jesse escribió, no existe un lenguaje “malo” para la ciencia de datos.

Ruby será muy apropiado para la limpieza de datos, la mezcla de datos y todo el procesamiento previo de datos que debe ocurrir antes de que pueda aplicar una regresión lineal o alimentar su entrada a un bosque aleatorio.

Dicho esto, hay muchas más bibliotecas de aprendizaje automático y ciencia de datos para la ciencia de datos en Python y R que en Ruby.

La principal joya de la ciencia de datos parece ser SciRuby, que está mucho menos desarrollada que scikit-learn, por ejemplo.

No. Utiliza Python o R.