¿Qué distribución de Linux es más adecuada para principiantes y entusiastas de la ciencia de datos / big data?

Mira, principiante / entusiasta o veterano en ciencia de datos / big data, lo que importa es qué tan productivo eres con tus herramientas.

Las herramientas pueden incluir R, Python, Scala, Julia, Haskell, Stata, SAS, SPSS, Matlab, GNU Octave, Mathematica, Hadoop, Pig, Hive, Spark, etc. Estas cosas en sí son alucinantes en términos de su complejidad.

Necesita que Linux sea un sistema operativo estable y eficiente que pueda alojar con éxito su entorno para la ciencia de datos. Por lo tanto, en mi humilde opinión, la complejidad de Linux no debería distraerte. Cuanto más simple y fácil de usar sea, más productivo será en su búsqueda para convertirse en un maestro en ciencia de datos.

Ubuntu 14.04 LTS o Linux Mint podría servir bastante bien. No elija las últimas versiones LTS o estables en ninguna distribución. Si es LTS, elija el que tenga al menos 2 años. Esto es para evitar el dolor de cabeza con los errores / inadecuación / falta de compatibilidad de estas versiones.

Una vez que se sienta extremadamente cómodo con un entorno Linux (extremo superior de nivel intermedio a experto), la mejor distribución es Arch Linux. Esto se debe a que, al ser ligero de forma predeterminada, le deja más espacio para llevar su hardware al límite.

Las distribuciones de Linux no son más que los Toffees cubiertos en diferentes envoltorios. El núcleo es el kernel de Linux de todas las distribuciones de Linux. Ubuntu tiene Kernel de Linux; Linux Mint tiene Linux Kernel, y Fedora también tiene Linux Kernel.

Por lo tanto, no existe una distribución de Linux específica para los científicos de datos. Puede usar cualquier distribución de Linux para ejecutar Apache Hadoop y otros programas de software relevantes siempre que estén disponibles en Linux. Ubuntu es perfecto para cualquier usuario con soporte fuerte. Pero, puedes probar Fedora y Mint si quieres una nueva interfaz de usuario.

Creo que aquí vale la pena mencionar el giro de Fedora Scientific. Esta distribución incluye herramientas esenciales para sus trabajos científicos y numéricos.

Enlace: Fedora Scientific