¿Qué distribución de Linux es más adecuada para principiantes y entusiastas de la ciencia de datos / big data?

Mira, principiante / entusiasta o veterano en ciencia de datos / big data, lo que importa es qué tan productivo eres con tus herramientas.

Las herramientas pueden incluir R, Python, Scala, Julia, Haskell, Stata, SAS, SPSS, Matlab, GNU Octave, Mathematica, Hadoop, Pig, Hive, Spark, etc. Estas cosas en sí son alucinantes en términos de su complejidad.

Necesita que Linux sea un sistema operativo estable y eficiente que pueda alojar con éxito su entorno para la ciencia de datos. Por lo tanto, en mi humilde opinión, la complejidad de Linux no debería distraerte. Cuanto más simple y fácil de usar sea, más productivo será en su búsqueda para convertirse en un maestro en ciencia de datos.

Ubuntu 14.04 LTS o Linux Mint podría servir bastante bien. No elija las últimas versiones LTS o estables en ninguna distribución. Si es LTS, elija el que tenga al menos 2 años. Esto es para evitar el dolor de cabeza con los errores / inadecuación / falta de compatibilidad de estas versiones.

Una vez que se sienta extremadamente cómodo con un entorno Linux (extremo superior de nivel intermedio a experto), la mejor distribución es Arch Linux. Esto se debe a que, al ser ligero de forma predeterminada, le deja más espacio para llevar su hardware al límite.

Related Content

¿Por qué necesitamos científicos de datos si tenemos aprendizaje automático que puede analizar y procesar datos?

¿Cuál es la mejor manera de compartir y guardar consultas / investigaciones / resultados dentro de un equipo de ciencia de datos?

¿Por qué los tutoriales de regresión lineal en los sitios web de aprendizaje de ciencia de datos no discuten la necesidad de satisfacer supuestos de regresión como la linealidad o la homocedasticidad? ¿Las suposiciones de verificación rara vez se hacen en la práctica?

Cómo ingresar a la genómica o la biología computacional como científico de datos

¿Será un buen paso cambiar de carrera de pruebas de software a científico de datos con R, Tableau y sobresalir después de 9 años de experiencia?

¿Cuáles son los consejos prácticos para trabajar con una gran cantidad de datos para el análisis en Excel?

¿La lente Sigma 17-50 sería una gran alternativa / opción y sería equivalente a las Nikon más caras de 17-55 mm?

Las distribuciones de Linux no son más que los Toffees cubiertos en diferentes envoltorios. El núcleo es el kernel de Linux de todas las distribuciones de Linux. Ubuntu tiene Kernel de Linux; Linux Mint tiene Linux Kernel, y Fedora también tiene Linux Kernel.

Por lo tanto, no existe una distribución de Linux específica para los científicos de datos. Puede usar cualquier distribución de Linux para ejecutar Apache Hadoop y otros programas de software relevantes siempre que estén disponibles en Linux. Ubuntu es perfecto para cualquier usuario con soporte fuerte. Pero, puedes probar Fedora y Mint si quieres una nueva interfaz de usuario.

Souvik Sarkar

Creo que aquí vale la pena mencionar el giro de Fedora Scientific. Esta distribución incluye herramientas esenciales para sus trabajos científicos y numéricos.

Enlace: Fedora Scientific

Pallavi Joshi

More Interesting

¿Qué deben saber todos sobre el descenso de gradiente (estocástico)?

Ciencia de datos: ¿Se puede utilizar el aprendizaje automático para el análisis de series temporales?

¿Qué es la ciencia de datos?

¿Soy comercializable para los empleadores como científico de datos autodidacta?

¿Es la ciencia de datos una sólida trayectoria profesional o simplemente otro rol sensacional que desaparecerá después de unos años de prominencia?

¿Cuáles son algunos usos de big data? ¿Por qué debería aprenderlo en lugar de SQL?

¿Qué libro es mejor para principiantes para comenzar a aprender ciencia de datos, Python para Data Science for Dummies o Data Science from Scratch?

¿Cuál es la elegibilidad para big data?

¿Es el big data eventualmente un problema para recuperar?

¿Qué mini proyecto simple para big data puedo hacer?

¿Habrá algún problema para obtener F1 VISA para el programa de ciencia de datos de 1 año GalvanizeU, San Francisco?

¿Cuáles son algunas buenas instituciones en la India para obtener una maestría en ciencia de datos?

¿Hay personas trabajando en big data en salud en India?

¿Qué pasó con el proyecto 'Estadístico automático', respaldado por Google, etc.?

¿Cuáles son los requisitos previos para los bootcamps de ciencia de datos?

Web Analytics