Mira, principiante / entusiasta o veterano en ciencia de datos / big data, lo que importa es qué tan productivo eres con tus herramientas.
Las herramientas pueden incluir R, Python, Scala, Julia, Haskell, Stata, SAS, SPSS, Matlab, GNU Octave, Mathematica, Hadoop, Pig, Hive, Spark, etc. Estas cosas en sí son alucinantes en términos de su complejidad.
Necesita que Linux sea un sistema operativo estable y eficiente que pueda alojar con éxito su entorno para la ciencia de datos. Por lo tanto, en mi humilde opinión, la complejidad de Linux no debería distraerte. Cuanto más simple y fácil de usar sea, más productivo será en su búsqueda para convertirse en un maestro en ciencia de datos.
- ¿La ciencia de datos se preocupa por la causalidad?
- Cómo decidir qué quieres de una gran cantidad de datos
- ¿Cómo es la ciencia de datos diferente del análisis de Big Data?
- ¿Cuál es la correlación entre PNL, IA, aprendizaje automático, big data y ciencia de datos? ¿Existe una jerarquía o algo en común entre estos? ¿Cómo se relacionan estos problemas con el mundo real?
- ¿Cómo es hacer un doctorado en aprendizaje automático / minería de datos / big data en una escuela de negocios?
Ubuntu 14.04 LTS o Linux Mint podría servir bastante bien. No elija las últimas versiones LTS o estables en ninguna distribución. Si es LTS, elija el que tenga al menos 2 años. Esto es para evitar el dolor de cabeza con los errores / inadecuación / falta de compatibilidad de estas versiones.
Una vez que se sienta extremadamente cómodo con un entorno Linux (extremo superior de nivel intermedio a experto), la mejor distribución es Arch Linux. Esto se debe a que, al ser ligero de forma predeterminada, le deja más espacio para llevar su hardware al límite.