De los resultados de la encuesta de software KDnuggets 2016 del año pasado, que me gusta porque tiende a tener una mejor distribución geográfica, el ecosistema R es seguido muy de cerca por el ecosistema Python (incluido scikit-learn), y es posible que Python pueda superar R en el futuro cercano.
Sin embargo, los dos no son equivalentes, por lo que podría ser un caso de ambos en lugar de cualquiera. Nuestro equipo considera que R (y Shiny) es bueno para la creación de prototipos y el análisis estadístico, mientras que Python funciona mejor en un entorno de producción. Eso también es consistente con los resultados: el crecimiento en Python podría ser una función de la evolución natural de un equipo de ciencia de datos, desde hacer experimentos y trabajos ad-hoc hasta una mayor integración con el software empresarial.
- ¿Qué tan importante es la teoría de juegos para un científico de datos?
- Como más fresco, ¿debería aprender Hadoop o Spark? ¿Cuál es la hoja de ruta para el análisis de Big Data?
- ¿Qué es una explicación intuitiva de la pseudoreplicación?
- ¿Cuáles son algunos enfoques / reglas generales estándar para la ingeniería de características en el aprendizaje automático competitivo (o de otra manera)?
- ¿Habilidades para el autoaprendizaje de la ciencia / análisis de datos o las estadísticas de EM?