¿Cuál es una buena configuración para realizar trabajos de ciencia de datos en una nube personal?

IPython o RStudio es probablemente su mejor oportunidad a nivel local. El problema con la ciencia de datos moderna es la gran variedad de herramientas que a menudo necesita para ser eficaz. Estos a menudo incluyen muchas dependencias. Y la ciencia de datos no solo implica trabajo exploratorio, sino que también implica el despliegue de tuberías de datos y servicios predictivos.

Hay algunos servicios en la nube disponibles que eliminan parte de esta complejidad.

Sense · Cloud Data Science Platform: ofrece una plataforma completa para la ciencia de datos, que admite R, Python, Julia, Hive, Impala, Spark y más. Hay una versión en la nube totalmente administrada, que puede registrarse de forma gratuita, y una versión en la nube privada o en las instalaciones para los equipos de ciencia de datos empresariales.

Por ejemplo, aquí está el Sense R Workbench. Se ejecuta completamente elásticamente en la nube, por lo que puede aprovisionar tantos recursos como necesite en cualquier momento.
También se realiza un seguimiento de la salida de todos sus análisis. Por lo tanto, es fácil compartir sus resultados con otros.

Si está familiarizado con Python (numpy, scipy, scikit-learn, pandas, etc.) y los Cuadernos de Python, quizás le guste PythonAnywhere: Hospede, ejecute y codifique Python en la nube: PythonAnywhere

Python + Ipython + Ipython Notebook y haga que su IPython Notebook esté disponible desde fuera de la máquina. Eso es perfecto si sabes cómo usar Python