Respuesta corta: sí.
Respuesta larga: solo voy a hablar desde la perspectiva del programador de Python.
Vim es impresionante como editor de código. Cuando estoy haciendo proyectos escalables de Data Science, no puedo utilizar scripts aleatorios y esperar que trabajen juntos. Necesito construir una biblioteca de estructura que contenga todos los modelos de bases de datos, clases de automatización y funciones auxiliares. Vim me ayuda mucho con eso porque es un editor de código. Y también uso tmux , por lo que mi terminal funciona más como un IDE para que pueda hacer más pruebas.
- Estoy planeando hacer un estudio independiente usando Machine Learning y Big Data. ¿Hay algún tema interesante como Deep learning para PNL?
- No soy muy bueno en Estadística o Probabilidad, pero soy un buen programador. ¿Debo aprender Big Data?
- ¿Cuál es una tarifa razonable para cobrar por la consultoría de ciencia de datos?
- Cómo disfrutar de un entrenamiento de Hadoop de Big Data justo después de mi 12 °
- ¿Cuáles son los métodos de ciencia de datos más utilizados en los negocios?
Pero … ¿qué pasa con los scripts cortos que consumirán la biblioteca que estoy usando?
Ahí es donde realmente empiezo a usar datos para validar mis modelos y suposiciones, podría hacer un script que lea datos de nuestras bases de datos y el ciclo, ejecutando código y luego escribiendo código hasta que haga algo bueno y lo muestre para la validación.
Pero prefiero usar los cuadernos Jupyter para este tipo de cosas. Con las notebooks, puedo almacenar mis objetos / variables en la memoria mientras el kernel de la notebook se esté ejecutando. Puede que no tenga mucho sentido cuando está leyendo pocos datos porque no hay enlaces de teclas de Vim en Jupyter de forma predeterminada (hay algunos complementos, pero puede estar trabajando con personas que no usan Vim), sin embargo, leer datos de 1 GB con un script cada vez es demasiado lento para el desarrollo. En Jupyter, si se hace correctamente (sin sobrescribir su objeto de datos accidentalmente), puede trabajar con esos datos de 1 GB hasta llegar a algunas conclusiones.
TL; respuesta DR:
Vim: pocos datos para trabajar
Jupyter: grandes datos para trabajar