¿Vim es adecuado para la ciencia de datos?

Respuesta corta: sí.

Respuesta larga: solo voy a hablar desde la perspectiva del programador de Python.

Vim es impresionante como editor de código. Cuando estoy haciendo proyectos escalables de Data Science, no puedo utilizar scripts aleatorios y esperar que trabajen juntos. Necesito construir una biblioteca de estructura que contenga todos los modelos de bases de datos, clases de automatización y funciones auxiliares. Vim me ayuda mucho con eso porque es un editor de código. Y también uso tmux , por lo que mi terminal funciona más como un IDE para que pueda hacer más pruebas.

Pero … ¿qué pasa con los scripts cortos que consumirán la biblioteca que estoy usando?

Ahí es donde realmente empiezo a usar datos para validar mis modelos y suposiciones, podría hacer un script que lea datos de nuestras bases de datos y el ciclo, ejecutando código y luego escribiendo código hasta que haga algo bueno y lo muestre para la validación.

Pero prefiero usar los cuadernos Jupyter para este tipo de cosas. Con las notebooks, puedo almacenar mis objetos / variables en la memoria mientras el kernel de la notebook se esté ejecutando. Puede que no tenga mucho sentido cuando está leyendo pocos datos porque no hay enlaces de teclas de Vim en Jupyter de forma predeterminada (hay algunos complementos, pero puede estar trabajando con personas que no usan Vim), sin embargo, leer datos de 1 GB con un script cada vez es demasiado lento para el desarrollo. En Jupyter, si se hace correctamente (sin sobrescribir su objeto de datos accidentalmente), puede trabajar con esos datos de 1 GB hasta llegar a algunas conclusiones.

TL; respuesta DR:

Vim: pocos datos para trabajar

Jupyter: grandes datos para trabajar

Ciencia de datos

Related Content

Quiero aprender R y python simultáneamente para minería y análisis de datos. ¿Hay algún sitio web que proporcione una estructura de curso similar para ambos?

¿Cuál es la mejor tecnología para procesar big data además de Hadoop y Spark?

Cómo proceder para obtener datos registrados en los parámetros de un equipo de Minería usando sensores

¿Cómo se vincula el campo de Big Data con el campo de Business Analytics?

¿Debo convertirme en un científico de datos si no tengo una ciencia dura o un título universitario cuantitativo?

¿Cómo se puede definir un ancho de banda?

¿Qué es el Autoencoder Adversarial?

vim es un editor de texto de código abierto. Puede usarlo para crear código, documentación, texto o un archivo de marcado. Existen herramientas que son más sofisticadas, se conectarán y sincronizarán con el repositorio, etc.

Pero si lo peor llega a ser peor, vim es perfectamente adecuado para escribir código.

Feyzi Bagirov

¡Es bueno para cualquier cosa hasta que tenga el complemento correcto!

Feyzi Bagirov

More Interesting

¿Cuál es la diferencia entre un trabajo de ciencia de datos que requiere el uso de software SAS y uno basado en un lenguaje científico (Python, R, Matlab, etc.)?

¿Cómo juegan un papel los datos y el análisis en el negocio de un cliente?

¿Cómo la digitalización y los grandes datos afectan la productividad?

¿Cuáles son las habilidades básicas de un científico de datos?

¿La física ayuda a entender la ciencia de datos?

¿Será demasiado tarde para hacer una maestría en informática especializada en inteligencia artificial y ciencia de datos a partir de 2018 otoño?

¿Big Data contiene programación?

¿Cómo elegir un filamento ABS de alta calidad? ¿Cómo entiendo los datos técnicos relevantes?

Cómo cambiar mi carrera de desarrollador front-end a ciencia de datos / informática científica

¿Cómo se puede ser un mejor dueño de mascotas a través de la ciencia de datos?

¿Cuáles son algunas buenas conferencias en video sobre aprendizaje automático y aprendizaje profundo?

Cómo hacer que el aprendizaje del análisis de datos y el tema del algoritmo sea más fácil e interesante

El programa MSAN en USF se ve muy bien. Pero, ¿por qué el curso no se menciona en ninguno de los 10 mejores rankings de cursos de análisis empresarial?

¿Cuáles son los principales desafíos al implementar infraestructuras de Big Data?

¿Tenemos una estrategia de control de calidad para satisfacer todos los volúmenes, variedad y velocidad en Big Data?

Web Analytics