Lo que me llamó la atención en esta pregunta fue la mención de un equipo de análisis O equipo de ciencia de datos. Como lo veo, hay una pequeña diferencia que afecta el flujo de trabajo de git.
En lo que respecta al análisis, mi suposición es que no hay un producto final. Los repositorios son principalmente para mantener el código para el análisis. Con esto en mente, empujar directamente está bien. La razón de esto es que la mayoría de las veces, es un repositorio de una persona y no hay un producto final.
Para un equipo de ciencia de datos, es un poco diferente. Espero que el código de producción esté presente y potencialmente mantenido por más de una persona. Aunque tengo algunos puntos que no estoy muy seguro en este momento, por ejemplo, cómo manejar grandes conjuntos de datos locales, en lo que respecta al código, se debe usar el flujo de trabajo estándar de git. Es, después de todo, el código de producción.
- ¿Qué tan importante es la prueba A / B para un científico de datos que trabaja en una empresa de tecnología?
- ¿Cómo es Berkeley para la ciencia de datos?
- ¿Cómo se utilizan los grandes datos en la industria del petróleo y el gas? La industria del petróleo y el gas ya contaba con sistemas de adquisición de datos e informes implementados para la producción y el mantenimiento. ¿Qué nivel adicional de gestión de datos proporciona Big Data?
- ¿De qué se trata este bombo de big data?
- ¿La optimización está relacionada con la ciencia de datos? ¿Y cómo?