Me encanta esta pregunta!
Cosas que funcionaron
Estamos trabajando en un modelo que permite a cualquier analista elegir cualquier proyecto de cualquier otro analista. Nuestro modelo se basa en este documento: una taxonomía de la ciencia de datos
- ¿Qué debo hacer a continuación para conseguir un trabajo en Data Science y Machine Learning en India?
- ¿Cuáles son los temas candentes para una tesis de maestría relacionada con el aprendizaje profundo o big data?
- ¿Qué son los datos de alta dimensión en Big Data?
- Quiero ser un científico de datos. ¿Qué tipo de trabajo puedo hacer para mi tesis después de aprender Hadoop?
- ¿Cuáles son los mejores cursos de análisis de datos en la India?
El modelo nos obliga a definir una estrategia para cada proyecto de análisis de datos que tenemos. Esta estrategia define más o menos los conjuntos de datos que necesitamos y cómo vamos a abordar el análisis.
Las ganancias son tremendas. Es mucho más fácil mantener el código, trabajar en los proyectos de otras personas, discutir, revisar, presentar, etc.
Otra cosa es que lo mantengamos lo más simple posible. No usamos más complejidad de la necesaria. Si podemos resolver algo con la prueba, eso es lo que haremos.
Cosas que no funcionaron
No mantener nuestros proyectos como proyectos de software. Esto llevó a la confusión. Versiones desordenadas, paquetes incorrectos, etc. Resolver esto también es un problema ya que tenemos otras cosas que arreglar, por ejemplo, ¿cómo mantenemos los conjuntos de datos que son relevantes para un proyecto si solo queremos preservar el código en repositorios?