¡Hola!
Mis 2 centavos:
Siempre me preocupan los problemas de reproducibilidad en mi trabajo diario de DS / ML. Sin la atención adecuada, es difícil rastrear un resultado después de 6 meses.
- ¿Cuál es la diferencia de aprender características latentes usando SVD y usando vectores incrustados en una red profunda?
- Cómo construir y trazar una gráfica de vecinos más cercanos
- ¿Qué tipo de sistema de recomendación usar con datos extremadamente escasos?
- ¿Cuándo usan los combatientes la ametralladora / cañón y cuándo usan misiles en el combate aire-aire?
- ¿Cómo funciona el muestreo negativo en los modelos de Word2vec?
¡Considero que Cookiecutter Data Science es realmente completo y conciso!
Recomendaría algunas otras referencias que me encontré en los últimos meses (de ninguna manera son exhaustivas) y que creo que podrían agregar a este tema. (Algunos de ellos se centran en R, pero este problema es MUCHO más amplio que cualquier lenguaje / marco / herramienta)
Un flujo de trabajo básico reproducible → Ejemplo simple de una estructura de proyecto
Guía de reproducibilidad → Una visión más amplia / fundamental sobre el tema con MUCHAS referencias
Devolver la ciencia a la ciencia de datos → Un artículo publicado en el sitio de O’Reilly que habla sobre algunos principios / ideas a tener en cuenta.
Mejores prácticas para construir canalizaciones de datos → Otro artículo publicado en el sitio de O’Reilly; también muy interesante
Enfoque de Stripe para la ciencia de datos → La forma de Stripe de hacerlo
Lo siento si estoy siendo repetitivo, pero considero que esta pregunta es REALMENTE importante para todos los que trabajan con DS / ML. La importancia práctica de esto se debe a la necesidad de poder rastrear los resultados y las decisiones tomadas con los datos de la compañía. Además, esta es también una cuestión de transparencia y responsabilidad del trabajo que está realizando el equipo de DS / ML cuando alguien más en la empresa plantea preguntas sobre por qué se tomaron algunas decisiones o cómo el equipo de datos llegó a una conclusión de la que es posible. diferente del sentimiento de alguien.
¡Espero eso ayude! =)