Esto es algo que constantemente intento mejorar. No sé cuál es la mejor manera, pero esto es lo que tenemos, lo que estamos planeando y lo que estamos considerando en Miniclip:
Que tenemos
- Un imbécil interno. Todos los proyectos están versionados, desde el análisis hasta los productos de datos.
- Convenciones de código. Todos los proyectos obedecen a una convención de codificación.
- Los propietarios de los productos mantienen los resultados de análisis, experimentos y productos en wikis internos del producto.
- Los productos y proyectos de datos tienen wikis internos del proyecto mantenidos por el analista o ingeniero propietario del proyecto.
- Servidor central de aplicaciones. Usamos Shiny para esto. Todos los productos de datos interactivos están en este servidor.
Lo que estamos planeando
- ¿Que competencia de kaggle debería elegir?
- ¿Cuál es la diferencia entre la tabla de clasificación pública y privada en Kaggle?
- ¿Cuáles son las habilidades valiosas necesarias para comenzar con Data Analytics?
- Cómo desarrollar la intuición de datos
- ¿Cómo se usa Data Analytics en finanzas (específicamente Hedge Funds)?
- Paquete estandarizado para proyectos de datos. Esto mejorará la comunicación pero una productividad más importante.
- Repositorio centralizado de conjuntos de datos. Generamos grandes conjuntos de datos por proyecto. Estos no pueden mantenerse en nuestros silos de datos y no los queremos en nuestros repositorios de código.
Lo que estamos considerando
- RS Connect por RStudio. El objetivo es centralizar los informes automatizados y los productos de datos interactivos.
¡Espero que esto ayude!