Ahí es donde el concepto de un repositorio de modelos puede resultar muy útil.
En un repositorio de modelos, puede definir proyectos , grupos de proyectos y modelos . Por ejemplo, un grupo de proyecto podría ser un modelo de viaje del cliente . Un proyecto en ese grupo podría predecir la rotación . Dentro de ese modelo de abandono, puede tener múltiples modelos, por ejemplo, una regresión logística y una red neuronal.
Luego puede marcar uno de estos modelos como el modelo campeón actual, que es el modelo con mejor rendimiento y el que desea poner en producción. Una vez que haya marcado los modelos como modelo campeón , modelo retador o modelo pasivo , puede implementarlos y controlar su rendimiento a lo largo del tiempo. Si el rendimiento de su modelo de campeón se degrada, puede activar una alerta o un reentrenamiento automático del modelo.
- ¿Deben analizarse los datos en la fuente o debe construirse un almacén de datos?
- ¿Cuáles son los requisitos previos necesarios para aprender la administración de big data?
- ¿Qué cosas necesito saber antes de ingresar al análisis de datos?
- ¿Cuál es la diferencia entre un desarrollador de BI y un desarrollador de Big Data?
- Cómo avanzar mi habilidad R al siguiente nivel
No estas solo. Este es un problema al que se enfrentan muchas organizaciones que se toman en serio la ciencia de datos: la complejidad de los modelos es enorme, pero la gobernanza y la estructura a su alrededor a menudo no existen. El desarrollo tradicional de TI ya está mucho más estructurado mediante el uso de versiones centralizadas de código, pruebas automatizadas, entornos múltiples dev-test-prod, …
Un buen ejemplo de una implementación es SAS Model Manager.