¿Cuántas horas le tomaría a un analista de datos profesional revisar los datos simples de la compañía y construir un modelo para predecir el desgaste?

Supongo que soy la persona adecuada para responder a esta pregunta, ya que he creado dos modelos de desgaste para dos compañías diferentes de EE. UU.
La cantidad de tiempo para construir el modelo dependerá de lo siguiente:
1) Tipo de industria
2) Volumen de datos
3) Cuán limpios son los datos
4) Cómo se estructuran / proporcionan los datos

Entonces, cuando construí el modelo de deserción para uno de los bancos de EE. UU., Tardé alrededor de 20 semanas, ya que los datos eran demasiado grandes, requirieron mucha limpieza y no se estructuraron correctamente, mientras que me llevó alrededor de 12 semanas construirlo para un cliente minorista donde los datos tenían menos volumen y estaban mejor estructurados.

La tarea más importante en cualquier tipo de modelado es crear un conjunto de datos analíticos precisos que realmente requiera la mayor parte del tiempo, una vez que tenga eso listo, la construcción del modelo se puede hacer en una semana.

En mi caso, los datos no eran simples, y me tomó un par de años desarrollar hipótesis, jugar con los datos y probar diferentes enfoques solo para estar listo para abordar la tarea. Obviamente, esta parte de preparación se realizó mientras trabajaba en otros proyectos, a veces relacionados con la deserción, y a veces no. Al final, no hice un modelo en un sentido clásico, sino que identifiqué los principales factores de desgaste y analicé su impacto en detalle. Probablemente me tomó alrededor de 200 horas de trabajo, y alrededor de 40 de ellas se gastaron en desarrollar implicaciones, recomendaciones y armar una presentación.

Si solo le preocupa desarrollar un modelo, probablemente le tomará entre 50 y 100 horas. Es probable que esto sea algo que podría usarse en proyectos o puntajes adicionales, pero no es algo que podría ser independiente, es decir, no es algo que pueda llevar a personas no técnicas para mejorar su comprensión de cómo ocurre la deserción.

Mucho dependerá de cómo se estructuran los datos, cuántos datos hay, qué tan limpios son, etc. A menudo, los preliminares de la preparación de datos tardan más que el análisis.

Pero, en una suposición aproximada, sus categorías segunda o tercera parecen razonables: de 10 a 100 horas. Si todos los preliminares son fáciles y el desgaste es constante, podría tomar mucho menos.

De hecho, estoy trabajando en un producto que será útil para los científicos de datos e incluso para los analistas de negocios que preparan datos. Quien quiera saber más, comuníquese conmigo.