¿Cuántas horas le tomaría a un analista de datos profesional revisar los datos simples de la compañía y construir un modelo para predecir el desgaste?

Supongo que soy la persona adecuada para responder a esta pregunta, ya que he creado dos modelos de desgaste para dos compañías diferentes de EE. UU.
La cantidad de tiempo para construir el modelo dependerá de lo siguiente:
1) Tipo de industria
2) Volumen de datos
3) Cuán limpios son los datos
4) Cómo se estructuran / proporcionan los datos

Entonces, cuando construí el modelo de deserción para uno de los bancos de EE. UU., Tardé alrededor de 20 semanas, ya que los datos eran demasiado grandes, requirieron mucha limpieza y no se estructuraron correctamente, mientras que me llevó alrededor de 12 semanas construirlo para un cliente minorista donde los datos tenían menos volumen y estaban mejor estructurados.

La tarea más importante en cualquier tipo de modelado es crear un conjunto de datos analíticos precisos que realmente requiera la mayor parte del tiempo, una vez que tenga eso listo, la construcción del modelo se puede hacer en una semana.

Big DataBig Data AnalysisData AnalysisData MiningMachine Learning

Utilizando la regresión logística y la regularización L1 / L2, ¿debo preocuparme por la selección de características?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

¿Cuál es la diferencia entre embolsado y bootstrapping en ML / estadísticas?

¿Cuál es la tasa de error de trama (FER) en las tareas de reconocimiento de voz?

¿Cuál es la lógica de la búsqueda de Fibonacci?

¿Cuáles son los beneficios de una tasa de aprendizaje adaptativo para redes neuronales artificiales, en comparación con agregar un término de impulso? ¿Son estos dos métodos diferentes que tienen un efecto muy similar?

En mi caso, los datos no eran simples, y me tomó un par de años desarrollar hipótesis, jugar con los datos y probar diferentes enfoques solo para estar listo para abordar la tarea. Obviamente, esta parte de preparación se realizó mientras trabajaba en otros proyectos, a veces relacionados con la deserción, y a veces no. Al final, no hice un modelo en un sentido clásico, sino que identifiqué los principales factores de desgaste y analicé su impacto en detalle. Probablemente me tomó alrededor de 200 horas de trabajo, y alrededor de 40 de ellas se gastaron en desarrollar implicaciones, recomendaciones y armar una presentación.

Si solo le preocupa desarrollar un modelo, probablemente le tomará entre 50 y 100 horas. Es probable que esto sea algo que podría usarse en proyectos o puntajes adicionales, pero no es algo que podría ser independiente, es decir, no es algo que pueda llevar a personas no técnicas para mejorar su comprensión de cómo ocurre la deserción.

Carnot Antonio Romero

Mucho dependerá de cómo se estructuran los datos, cuántos datos hay, qué tan limpios son, etc. A menudo, los preliminares de la preparación de datos tardan más que el análisis.

Pero, en una suposición aproximada, sus categorías segunda o tercera parecen razonables: de 10 a 100 horas. Si todos los preliminares son fáciles y el desgaste es constante, podría tomar mucho menos.

Carnot Antonio Romero

De hecho, estoy trabajando en un producto que será útil para los científicos de datos e incluso para los analistas de negocios que preparan datos. Quien quiera saber más, comuníquese conmigo.

Carnot Antonio Romero

More Interesting

¿Cuál es el mejor curso de aprendizaje automático en Hyderabad?

¿Qué tan útil es la regresión del proceso gaussiano? ¿Tienes un buen ejemplo?

¿Existe un puntaje general de 'utilidad' para el rendimiento de recuperación de información?

¿Cuáles son los campos de negocios donde se puede usar la red neuronal?

¿Por qué alguien debería aplicar métodos de aprendizaje automático en su investigación?

¿Cómo se debe elegir el parámetro [math] l [/ math] en la regresión de mínimos cuadrados parciales?

¿Cuál es la diferencia entre un enrutador CNC y un molinillo CNC?

¿Sigue siendo útil saber HTML hoy?

¿Cuáles son las diferencias entre los algoritmos CHAID y CART para el crecimiento de los árboles de decisión?

¿Cuál es la posibilidad de que un humano gane el juego de entropía?