En mi experiencia, construir modelos predictivos sólidos lleva más tiempo del que la empresa quisiera, siempre. La lucha es que la mayoría de la gente piensa que la ciencia de datos es básicamente magia moderna. Contratas a un par de científicos de datos (o Analistas / Modeladores de Riesgo de Crédito, como los llamamos en finanzas) y agitan sus varitas mágicas sobre un montón de datos por un rato y viola, un modelo altamente predictivo. Nada mas lejos de la verdad. En nuestro espacio, con los datos que tenemos disponibles, construir un modelo decente parece requerir al menos 4 meses. E incluso ese tiempo significa que no podemos considerar algunas opciones, probar algunas cosas, optimizar algunas cosas, etc. Solo se puede hacer mucho para obtener mejores resultados, pero a menudo las partes interesadas le dirán que preferirían tener un modelo menos predictivo más rápido, que un modelo más predictivo más lento.
Estoy de acuerdo con los otros respondedores que indican que el tiempo para construir un modelo puede variar ampliamente, debido a la habilidad de quienes construyen los modelos, a la cantidad y calidad de los datos disponibles, a la industria, etc. Por lo tanto, decir que lleva 4 meses donde trabajo y en la industria donde trabajo, probablemente no signifique mucho para otras empresas e industrias. En otros lugares puede encontrar que construir modelos (debido a diferentes desafíos, limitaciones y expectativas) lleva mucho más tiempo (¿años?) O mucho más corto (pero aún definitivamente del orden de los meses).
La única forma de acelerar el desarrollo del modelo es tener un conocimiento excepcional del dominio comercial y los datos involucrados, tener datos limpios y bien entendidos, y conocer bien sus herramientas y teoría. En mi experiencia hay complicaciones frecuentes: muy pocos datos, demasiados datos, demasiados datos sucios, datos poco entendidos, muy poca experiencia con herramientas, muy poca experiencia con teoría relevante, poco conocimiento del dominio empresarial …
- ¿Qué certificación de big data es mejor Hortonworks o Cloudera?
- ¿Qué clases debo tomar en Oxford para convertirme en científico de datos?
- ¿Cuáles son los cursos de matemáticas y estadísticas en línea recomendados para ciencia de datos y aprendizaje automático?
- ¿Cómo se puede utilizar la ciencia de datos en economía?
- ¿Qué me preparará mejor para convertirme en científico de datos: un título universitario relevante o autodidacta a través de Coursera, Kaggle y proyectos paralelos?