Contestaré la pregunta en el contexto de Data Science en el mundo comercial / empresarial, ya que esto es lo que probablemente quiera decir.
- Comprenda el problema comercial extremadamente bien. Esto es muy importante y a menudo se pasa por alto. Si los científicos de datos no lo entienden completamente, entonces el proyecto puede desviarse fácilmente del curso (y resultar en partes interesadas insatisfechas / insatisfechas) o desperdicio de dinero.
- Obtenga datos relevantes para el problema.
- Limpia los datos.
- Realizar EDA. A menudo, esto no lo hacen científicos de datos aficionados / novatos, ya que se considera innecesario. Realice tantos gráficos y visualizaciones para comprender bien los datos con los que está trabajando. Además, esto puede y debe dar como resultado algunas ideas de qué algoritmos y técnicas intentar utilizar para resolver el problema.
- Entrenar a una modelo.
- Prueba, prueba, prueba.
- Revise y modifique si es necesario.