He conectado varios proyectos de ciencia de datos (Python / R) con aplicaciones de django.
Después de hacer muchas pruebas y errores:
La clave es no preguntar todo dentro de un ciclo de respuesta de solicitud http, ya que las tareas de ciencia de datos pueden llevar de unos segundos a horas.
- ¿Cuál es la mejor manera de hacer un curso sobre big data en India?
- ¿Dónde encaja Java en una atmósfera de Big Data?
- ¿Dónde puedo obtener un conjunto de datos de muestra de la competencia de Deloitte, Kaggle, para predecir la pérdida de clientes en los dominios de seguros de vida?
- ¿Cómo es útil el Big Data para desarrolladores y administradores?
- ¿Con qué herramientas o tecnologías debería estar familiarizado para conseguir un trabajo en el análisis de datos?
En el caso de proyectos R, solo uso el módulo de subproceso y comparto los resultados / errores usando el backend.
En el caso de proyectos de Python, depende de lo que intente hacer. También puede usar el subproceso o puede tener todo el trabajo integrado.
Si sigue un enfoque basado en tareas, simplemente agregue un indicador booleano para indicar si el trabajo ha finalizado o no.
Si alguien tiene una mejor alternativa, incluso yo estaría interesado en saberlo.
Además, lo que no he intentado es recuperar los resultados como trazados usando matplotlib. (Como un cuaderno de ipython)