¿Scikit-learn es adecuado para ser utilizado en un entorno industrial?

Hay varios inconvenientes, pero en general puedes aprovecharlo. Lo usé para construir algunos servicios de ML en una startup y las principales lecciones [obvias] aprendidas fueron:

  • No construyas toda la tubería sobre ella
    scikit no escala en absoluto. No es adecuado para procesar un flujo de datos constante, por lo que sería una buena idea convertir cualquier entrada que tuviera en vectores numpy usando otra cosa primero.
  • Benchmark todo
    Tiempo dedicado a etapas particulares, consumo de memoria, etc. Los resultados pueden ser sorprendentes.
  • Lea las evaluaciones y pautas de desempeño documentadas
    A veces obtendrá aceleraciones significativas. También pasa a Python 3.

Es una herramienta increíble para la creación de prototipos, pero eventualmente tendrá que cambiar a algo más orientado al rendimiento.

Creo y mi experiencia muestra que scikit-learn: el aprendizaje automático en Python es una gran herramienta para ML para cualquier entorno. A veces es un poco complicado para problemas a gran escala. Sin embargo, siempre es un buen comienzo para cualquier problema de LD

Sí. Lo utilicé en el back-end de la tubería de datos de una startup tecnológica de fin y fue bastante fácil y robusto. No hay problemas inesperados.