¿Scikit-learn es adecuado para ser utilizado en un entorno industrial?

Hay varios inconvenientes, pero en general puedes aprovecharlo. Lo usé para construir algunos servicios de ML en una startup y las principales lecciones [obvias] aprendidas fueron:

No construyas toda la tubería sobre ella
scikit no escala en absoluto. No es adecuado para procesar un flujo de datos constante, por lo que sería una buena idea convertir cualquier entrada que tuviera en vectores numpy usando otra cosa primero.
Benchmark todo
Tiempo dedicado a etapas particulares, consumo de memoria, etc. Los resultados pueden ser sorprendentes.
Lea las evaluaciones y pautas de desempeño documentadas
A veces obtendrá aceleraciones significativas. También pasa a Python 3.

Es una herramienta increíble para la creación de prototipos, pero eventualmente tendrá que cambiar a algo más orientado al rendimiento.

¿Qué IDE para R prefiere, RStudio o Microsoft Visual Studio, o usa ambos? ¿Por qué?

¿Dónde puedo descargar los documentos y conjuntos de datos de Panama Papers?

¿Cuáles son los casos de uso típicos para diferentes algoritmos de aprendizaje automático? Por ejemplo, ¿en qué condiciones típicas uno preferiría usar uno sobre el otro sin haber probado la precisión del aprendizaje?

¿Cómo es relevante el big data para CRM?

¿De qué debo ocuparme cuando estoy usando el wifi de mi vecino?

¿Cuál es el significado del procesamiento de datos?

Creo y mi experiencia muestra que scikit-learn: el aprendizaje automático en Python es una gran herramienta para ML para cualquier entorno. A veces es un poco complicado para problemas a gran escala. Sin embargo, siempre es un buen comienzo para cualquier problema de LD

Eren Golge

Sí. Lo utilicé en el back-end de la tubería de datos de una startup tecnológica de fin y fue bastante fácil y robusto. No hay problemas inesperados.

Roman Trusov

More Interesting

¿Cuáles son algunas de las aplicaciones más útiles para la minería de datos?

¿Cuál es la diferencia entre la recuperación de información y la minería de datos? ¿Cómo se relacionan los grandes datos con estas dos técnicas diferentes?

Cómo analizar mis datos fácilmente y mejorar mi negocio

¿Cuáles son y cuántas oportunidades laborales hay para trabajos de ciencia de datos en India?

¿Hay algún campo de arranque de ciencia de datos en línea?

¿Cómo pueden las tecnologías de Big Data mejorar la inversión de impacto social?

¿Cuáles son los pros y los contras de usar Kaggle Scripts?

¿Cuál es la importancia de la gestión, análisis y seguridad de datos para una empresa?