Podría estar sesgado, pero tendería a recomendar http://scikit-learn.org:
Envuelve tanto liblinear como libsvm. El contenedor fue ajustado para minimizar las asignaciones de memoria y la falta de coincidencia de impedancia entre las representaciones de matriz numpy.ndarray y scipy.sparse de python-land y la representación interna libsvm. Tanto las variantes densas como las escasas de libsvm están envueltas.
Además, también ajustamos los pesos de importancia de nivel de clase y muestra que pueden ser muy importantes cuando se trata de conjuntos de datos desequilibrados.
- ¿Cómo puede alguien usar el verano para hacer un gran progreso en su conocimiento en los campos de redes neuronales artificiales y aprendizaje profundo?
- Todos dicen que el aprendizaje automático ocupará trabajos de un gran no. de personas, ¿es esto cierto? ¿Hay algún lado positivo?
- Cómo aprovechar al máximo el libro 'Programación de la inteligencia colectiva'
- ¿Qué algoritmo de aprendizaje automático puede dar la mejor solución para la clasificación no lineal?
- Cómo probar la idoneidad de diferentes funciones del núcleo en un proceso gaussiano (GP) en el modelado de una función
Esto tiene un impacto en el rendimiento, ver, por ejemplo, esas diapositivas:
http://fseoane.net/talks/fosdem-…
scikit-learn también presenta muchas utilidades adicionales, como la búsqueda en cuadrícula de hiperparámetros mediante validación cruzada (multinúcleo), normalización de la entrada mediante transformadores de PCA blanqueadores, extractor de características para fuentes de texto (y pronto imágenes también), métricas y evaluación de rendimiento (Curva ROC, recuperación de precisión, precisión de clasificación, varianza explicada, …) y así sucesivamente.