¿Cuál es la mejor biblioteca SVM utilizable desde Python?

Podría estar sesgado, pero tendería a recomendar http://scikit-learn.org:

Envuelve tanto liblinear como libsvm. El contenedor fue ajustado para minimizar las asignaciones de memoria y la falta de coincidencia de impedancia entre las representaciones de matriz numpy.ndarray y scipy.sparse de python-land y la representación interna libsvm. Tanto las variantes densas como las escasas de libsvm están envueltas.

Además, también ajustamos los pesos de importancia de nivel de clase y muestra que pueden ser muy importantes cuando se trata de conjuntos de datos desequilibrados.

Esto tiene un impacto en el rendimiento, ver, por ejemplo, esas diapositivas:

http://fseoane.net/talks/fosdem-…

scikit-learn también presenta muchas utilidades adicionales, como la búsqueda en cuadrícula de hiperparámetros mediante validación cruzada (multinúcleo), normalización de la entrada mediante transformadores de PCA blanqueadores, extractor de características para fuentes de texto (y pronto imágenes también), métricas y evaluación de rendimiento (Curva ROC, recuperación de precisión, precisión de clasificación, varianza explicada, …) y así sucesivamente.

Related Content

Ahora mismo estoy aprendiendo desarrollo web, pero no creo que me sea muy útil. ¿Debo aprender el aprendizaje automático o el desarrollo de software?

¿Cuáles son los consejos para aprender el aprendizaje automático?

¿Es probable que Goldman Sachs sea el primero en alcanzar la singularidad?

En el análisis de sentimientos, ¿cómo son útiles los datos etiquetados por humanos para extraer características y capacitar a los clasificadores en el enfoque de aprendizaje automático?

¿Qué cursos debería tomar para especializarse en aprendizaje automático, ciencia de datos e IA como estudiante de MS CS en USC?

¿Cuál es la mejor cámara deportiva de alta velocidad de hasta 500 dólares?

¿Es propiedad de Bluetooth? ¿Hay alguna solución inalámbrica segura comparable para una conexión inalámbrica sin voz?

Tuve que hacer una tarea para comparar diferentes implementaciones de SVM. Comparé las siguientes implementaciones:

Implementación de Scikit-learn SVM basada en LibSVM basado en SMO
Llamar a binarios SVMLight desde Python usando un subproceso
Creando una pequeña implementación para Pegasos (en Python) que resuelve en la forma primaria

El cuaderno de IPython que hace la comparación se puede encontrar en http://nbviewer.ipython.org/5153583

Al elegir “mejor” hice una comparación entre diferentes dimensiones, como la memoria utilizada, el tiempo de CPU, etc.

El código de Pegasos se puede encontrar en https://gist.github.com/nipunred …

Advertencia: no he realizado pruebas exhaustivas o múltiples iteraciones.

Olivier Grisel

More Interesting

¿Cuál es el significado del lenguaje de máquina?

¿Debo saber Python y R para aprender Machine Learning?

¿Cuál es una buena referencia para aprender cómo implementar y usar la búsqueda de línea para la optimización?

¿Qué algoritmo de aprendizaje automático se debe usar para eliminar palabras innecesarias en una consulta de búsqueda realizada para recuperar datos de un texto grande?

¿El submuestreo de un entrenamiento desequilibrado es una buena idea cuando los datos del mundo real, usaré mi clasificador, también estarán desequilibrados?

¿Hay escasez de científicos de datos?

Cómo leer esta arquitectura de red neuronal convolucional

¿Existe alguna relación entre el aprendizaje automático y el campo de la electrónica analógica o digital?

¿Cuándo es importante utilizar convoluciones cruzadas de canales y cuándo no?

¿Cuál es el alcance de AI / ML en la arquitectura de la computadora?

¿Cuál es el peor caso de sobreajuste que hayas visto en entornos sociales o psicológicos?

¿Por qué el aprendizaje en estructuras de datos complejas (gráficos, árboles, etc.) está tan poco representado en el aprendizaje automático?

¿Cuál es el impacto de la limitación de la velocidad de la luz en el aprendizaje automático?

¿Por qué los investigadores de sistemas informáticos no creen en la IA o la aplican a problemas en los 'sistemas informáticos'?

¿Es el análisis de sentimientos todo sobre lingüística?

Web Analytics