En una máquina de vectores de soporte, el número de vectores de soporte puede ser mucho menor que el conjunto de entrenamiento. ¿Cómo puede ser útil esta característica?

Esto es útil ya que se obtiene una solución más dispersa. Un número menor de vectores de soporte, por ejemplo en el caso del kernel, permite una representación más escasa de la solución al problema de optimización, lo cual es beneficioso en escenarios en los que uno podría tener restricciones de almacenamiento y computacionales. Las instancias en las que esto podría ser factible son en plataformas / dispositivos móviles, donde podemos pretender utilizar un algoritmo de aprendizaje automático para una aplicación, o para la realización de chips de algoritmos ML. Puede consultar este documento reciente sobre un nuevo clasificador que ha mostrado una mejora significativa en términos de reducción del número de vectores de soporte, al tiempo que obtiene precisiones comparables.

@ [1408.2803] Aprendizaje de un clasificador de hiperplano minimizando un límite exacto en la dimensión VC

Además de obvio, podemos suponer dos cosas mirando el número de vectores de soporte. Algo sobre la dificultad del problema y la cantidad de sobreajuste. Demasiados vectores de soporte pueden decirnos que podríamos estar sobreajustados o que el problema era realmente difícil.

Esto es útil en el sentido práctico de que durante la predicción necesita hacer menos cálculos. Compare esto con una ingenua implementación del algoritmo de vecinos k más cercanos: necesita calcular similitudes con todos los puntos del conjunto de datos para una predicción. Entonces, si su conjunto de datos de entrenamiento tiene 10k puntos, está viendo cálculos de 10k.

Con una salida más dispersa , no tiene este problema con SVM.

More Interesting

¿Cuáles son algunos buenos métodos para explorar datos de alta dimensión?

¿Cómo almacena un sistema de aprendizaje automático su memoria aprendida?

¿Son las preguntas el verdadero punto de partida del análisis de Big Data?

Ahora mismo estoy aprendiendo desarrollo web, pero no creo que me sea muy útil. ¿Debo aprender el aprendizaje automático o el desarrollo de software?

Cómo probar la ecuación en el documento de aprendizaje de refuerzo de búsqueda de políticas de Sutton

¿Qué startups están usando el procesamiento del lenguaje natural?

Serie temporal: ¿Existe un enfoque para la detección de anomalías que no se base en datos de entrenamiento anteriores?

¿Qué algoritmos son buenos para usar en el procesamiento del lenguaje natural?

¿Cómo funcionan los algoritmos súper recursivos en CUDA?

¿Cuáles son las ventajas de usar una representación escasa en el aprendizaje automático, especialmente en los modelos de aprendizaje profundo?

¿Es posible utilizar el aprendizaje automático en la votación para que podamos incluir las razones de los votantes en lugar de sí / no?

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?

¿Cómo se determina la significación estadística para las curvas ROC y los valores de AUC?

¿Cuál es el mayor problema no resuelto para los sistemas de recomendación?

Cómo interpretar los resultados de R después del análisis en las organizaciones