Supongo que tiene una expresión analítica para el hiperplano de separación, representada como una ecuación [matemática] f ^ * (x) = 0 [/ matemática].
Para verificar si el hiperplano empírico sigue al teórico, observe que un SVM aprende una función [matemática] f (x) [/ matemática] que asigna la etiqueta +1 o -1 a todo el espacio de entrada, con el hiperplano de separación representado por [ matemáticas] f (x) = 0 [/ matemáticas]. Entonces, en principio, puede verificar en toda la superficie del hiperplano verdadero el valor de [math] f (x) [/ math], e idealmente debería ser 0 o, en la práctica, muy cercano a cero. La comprobación de toda la superficie es claramente inviable en la práctica, por lo que puede tomar muestras de puntos en la superficie para encontrar aproximadamente la calidad de la solución.
Una advertencia: solo debe esperar que [math] f (x) [/ math] esté cerca de [math] f ^ * (x) [/ math] donde la densidad de los puntos de entrenamiento es lo suficientemente alta. Para las regiones donde hay poca o ninguna información, los dos pueden diferir significativamente. Y esto es cierto para cualquier modelo de aprendizaje automático, no solo SVM. Entonces, cuando muestreas puntos en la superficie y tomas una diferencia promedio entre [matemáticas] f (x [/ matemáticas] [matemáticas]) [/ matemáticas] y [matemáticas] f ^ * (x) [/ matemáticas], las regiones dispersas domine el resultado en una implementación ingenua, y casi siempre concluirá que [math] f (x) [/ math] y [math] f ^ * (x) [/ math] no coinciden. Por lo tanto, debe tomar algún tipo de promedio ponderado de las muestras donde el peso captura la densidad de las instancias de entrenamiento alrededor del punto de muestra, o elegir puntos de muestra de tal manera que solo muestree en regiones de alta densidad.
- ¿Qué harás cuando entrenes a tu modelo?
- ¿Qué es el modelado de mezclas gaussianas?
- ¿Por qué se usaría H2O.ai sobre la herramienta de aprendizaje automático scikit-learn?
- ¿Cuáles son las diferencias entre el aprendizaje automático y los programas de posgrado en ciencias de datos?
- ¿Hay alguna desventaja de usar GPU en el aprendizaje profundo?