En la clasificación SVM, ¿es posible encontrar la muestra de entrenamiento más cercana a la muestra de prueba dada?

Para encontrar la muestra de entrenamiento más cercana a una muestra de prueba, simplemente puede usar la métrica de distancia euclidiana [matemáticas] \ min \ | x-x_i \ | ^ 2 [/ matemáticas] donde [matemáticas] x [/ matemáticas] es su muestra de prueba y [math] x_i [/ ​​math] son ​​las muestras de entrenamiento, [math] i = 1,2, .., M [/ math]. Eso sería independiente del clasificador utilizado, ya que los conjuntos de entrenamiento y prueba se identifican por separado antes del entrenamiento del clasificador.

Si la pregunta hubiera sido encontrar el vector de soporte más cercano a una muestra de prueba, entonces eso dependería del hiperplano de separación SVM. Desde el modelo SVM, puede encontrar esas muestras de entrenamiento que son vectores de soporte.

LIBSVM: obtenga vectores de soporte del archivo modelo

Luego, puede usar una métrica similar para encontrar el vector de soporte más cercano.

More Interesting

¿Las herramientas como BigML o Google Prediction API dejarán a los expertos en aprendizaje automático fuera del trabajo?

¿Es posible construir algo así como una red neuronal recurrente simplemente ingresando los mismos datos a lo largo del tiempo (por ejemplo, si los datos son una aceleración, cada entrada es el acc a la vez T)?

¿Qué es mejor en CMU: 10-601 o 10-701?

¿Cómo manejan las empresas en Silicon Valley sus datos de flujo de red?

Cómo crear la línea de regresión de mínimos cuadrados (error cuadrático medio mínimo) en R

¿Cuál es el punto de ejecutar un modelo de regresión logística antes de un árbol de decisión?

Los algoritmos de ML escritos en Java funcionan bien para un conjunto de datos más pequeño. Para un conjunto de datos grande, ¿cómo podemos escalar estos algoritmos? ¿Necesitamos buscar algoritmos distribuidos / mapas distribuidos en memoria / NOSQL / archivos para leer y escribir grandes conjuntos de datos o hay alguna buena API?

¿Quién inventó las redes neuronales de convolución?

Cómo usar Tensorflow para Python en Windows

Después de la selección de características utilizando el método de rankeador, WEKA, el número de atributos en el conjunto de prueba es diferente del conjunto de entrenamiento. ¿Cómo los comparas?

¿Cuál es la diferencia entre datos etiquetados y datos no etiquetados?

¿Cuál es la mejor extracción de características de un conjunto de datos de imágenes?

¿Cuáles son los mejores cursos de ciencia de datos en Udemy?

¿Es posible que, en el futuro, los países sean manejados por una súper computadora que calcule el mejor resultado de una decisión política?

¿El aprendizaje automático es algo que no llegará demasiado lejos si no tiene la formación académica adecuada? Dado que hay tanto en Internet, ¿se puede entender?