¿Cuál es la función [math] \ Psi [/ math] en esta diapositiva?

¿Hay algún contexto que nos pueda proporcionar? Creo que esto te muestra que la proyección de [matemáticas] X [/ matemáticas] por la función [matemáticas] \ Phi [/ matemáticas] puede parecerse a cualquier cosa, aquí es un conjunto no convexo. Si dibuja una línea desde dos puntos en [matemática] \ Phi (X) [/ matemática], hay algunos segmentos que quedarán fuera de [matemática] \ Phi (X) [/ matemática]. Entonces, por ejemplo, un punto en el espacio [matemática] F [/ matemática], [matemática] \ Psi [/ matemática], no está en la imagen de [matemática] \ Phi [/ matemática].

¡Pero la característica redentora de los métodos Kernel es que en realidad no importa! Como trata la imagen de [math] X [/ math], [math] \ Phi (X) [/ math], como base para combinaciones lineales, el intervalo de [math] \ Phi (X) [/ math] es en realidad es mucho más grande e incluye puntos como [math] \ Psi [/ math].

Creo que psi aquí son puntos arbitrarios en el espacio de características F. Esto se deriva del teorema de representación donde la función phi óptima que se encuentra en la imagen se evalúa con centros arbitrarios en el espacio de características para mapear de nuevo al punto de entrada.
Los siguientes enlaces pueden ayudarlo:
Página en psu.edu
15.4 SVM no lineal
o Página en wiai.uni-bamberg.de
Página en http://www.cedric-richard.fr

More Interesting

¿Cómo utilizan los RNN estándar la información de los pasos de tiempo anteriores?

Cómo implementar un nuevo clasificador desde cero utilizando el enfoque de aprendizaje automático

¿Qué es una red neuronal convolucional?

Cómo validar mi sistema de recomendaciones sin datos previos de interacción del usuario

¿Cuál es la mejor manera de hacer reconocimiento / clasificación de múltiples objetos en tiempo real usando OpenCV y GPU (CUDA)?

¿Qué hace que los parámetros del modelo sean variables latentes?

¿Cuántos tipos de técnicas utilizan los limpiadores profesionales?

¿Es posible generar programas informáticos solo a partir de especificaciones?

¿Por qué el uso de información mutua / ganancia de información / funciones similares funciona mejor que simplemente usar el error promedio (usando probabilidad) para un booleano (conjunto de datos de 2 clases) al construir un árbol de decisión?

¿Puede la operación de agrupamiento aumentar el número de neuronas en el aprendizaje profundo?

¿Cómo se pueden extender los codificadores automáticos a tamaños de imagen realistas como 640 x 480 o más?

¿Qué es un componente principal y por qué se llama así?

¿Cuáles son algunas buenas ideas para proyectos de aprendizaje automático? Yo uso Python

¿Cómo se diseñan y desarrollan las nuevas arquitecturas de aprendizaje profundo?

¿Cómo puede Google diseñar un procesador más adecuado para el entrenamiento de redes neuronales profundas que la GPU?