¿El núcleo RBF utilizado en SVM significa que la dimensión de proyección será la misma que el tamaño del conjunto de datos original?

No estas equivocado. Dados los puntos de datos [math] n [/ math], un núcleo lineal proyectaría las observaciones a un espacio de características [math] O (n) [/ math] y un núcleo polinomial de grado [math] d [/ math] proyecta observaciones a un espacio de características [matemáticas] O (n ^ d) [/ matemáticas]. El kernel RBF se proyecta en un espacio de características de dimensión infinita ya que las observaciones se proyectan a una distribución gaussiana continua. La alta dimensionalidad aquí es beneficiosa ya que un conjunto de datos sería más separable en dimensiones más altas. Sin embargo, cuando el número de observaciones es grande, el núcleo se vuelve bastante grande y el rendimiento podría ser un problema.

Ahora, si le preocupan demasiados parámetros del modelo, se trata de la naturaleza de SVM, donde el hiperplano de separación solo depende de los vectores de soporte. Dado [math] f (x) = \ sum_ {i = 1} ^ {1000} a_i K (x, x ‘) [/ math], la mayoría de [math] a_i [/ ​​math] sería 0 y solo un Se necesitan pocos parámetros y productos de punto para hacer una predicción.

En realidad, el núcleo RBF se proyecta en un espacio dimensional infinito .

Pero no exactamente como se podría pensar.

[matemáticas] e ^ {x} = 1 + x + x ^ 2/2 +… [/ matemáticas]

Considerado en términos de elementos de base polinomiales, eso es dimensión infinita.

More Interesting

¿Cuál es la diferencia entre datos sin procesar y procesados?

¿Qué se entiende por aprendizaje automático y el futuro de la ciencia de datos en la India?

¿Qué tecnología sería la mejor entre el desarrollo (Big Data-Hadoop / Android Application), considerando el crecimiento futuro, la estabilidad y el pago?

¿Cómo se puede usar Python para el conjunto de datos o el manejo y análisis de marcos de datos?

¿Cuál es un ejemplo de cómo usaste la ciencia de datos para resolver un problema, tomar una decisión u optimizar algo en tu vida personal?

¿Quién puede sugerir un buen proyecto en el campo de la atención médica, la minería de datos y el aprendizaje automático que utilice el reconocimiento de imágenes?

¿Deben analizarse los datos en la fuente o debe construirse un almacén de datos?

¿Cuáles son los documentos recientes de ieee sobre minería de datos?

¿Cómo son las ubicaciones de Agies Mumbai después de PGP en Data Science?

¿Cuáles son las diferentes estrategias de gestión de datos? ¿Sus ventajas y desventajas?

Cómo cambiar de ingeniería de datos a modelos de construcción, aprendizaje automático, etc.

¿Quiénes son los principales expertos mundiales en ciudades inteligentes y planificación urbana basada en datos?

¿Puedo obtener un trabajo de ciencia de datos después de completar el curso de certificación junto con un proyecto en él?

¿Qué escuela es mejor para el aprendizaje automático?

¿Cómo sabemos qué estructura de datos es mejor para el problema simplemente observando cuidadosamente el problema?