Dos razones. La primera es que, según el tipo de núcleo, proyecta sus datos en un espacio de características de dimensiones superiores. ¡A veces en un espacio de dimensiones infinitas! Si sus datos no son linealmente separables en el espacio de características original, existe una buena posibilidad de que lo sean cuando se proyectan en dimensiones más altas.
La segunda razón, quizás más intuitiva, es que imbuye a cada uno de sus puntos de datos con información sobre el resto del conjunto de entrenamiento. El núcleo se puede ver como una medida de similitud, de modo que sus características se conviertan en “¿qué tan similar es la instancia 1 a la instancia 2?”, “¿Qué tan similar es la instancia 1 a la instancia 3?”, Etc. Esto hace que sea fácil para el clasificador diga: “La instancia 1 se parece mucho a estas otras instancias que tienen la etiqueta ‘A’. Quizás la instancia 1 también debería tener la etiqueta ‘A'”.
- Cómo construir mi carrera en ciencia de datos
- ¿Vale la pena que un desarrollador de pila completa aprenda ciencia de datos?
- ¿Cuál es la diferencia entre extraer datos y comprimir datos?
- ¿Qué es la minería de datos?
- ¿Qué acciones técnicas y contractuales puede tomar el gerente de proyecto en caso de corrupción de datos durante la migración de datos?