¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?

Si te entiendo correctamente, el problema es que necesitas un sistema que ‘entienda’ que 0 y 359 grados están cerca y que pueden generalizarse e interpolarse en consecuencia. Puede lograr esto transformando el ángel thetta en dos nuevas entradas: sin (thetta) y cos (thetta). Si traza sus puntos de datos con estos dos como el eje xey, verá que los puntos de datos se encuentran en un círculo y que los puntos con thetta = 0 y 359 están tan cerca como geométricamente.

Como explica Tudor Achim, puede usar cualquier núcleo. No es necesario que el hiperplano siga la curva del círculo. Puede intersecar el interior del círculo de la forma que desee porque no hay puntos de datos allí. Todos están en el círculo.


¡Fácil!

Las dos respuestas anteriores funcionan si todos los aspectos positivos y negativos son contiguos como en el ejemplo de Roar Nybø. Sin embargo, si tiene una superficie de decisión más compleja como (0-45) es positiva, (45-90) es negativa, (90-135) es positiva, (135-180) es negativa, etc., entonces puede intentar cambiar su el vector de características sea completamente positivo (es decir, en lugar de -pi a pi, use 0 a 2 pi) y use el kernel mínimo (también llamado kernel de intersección de histograma)

Donde sea que use x dot y reemplace con sum_i min (x (i), y (i))

Si usa Java, voy a enviar un parche a Apache Mahout uno de estos días que hace esta clasificación mínima del núcleo. Alternativamente, puede aplicar el parche de refuerzo ( https://issues.apache.org/jira/b …) que debería funcionar con cualquier característica no lineal. Los tocones de decisión básicamente transforman su espacio de características en un grupo de hipótesis binarias y luego aplican la regresión logística en el espacio de hipótesis.

Supongo que la pregunta se refiere a un espacio de características bidimensionales, en el que los datos para cada clase se pueden dibujar aproximadamente en el límite de un círculo en el plano. Si este es el caso, entonces el núcleo no importa siempre que sea polinomial: el mejor separador con respecto al criterio de margen máximo será una línea (un hiperplano en dimensiones más altas), que se encuentra por un lineal SVM.

No tengo la intuición de lo que generaría un núcleo RBF en estos datos si los círculos se superponen, pero como se mencionó anteriormente, no son necesarios aquí.