¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?

Si te entiendo correctamente, el problema es que necesitas un sistema que ‘entienda’ que 0 y 359 grados están cerca y que pueden generalizarse e interpolarse en consecuencia. Puede lograr esto transformando el ángel thetta en dos nuevas entradas: sin (thetta) y cos (thetta). Si traza sus puntos de datos con estos dos como el eje xey, verá que los puntos de datos se encuentran en un círculo y que los puntos con thetta = 0 y 359 están tan cerca como geométricamente.

Como explica Tudor Achim, puede usar cualquier núcleo. No es necesario que el hiperplano siga la curva del círculo. Puede intersecar el interior del círculo de la forma que desee porque no hay puntos de datos allí. Todos están en el círculo.

¡Fácil!

¿Qué tan bien funcionará una GTX 1060 en Windows para el aprendizaje profundo?

¿Cuál es la diferencia entre un conjunto de datos y una característica?

¿Un doctorado en aprendizaje automático centrado en un tema que no sea el aprendizaje profundo seguirá siendo comercializable (en la industria) en 2020?

¿Puede un ingeniero eléctrico seguir una carrera en aprendizaje automático en el futuro?

¿Es la inteligencia humana reducible al aprendizaje automático?

¿Existen aplicaciones reales de uso de Elastic Net?

Las dos respuestas anteriores funcionan si todos los aspectos positivos y negativos son contiguos como en el ejemplo de Roar Nybø. Sin embargo, si tiene una superficie de decisión más compleja como (0-45) es positiva, (45-90) es negativa, (90-135) es positiva, (135-180) es negativa, etc., entonces puede intentar cambiar su el vector de características sea completamente positivo (es decir, en lugar de -pi a pi, use 0 a 2 pi) y use el kernel mínimo (también llamado kernel de intersección de histograma)

Donde sea que use x dot y reemplace con sum_i min (x (i), y (i))

Si usa Java, voy a enviar un parche a Apache Mahout uno de estos días que hace esta clasificación mínima del núcleo. Alternativamente, puede aplicar el parche de refuerzo ( https://issues.apache.org/jira/b …) que debería funcionar con cualquier característica no lineal. Los tocones de decisión básicamente transforman su espacio de características en un grupo de hipótesis binarias y luego aplican la regresión logística en el espacio de hipótesis.

Tudor Achim

Supongo que la pregunta se refiere a un espacio de características bidimensionales, en el que los datos para cada clase se pueden dibujar aproximadamente en el límite de un círculo en el plano. Si este es el caso, entonces el núcleo no importa siempre que sea polinomial: el mejor separador con respecto al criterio de margen máximo será una línea (un hiperplano en dimensiones más altas), que se encuentra por un lineal SVM.

No tengo la intuición de lo que generaría un núcleo RBF en estos datos si los círculos se superponen, pero como se mencionó anteriormente, no son necesarios aquí.

Tudor Achim

More Interesting

¿Hasta dónde nos pueden llevar las redes neuronales / de aprendizaje profundo / IA para encontrar una solución al problema de las noticias falsas?

OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?

Cómo aplicar en la práctica PCA a la agrupación de trayectorias

Además de TensorFlow, ¿qué otras bibliotecas de reconocimiento de imágenes son fáciles de usar y mejores?

¿Qué es el aprendizaje automático basado en modelos?

¿Tiene sentido emplear Bayes ingenuos multinomiales con n-gramos? Pregunto porque supone que cada posición está ocupada por un término, por lo que los n-gramos no parecen encajar naturalmente en el modelo.

¿Por qué hay tantas redes de aprendizaje profundo?

Cómo aplicar ConvNet en el análisis de sentimientos

¿En qué condiciones funcionaría un algoritmo lento más rápido que un algoritmo rápido?

Ingeniero de Aprendizaje Automático de Udacity Nanodegree: ¿Dónde están los proyectos?