¿Qué núcleo (para los métodos de núcleo en el aprendizaje automático) es menos sensible a la alta dimensión: cauchy, gaussiana o laplaciana?

Recuerde la formulación de estos tres granos:

Gaussiano [matemáticas] K (x, y) = exp (- \ frac {|| xy || ^ 2} {2 \ sigma ^ 2}) [/ matemáticas]
Laplaciano [matemática] K (x, y) = exp (- \ beta | xy |) [/ matemática]
Cauchy [matemáticas] K (x, y) = \ frac {1} {1+ \ frac {|| xy || ^ 2} {\ sigma}} [/ matemáticas]

Dado que los tres usan el llamado truco del núcleo, no se calcula la asignación de características real y solo la asignación de características implícita (es decir, [matemática] K (x, y) = \ Phi (x) ^ T * \ Phi (x) [/ matemática ] se calcula.

Entonces, en mi humilde opinión, son inmunes al problema de la alta dimensionalidad de su conjunto de datos (si se refiere a la dimensión en cuanto al número de características en su conjunto de datos). En otras palabras, estos tres núcleos son insensibles a la alta dimensión de las “características”.

Dicho esto, la matriz de su núcleo será grande si el número de observación es grande (ya que el tamaño de su núcleo es #obsns por #obsns).

Aprendizaje automáticoMáquinas de vectores de soporteModelos de procesos gaussianos

Related Content

¿Cuál es el método para encontrar la parte no reconocida de los resultados del aprendizaje automático y complementarla para alcanzar el 100%?

¿Hay alguna forma de implementar TSVM usando bibliotecas SVM?

¿Por qué se utiliza un descenso gradiente iterativo para redes neuronales y no inmediato?

¿A qué áreas de investigación y aplicaciones se aplica con éxito el aprendizaje automático bayesiano?

Dada una lista de codificadores y sus respectivos conjuntos de fragmentos de código, ¿es posible inferir a partir de un fragmento de código nuevo dado el codificador original?

¿Cómo funciona una conversión de RJ45 a RJ11?

¿Cuál es la correlación entre PNL, IA, aprendizaje automático, big data y ciencia de datos? ¿Existe una jerarquía o algo en común entre estos? ¿Cómo se relacionan estos problemas con el mundo real?

More Interesting

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Cómo se pueden utilizar los autoencoders apilados para preentrenar una red neuronal que tiene más neuronas en las capas ocultas que entradas? es posible?

¿Cuáles son las aplicaciones de los gráficos dispersos?

Cómo interpretar los resultados de agrupación de k-means

¿Cuál es la relación entre relevancia y aprendizaje automático?

Cómo elegir un algoritmo de aprendizaje automático

¿Cómo puedo comenzar a usar métodos de "generalización apilada" en Python para las competencias de Kaggle?

Cómo ingresar a un laboratorio superior de aprendizaje automático o de visión por computadora como erudito visitante

¿Cuáles son los mejores métodos de detección de anomalías para imágenes?

¿Cuál es la diferencia entre Python y el aprendizaje automático?

¿Cuál es la diferencia entre AODE y una red bayesiana?

¿Cuáles son las definiciones de entrada, salida y destino en el aprendizaje automático?

¿Cuáles son las mejores prácticas en torno al aprendizaje automático y los sistemas de recomendación para sitios de trabajo?

¿Qué debo elegir para mi tesis en Machine Learning?

Teoría de la complejidad computacional: ¿Qué es un problema NP difícil?

Web Analytics