Gracias por A2A.
Es similar al aprendizaje de algoritmos de aprendizaje de un solo núcleo. Si está familiarizado con la necesidad de las funciones del núcleo: en una tarea de clasificación / agrupación o regresión, cuando se utiliza un espacio lineal para representar los datos, el modelo aprendido supone que los datos son linealmente separables. Si los datos no son linealmente separables, el modelo aprendido es muy pobre. Las funciones del kernel, que esencialmente calculan la métrica de similitud entre los puntos de datos, pero al proyectarlas en un espacio dimensional más alto (para permitir la perspectiva de la inclusión no lineal y una mejor separabilidad lineal), se utilizan para abordar este problema. Ahora, la pregunta es, ya que los puntos de datos generalmente pueden deberse a múltiples fuentes heterogéneas:
1. ¿Qué núcleo usar? (por ejemplo, RBF vs. polinomio)
2. ¿Qué parámetros del kernel elegir y cómo? (por ejemplo, si el núcleo polinomial, de qué grado …)
Una posible solución es utilizar el aprendizaje de múltiples núcleos (MKL). MKL es conceptualmente igual que un solo núcleo. En otras palabras, el aprendizaje de un solo núcleo es un caso especial de aprendizaje de múltiples núcleos. En MKL, el núcleo final se aprende como una combinación (lineal en algunos casos) de muchos núcleos base de los datos en sí. Si la combinación de núcleos no es lineal, se denomina GMKL. Algunos recursos que pueden ser útiles:
1. Página en ics.aalto.fi
2. Página en djvuzone.org
- ¿Qué habilidades de programación / habilidades informáticas debo aprender si quiero especializarme en visión por computadora y aprendizaje automático?
- ¿Se utiliza R en la minería de datos a gran escala en grandes compañías de software como Facebook y LinkedIn?
- ¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?
- ¿Qué harás cuando entrenes a tu modelo?
- ¿Qué hace una capa convolucional 1 × 1?
Si los siguientes materiales parecen demasiado extraños para comprender, domine el aprendizaje de un solo núcleo, especialmente. la parte de optimización: por lo general, esta es la parte que saca a muchos de la pista. Una vez hecho esto, MKL es muy sencillo.