Puede incrustar parámetros como canales adicionales ( concatenar ) O puede agregar las incrustaciones a sus mapas de características.
La primera opción es común cuando diseña GAN y la segunda se usó para condicionar WaveNet en la identidad del orador.
Deberá tener un vector de incrustación de tamaño N (en realidad 1x1xN para datos 2D) que se compartiría en todos los puntos espaciales para el acondicionamiento global. Entonces solo tienes que repetirlo y agregar / concatenar.
- ¿El aprendizaje automático es un tema torpe?
- Cómo calcular un puntaje usando la prueba de relación de distancia al vecino más cercano en MATLAB
- ¿Cuál es la diferencia entre el algoritmo LBG y K significa agrupación?
- ¿Se usa el álgebra abstracta en el aprendizaje automático?
- ¿Cuáles son algunos ejemplos reales de modelos estadísticos que son pobres en la predicción pero útiles para la inferencia?
Entonces tendrás que descubrir:
- Donde deberías incrustarlo. Entre las primeras capas requeriría más memoria de GPU para almacenar tensores más grandes.
- Donde exactamente debe insertarlo: antes o después de la activación / agrupación / convolución.
- Incrustación de tamaño de vector. Debería ser comparable al número original de canales si construye GAN, o, obviamente, lo mismo si va con la adición.