¿Existe una manera matemáticamente definida de fusionar dos redes neuronales en una sola de dimensiones iguales?

Supongo que “Y1 + Y2” significa una salida Y con el doble de unidades, no que las unidades Y1 e Y2 se agreguen literalmente entre sí.

Suponga que las matrices de peso originales son A y B, donde A asigna X a las unidades ocultas H y B asigna las unidades ocultas a Y. Entonces, la red completa es X – (A) -> H – (B) -> Y, donde “- (A) ->” es un intento de dibujar una flecha “->” con la etiqueta de matriz de peso A superpuesta. O para la red n. ° 1, X1 – (A1) -> H1 – (B1) -> Y1.

La matriz de peso combinada podría definirse como pesos para mapear X en unidades ocultas H1 y H2, y luego pesos para mapear H1 en Y1 y H2 en Y2, donde la salida final Y es la concatenación de los vectores Y1 e Y2.

La red (donde “;” significa concatenación vertical de los vectores o matrices):

X = X
H = [H1; H2]
Y = [Y1; Y2]

Los pesos:

A = [A1; A2]
B = [B1 0; 0 B2]

La única parte difícil es la segunda matriz de peso B, donde todos los pesos H1 se ignoran al calcular Y2 y todos los pesos H2 se ignoran al calcular Y1 (de ahí los ceros en la matriz).

Tenga en cuenta que una vez que se inicia el entrenamiento en la nueva red, las unidades ocultas de H1 y H2 comenzarán a mezclarse y “trabajarán juntas” para mapear X en Y. Como resultado, los ceros en B no permanecerán cero por mucho tiempo.

Related Content

¿Se desplegarán eventualmente robots militares humanoides en el conflicto israelo-palestino para reprimir la actividad militar de ambos lados?

¿Cuántas entradas de ejemplos se necesitan para entrenar una red neuronal? ¿Son los valores p un buen indicador relevante?

¿Los analistas / asesores financieros serán reemplazados por robots e IA en los años 2020 o 2030? ¿Cuáles serán los pros / contras?

¿Elegirías el procesamiento de señales digitales o la inteligencia artificial como una opción en la universidad?

¿Pueden las tareas de inferencia de aprendizaje automático en los centros de datos generalmente hacerse paralelas?

¿Cuáles son algunos trucos alucinantes que la mayoría de la gente no conoce?

En una red neuronal de reconocimiento facial, ¿cuántos nodos separados se necesitan en el nodo final del lado de salida (para la clasificación facial)?

Puede, pero no creo que gane nada a menos que combine dos entrenados en el mismo conjunto de entrenamiento y use sus resultados para el consenso.

Por supuesto, si realizan tareas bien definidas, entonces se pueden combinar de manera similar a los circuitos y subrutinas de programas.

¿Cómo funciona la propagación hacia atrás en una red neuronal siamesa?

Paul King

More Interesting

¿Cuáles son algunas de las funciones de entrada de aprendizaje automático para la detección de objetos?

¿Qué hacen los algoritmos de regresión simbólica y cómo se usan en la práctica?

¿Qué tema de investigación es desafiante para un proyecto senior en neuropsicología o psicología del razonamiento?

¿Por qué Python se considera un buen lenguaje para IA y Machine Learning?

¿Cuáles son algunos de los problemas abiertos bien definidos en IA, robótica y ML?

¿Cómo reaccionan los nigerianos ante la tecnología moderna?

¿Necesitas ser extremadamente talentoso en matemáticas para convertirte en un científico de IA?

¿Cómo cambiará el desarrollo de la IA el mercado laboral en el futuro?

¿Cuáles son algunos casos cotidianos que se pueden resolver mediante aprendizaje automático / ciencia de datos / IA?

¿Cómo impactará el aprendizaje automático, la IA y la minería de datos en el futuro?

¿Tesla superará a Google y Facebook en IA?

¿De dónde viene la idea de IA peligrosa?

¿Por qué los liberales piensan que saben lo que es mejor para los empobrecidos, mejor que los pobres?

¿Qué robot humanoide tiene el mejor soporte de comunidad / foro disponible, en el contexto de la investigación sobre robots sociales?

Cómo hacer que las computadoras entiendan un párrafo de texto, usando Machine Learning

Web Analytics