¿Por qué la suma es una buena forma de combinar múltiples objetivos para entrenar una red neuronal? ¿Hay alternativas?

La suma es lo más simple que puede hacer con dos objetivos, de modo que maximizar (o minimizar) el objetivo combinado probablemente haga lo mismo con (al menos uno de) los subyacentes. En otras palabras, es como una disyunción (o), donde desea aumentar / disminuir cada objetivo por separado. También puede examinar cada uno de los objetivos y comprender fácilmente cómo cada uno contribuye a la suma. Tiene una ventaja adicional de que los gradientes resultantes se pueden calcular por separado para cada parte, lo cual es bastante eficiente.

En la práctica, por supuesto, es muy común no solo agregar los objetivos, sino también escalarlos con algún hiperparámetro, lo que representa la importancia que cree que tiene cada uno.

Por supuesto que hay alternativas, es prácticamente ilimitado lo que puedes hacer. Por ejemplo, si lo que busca es la conjunción, donde desea que todos los objetivos aumenten o disminuyan de forma correlacionada, puede usar el producto. Por supuesto, el producto es solo una suma en el espacio de registro nuevamente, por lo que no es muy diferente.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

Related Content

¿Cuáles son los proyectos de inteligencia artificial de código abierto más prometedores?

¿Por qué debería estar entusiasmado con los bots y chatbots y cuáles son algunos casos de uso fáciles de entender?

¿Hay algún marco de Python específico para AI, NLP o material relacionado con big data?

¿Por qué el entrenamiento con la unidad softmax en redes neuronales es manejable si la función de partición es intratable?

¿Cuáles son los principales candidatos actuales en el campo de la IA?

¿Qué es IPv5? ¿Quién lo usó y cuándo fue creado?

¿Hay alguna referencia para C # como la documentación de Java AI?

More Interesting

¿Qué puede salir mal con la economía bot emergente?

¿Quora usa inteligencia artificial para responder preguntas?

Cómo ser tan bueno como Ian Goodfellow en aprendizaje automático

¿Los sitios web necesitan un algoritmo de aprendizaje automático?

¿Se pueden usar los mismos datos para entrenar diferentes algoritmos de aprendizaje automático para un problema de clasificación binaria?

¿Qué opinas del desarrollo de la ética de los robots?

¿Cuáles son los mayores obstáculos para crear un AGI o incluso un ASI?

¿Los tamaños de kernel de capa maxpooling en CNN son generalmente más pequeños que los tamaños de kernel de capa convolucional? ¿Por qué?

¿Cómo se puede optimizar un sistema si la variable principal de la función objetivo se modela a través de un modelo de Machine Learning?

¿Cuáles son los avances actuales en inteligencia artificial?

¿Cuáles son las principales comunidades y sitios web para aprender sobre robótica?

¿El diseño gráfico estaría a salvo de la tendencia de la IA?

Inteligencia artificial: ¿Qué es la 'comprensión de video'?

¿Podrían las redes punto a punto seguir utilizándose para resolver problemas de IA?

Chip-wise es suficiente GPU, ¿o hay otras pilas de hardware que puedan competir?

Web Analytics