¿Qué significa la función de pérdida híbrida cuando se desarrolla una red neuronal?

Bien, hablemos primero de la función de pérdida . Los algoritmos de aprendizaje profundo generalmente intentan optimizar (minimizar o maximizar) alguna función, denominada “función objetivo” para realizar una determinada tarea. Cuando usamos el término “minimización”, llamamos a esta función la “función de pérdida”, porque queremos minimizar la pérdida (es decir, el costo para lograr un objetivo). Por ejemplo, en una tarea de clasificación, el objetivo es mejorar la precisión de la predicción y la función de pérdida representa esencialmente el costo de las predicciones inexactas.

Ahora, si tiene múltiples objetivos para lograr una tarea determinada, puede tener múltiples funciones de pérdida o una combinación de ellas (llamada función de pérdida híbrida ) que tal vez desee optimizar. Creo que te estás refiriendo a este documento: http://www.aclweb.org/anthology/…. Aquí, verá en la Sección 2.1 que hay dos objetivos de capacitación para su tarea: “1) el n-gramo original debe obtener una puntuación más alta en el modelo de lenguaje que el n-gramo dañado, y (2) la puntuación del sentimiento de n original -gram debería ser más consistente con la anotación de polaridad dorada de la oración que el n-gram corrupto. por lo tanto, combinan dos funciones de pérdida de bisagra separadas (para optimizar la pérdida sintáctica y la pérdida de sentimiento) y crean una función de pérdida híbrida.

¡Espero que esto responda a su pregunta! Para obtener más detalles sobre las funciones de pérdida y sus optimizaciones, sugeriría leer la Sección 4.3 de este libro: http://www.deeplearningbook.org/….

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

Related Content

¿Por qué el enfoque bayesiano es más popular hoy en día que Fuzzy Logic?

¿Las máquinas automatizadas inteligentes más eficientes y económicamente eficientes contribuyen a la creciente desigualdad de la riqueza, el estancamiento salarial y las recuperaciones sin empleo?

¿Cómo podemos evitar el secuestro de IA de alto nivel por parte de delincuentes? ¿Cómo podrían usarlo contra el mundo?

¿Podríamos decir que Cortana es una inteligencia artificial?

¿Debo hacer ACM ICPC o aprender inteligencia artificial?

¿Por qué la memoria en las redes neuronales no está contenida en los nodos individuales de cada red neuronal?

¿Debo aprender el aprendizaje automático (supervisado) antes del aprendizaje profundo (sin supervisión)? Solo tengo una computadora portátil en casa, entonces, ¿será suficiente la potencia informática?

Una función de pérdida híbrida es simplemente una función de pérdida compuesta por dos o más funciones de pérdida diferentes. Por ejemplo, considere la función de pérdida híbrida hipotética como se muestra a continuación.

[matemáticas] pérdida = \ alpha_ {1} pérdida_1 + \ alpha_ {2} pérdida_2 +… + \ alpha_ {n} pérdida_ {n} [/ matemáticas]

Por supuesto, en realidad [matemáticas] n [/ matemáticas] es muy pequeño, normalmente:

[matemáticas] 1 \ leq n \ leq 2 [/ matemáticas]

Los [math] \ alpha [/ math] son los pesos de equilibrio con [math] \ alpha_1 [/ math] = 1.

Encontrará tales pérdidas híbridas en, digamos, detección de objetos con regresión de cuadro delimitador. La pérdida en ese caso necesita una función de pérdida secundaria para la parte de reconocimiento y otra función de pérdida secundaria para la regresión del cuadro delimitador.

La función de pérdida híbrida está optimizada como una función de pérdida ordinaria, no tiene nada de especial.

Espero que esto ayude.

Phillip Adkins

Significa que la red genera 2 o más predicciones en lugar de solo 1. Cada una de estas predicciones tiene su propia pérdida. Los gradientes de todas estas pérdidas se propagan a través de la red.

Chomba Bupe

More Interesting

¿Cuántas matemáticas usas en tu trabajo de aprendizaje automático?

¿Cuáles son todos los trabajos de investigación que han estudiado la superficie de pérdida de las redes neuronales?

¿Cómo se puede usar la IA en campañas políticas?

¿Quién estaba en el equipo que desarrolló la IA de 'Eugene Goostman'?

¿Qué tan débil puede ser la IA antes de que no sea IA?

¿Pueden los submarinos nadar?

¿Qué tipo de IA es la computadora esposa de plancton en Bob Esponja?

Cuando la gente dice que la teoría de la red neuronal artificial es incompleta, ¿qué quieren decir?

¿Qué posibilidades hay de que los robots de ancianos cuiden en el futuro cercano?

¿Podemos usar el algoritmo de aprendizaje de refuerzo Q-learning para hacer frente a los nuevos estados del entorno creados?

¿Cómo será la progresión natural del aprendizaje automático? ¿Qué industrias tendrá más aplicaciones?

¿Qué sucederá desde un punto de vista científico si dejamos que la IA altere el genoma humano?

¿Dónde puedo encontrar excelentes bibliotecas de aprendizaje automático para Python?

¿Cuál sería la forma más rápida y fácil de hacer una API de reconocimiento de oraciones utilizando una red neuronal?

Si la IA tiene la capacidad de dominar el mundo, ¿por qué la estamos desarrollando?

Web Analytics