¿Es posible entrenar una red neuronal para maximizar una función de probabilidad diferente de la entropía cruzada y el error al cuadrado?

Si. Piense en NN como una función con parámetros de peso ‘w’ que necesita ajustar para minimizar el costo o maximizar la utilidad. En este marco, puede conectar funciones de costo complejas arbitrarias y desglosar su optimizador más adecuado para resolverlo.

Cuando la función de costo no tiene propiedades “agradables” con respecto a “w”, puede limitarse a métodos que puedan manejarlas (evolución diferencial, enjambre de partículas, …). De lo contrario, el algoritmo de retropropagación es una forma muy eficiente de calcular primero los gradientes, en caso de espacio de parámetros de modelo pequeño, o de segundo orden. Los métodos de subgradiente son para casos en los que la derivada no está definida en todas partes.

A menudo, analizar la superficie de error puede ayudarlo a realizar los ajustes necesarios que conducen a una solución aceptable.

Espero eso ayude

More Interesting

¿Se puede usar IT / AI para rastrear toda la información sobre armas y propietarios de armas?

¿Se volverán obsoletos los científicos de datos con el surgimiento de la IA en términos de codificación, estadísticas, aprendizaje automático, gestión de bases de datos y técnicas de visualización?

¿Son los robots humanoides, o autos autónomos, solo una colección de componentes robóticos ensamblados?

¿Hay publicaciones sobre la generación automática de video a partir de texto plano y viceversa?

¿La proliferación de IA asequible diezmará a la clase media?

¿Alguien ha creado un motor de inferencia sensoriomotor generalizado antes?

¿Cómo comenzar a aprender el aprendizaje automático? ¿Cuál es la hoja de ruta?

Si la mayoría de los humanos quedarán desempleados debido a que los robots / ai se harán cargo de los trabajos, entonces, ¿cómo el poder adquisitivo reducido mantendrá el motor económico en funcionamiento?

Si utilizáramos el aprendizaje automático para operar los semáforos y el tráfico de los EE. UU. En las principales ciudades, ¿cuánto mejoraría eso la vida diaria?

¿Cómo construirías un robot para responder preguntas sobre Quora?

¿Cuáles son los principios del procesamiento del lenguaje natural del resumen automático? ¿Cuáles son los mejores recursos? ¿Cuántas bases tengo que hacer en PNL para lograr esto? ¿Y qué partes de las teorías de PNL / PC son importantes para construir tal sistema?

¿Cuál es la función de paso de unidad en la red neuronal artificial?

¿Cuán relevantes son los temas de la web semántica y la recuperación de información para el aprendizaje automático?

¿Cuáles son las diferencias clave entre el aprendizaje del programa bayesiano y el aprendizaje profundo?

¿Es mejor codificar un chatbot usted mismo o usar un servicio como Hyphen AI?