Matemáticamente, ¿cómo afecta la temperatura (como en el hiperparámetro, no la temperatura física) a las predicciones de una red neuronal? Ver comentario a continuación.

La temperatura es un concepto bastante general y puede ser una idea útil para el entrenamiento, la predicción y el muestreo. Básicamente, cuanto más alta es la temperatura, más poco probable se explorarán las cosas, cuanto más baja sea la temperatura, más nos aferramos al mundo lineal más probable. Douglas Adams lo explicó bien en la Guía del autoestopista galáctico: el Infinity Improbability Drive tiene una temperatura muy alta, Arthur Dent tiene una temperatura muy baja.

De todos modos, el enlace que proporciona tiene que ver con el muestreo y la generación de texto. El algoritmo de generación es: pedir una distribución de probabilidad para el siguiente personaje, elegir un personaje de eso, imprimirlo, volver a introducir el personaje en el modelo y repetir. Aquí está su malentendido: no elegimos el carácter de mayor probabilidad, tomamos muestras de la distribución.

Si softmax (V / T) está generando la siguiente probabilidad de carácter, donde V es la salida de nuestro modelo y T es ruido, entonces una T muy grande significa que elegimos un próximo carácter aleatorio, mientras que T cerca de 0 significa que siempre elegimos el carácter más probable . Tenga en cuenta que V / T se parece mucho a un número de señal a ruido.

Aprendizaje automáticoInteligencia ArtificialRedes neuronales artificialesRedes neuronales recurrentesTermodinámica

Related Content

¿Cómo puede un estudiante promedio llegar a Andrew Ng para ser un discípulo suyo?

¿Por qué los personajes robóticos tienden a abrir mucho los ojos para crear efectos artificiales o robóticos?

¿Qué nivel de sofisticación matemática / estadística se espera de una persona que comienza en el campo de la ciencia de datos?

¿Cuáles son las mejores plataformas y recursos para construir chatbots?

¿Qué puede salir mal con la economía bot emergente?

¿Puedo estudiar ingeniería informática después de estudiar biología y matemáticas después de la clase 10?

Si alguien hizo el código para un AGI a nivel humano disponible en Internet en este momento (en 2017) que se ejecutó en una sola PC de escritorio, ¿cómo afectaría eso al mundo?

A menos que la red esté a) implementada en hardware o b) la temperatura sea lo suficientemente alta o baja como para derretir o congelar físicamente la computadora en la que se ejecuta la red, la temperatura física no tiene ningún efecto sobre la funcionalidad de una red neuronal

Michael Naunton

More Interesting

¿Cómo se puede utilizar el aprendizaje profundo para la seguridad informática?

¿Pueden los modelos supervisados de aprendizaje automático aprender características de los datos de entrenamiento?

¿Se ha aplicado AI / machine learning en Conway's Game of Life?

¿Cuál es su opinión sobre el cierre de Facebook del experimento de chatbot basado en IA después de crear su propio idioma?

¿Es Google un ejemplo de inteligencia artificial?

¿Qué aplicaciones se pueden construir con TensorFlow en el futuro?

Cómo hacer una IA que pueda jugar un juego simple como Mario o Pokemon

Cómo usar mi software de reconocimiento de objetos para ayudar a otros

¿Cómo se puede usar la IA en campañas políticas?

¿Es Java un mal lenguaje para aprender IA?

¿Qué técnicas de PNL se utilizan para mapear las diferentes variaciones de la misma pregunta a una respuesta?

¿Qué es exactamente un robot holonómico y cómo se diferencia de los no holonómicos?

¿Por qué maximizar las expectativas? ¿Por qué distinguir entre variables latentes y parámetros del modelo?

¿Qué productos de IA existen hoy para optimizar y agilizar los procesos comerciales?

¿Tendremos inteligencia artificial de alto nivel para 2100?

Web Analytics