¿Puedo obtener un resultado de una red neuronal en particular?

Si entiendo su pregunta correctamente, debe corregir la semilla del generador de números aleatorios . Aquí hay alguna explicación:

Esencialmente, el entrenamiento de la red neuronal (o el entrenamiento de muchos otros modelos de aprendizaje automático) implica algo de aleatoriedad, como mezclar aleatoriamente los puntos de datos y luego usar los datos barajados secuencialmente para SGD, inicializando los pesos de las capas al azar, etc. Ahora , los números aleatorios se generan en el software utilizando generadores de números pseudoaleatorios (PRNG); se denominan “pseudo” porque no son realmente aleatorios; usan un proceso determinista para generar los números que parecen aleatorios, pero si conoce el proceso determinista, puede predecir los siguientes números, a diferencia de los números aleatorios verdaderos.

Una explicación de muy alto nivel de PRNG es la siguiente: comienza con alguna entrada [matemática] x [/ matemática], llamada semilla, y genera el primer número aplicando alguna función [matemática] f [/ matemática] en [matemática] x [/ math], para obtener [math] f (x) [/ math]. Luego, aplica repetidamente una función [matemática] g [/ matemática] al número aleatorio anterior, obteniendo así una secuencia de números aleatorios [matemática] f (x) [/ matemática], [matemática] g (f (x)) [/ math], [math] g (g (f (x))) [/ math], etc. La razón por la que obtienes diferentes resultados en este momento es que [math] x [/ math] no está fijo por defecto, y varía de una carrera a otra. Sin embargo, puede corregir [matemáticas] x [/ matemáticas] al comienzo de su programa. (Simplemente busque en Google cómo establecer la semilla en el idioma que está utilizando).

Tenga en cuenta que después de corregir la semilla, obtendrá exactamente la misma salida cada vez que ejecute su programa en la misma máquina, utilizando la misma versión del compilador y versiones de la biblioteca (si está utilizando bibliotecas). Si cambia de máquina, o usa una versión diferente del compilador o las bibliotecas, puede obtener una respuesta diferente, porque [math] f [/ math] y [math] g [/ math] no están necesariamente arregladas en diferentes versiones, y pueden incluso dependerá del hardware.

Mucho depende de la ponderación inicial. Como siempre es aleatorio si usa un descenso de gradiente normal o un descenso de gradiente estocástico, seguramente obtendrá resultados diferentes todo el tiempo.

No puedes El descenso de gradiente estocástico es, como su nombre lo indica, estocástico.

More Interesting

¿La proliferación de IA asequible diezmará a la clase media?

Cómo crear una IA como EDI de Mass Effect con el cuerpo de 3

¿La inteligencia artificial es solo aceite de serpiente?

¿Existe un buen libro que cubra todo lo que necesita saber para el desarrollo de IA?

¿Cuál sería un área excelente y sin explotar para que un ingeniero de IA inicie una empresa?

¿Se pueden combinar sistemas expertos?

¿Por qué Google está invirtiendo tanto en IA y, sin embargo, Google Translate parece avanzar muy lentamente?

¿En qué parte de mi red neuronal implemento la función de costo?

¿Por qué Apple no está invirtiendo en aprendizaje automático? Han tardado en actualizar Siri. ¿Hay alguna razón estratégica para esta aparente falta de interés de Apple? o se están quedando atrás en esta área?

¿Es el método de conjunto ampliamente utilizado en el campo de la industria? ¿En qué ocasión utilizamos el método de conjunto en el aprendizaje automático?

¿Qué es una inteligencia artificial de negocios?

¿Construir robots humanoides es una buena idea para el futuro de nuestra sociedad? ¿Deberíamos fabricar solo robots no humanoides con fines éticos y de paz?

¿Cuál es un área tecnológica para la que el aprendizaje automático sería perfecto, pero no está explotado?

¿Hay algún recurso sobre cómo integrar la inteligencia artificial en los complementos de WordPress?

¿Cuán informativo / útil es usar la extrapolación de hardware para predecir cuándo realmente surgirá un AGI?