En una red neuronal (sin saber si es específica para keras), ¿cuál es la diferencia entre el tamaño del lote y el entrenamiento del lote? ¿Cuándo necesitaría ambos?

El entrenamiento por lotes (o entrenamiento de mini lotes) es una técnica para mejorar el descenso de gradiente estocástico. El tamaño del lote es un parámetro de la técnica de entrenamiento por lotes.

El descenso de gradiente de mini lotes calcula el gradiente de los parámetros con respecto a un lote de ejemplos muestreados aleatoriamente. Esto se compara con el SGD de vainilla que calcula el gradiente con respecto a un solo ejemplo, o el descenso del gradiente de vainilla que calcula el gradiente con respecto a todos los ejemplos.

Para resumir:

Descenso de gradiente : descenso de gradiente de mini lotes cuando tamaño de lote = [matemática] n [/ matemática]. Variación más baja en las actualizaciones de errores, pero lenta.
Descenso de gradiente estocástico : descenso de gradiente de mini lotes cuando el tamaño de lote = 1. La mayor variación en las actualizaciones de errores, pero rápido.
Descenso de gradiente de mini lotes : para valores de tamaño de lote [matemática] k [/ matemática] en [matemática] 1 <k <n [/ matemática]. Un buen equilibrio entre la variación de actualización de errores y el tiempo de entrenamiento.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

Related Content

¿Se acerca el segundo invierno de IA?

¿Cuáles son los principios del procesamiento del lenguaje natural del resumen automático? ¿Cuáles son los mejores recursos? ¿Cuántas bases tengo que hacer en PNL para lograr esto? ¿Y qué partes de las teorías de PNL / PC son importantes para construir tal sistema?

Cómo aprender a aplicar redes neuronales para la optimización

Estoy planeando obtener una maestría en CS con especialización en inteligencia artificial de buenas universidades de EE. UU. ¿Cómo escribo un SOP para eso?

¿Pueden las tareas de inferencia de aprendizaje automático en los centros de datos generalmente hacerse paralelas?

¿Por qué es tan difícil para las personas comprender el hecho de que existen diferentes tipos de redes neuronales?

¿Por qué se les enseña a los actores a no mirar directamente a las cámaras?

(Mini) entrenamiento por lotes es el proceso de entrenar su modelo en sus datos en fragmentos. Es más eficiente que entrenar el modelo una muestra a la vez. El tamaño del lote es el número de muestras que hay en cada fragmento durante el entrenamiento. No se puede tener uno sin el otro.

Suchin Gururangan

More Interesting

¿Cómo se hizo Wolfram Alpha? ¿Como funciona? ¿Cómo calcula el conocimiento no estructurado?

¿Cuánto de la canción escrita de AI 'Daddy's Car' es realmente el producto de AI?

¿Cuáles son los pros y los contras de la IA?

¿Cómo aprende una red neuronal? ¿Es por un algoritmo de propagación hacia atrás?

¿Qué tipo de IA es la computadora esposa de plancton en Bob Esponja?

En el aprendizaje automático, ¿cómo calcula qué tan buena es una característica binaria para predecir Y?

Cuando hacemos que la IA sea consciente y sienta que es un dolor de entrenamiento existente, ¿seremos torturadores?

¿Cuál es la mayor hazaña de inteligencia que una persona haya logrado?

¿Qué es la inteligencia artificial y cómo podemos programarla?

¿Cómo puede la inteligencia artificial estar bajo nuestro control?

Cómo convertirme en experto en IA en 3 años, actualmente solo puedo escribir programas de Python

¿Cuál es la relación entre inferencia y transmisión de mensajes en el contexto del aprendizaje automático?

¿Qué es una explicación intuitiva para las redes neuronales?

Rober Ambrogi: ¿Podría Watson de IBM hacer obsoletos a los testigos expertos?

¿Cómo se podría crear una IA de autoaprendizaje para un videojuego?

Web Analytics