No existe una regla general para seleccionar la tasa de aprendizaje, porque generalmente depende del gradiente de error.
Aunque hay algunas formas de actualizar la tasa de aprendizaje a través de iteraciones que pueden mejorar el rendimiento. En los criterios de perceptrón, la regla de actualización de la tasa de aprendizaje generalmente depende del derivado del gradiente de error. Por lo tanto, donde el gradiente de la función de error es más, tomamos pasos más largos allí y donde el gradiente de error es menor, tomamos menos pasos allí. Esto nos ayuda a alcanzar los mínimos locales más rápido. Pero este método no garantiza aterrizar en mínimos globales.
El conjunto de datos también juega un papel importante en la elección de la tasa de aprendizaje. Si los conjuntos de datos son similares, entonces la tasa de aprendizaje se elige como baja y si hay una gran variación en los conjuntos de datos, entonces la tasa de aprendizaje se elige como poco alta, otro factor puede ser cómo se ve la función de error (si los datos son menores que 3D) y muchos otros factores.
- ¿La IA está impulsando los mercados financieros?
- ¿Cómo crearías una IA que pueda pasar por alto la verificación de Google "No soy un robot"?
- ¿Terminará este 'boom' de programación algún día? ¿La programación algún día será automática?
- Cómo planificar una trayectoria en robots teniendo en cuenta múltiples restricciones como tirón, aceleración, velocidad
- ¿Están vivos los droides en Star Wars?
Elegir la tasa de aprendizaje es un trabajo difícil, e incluso el experimentado investigador de aprendizaje automático no lo hace bien todo el tiempo.