Cada iteración es una actualización de gradiente, seguida de una actualización de proyección (ortogonal).
Aquí, [math] g_t [/ math] es un gradiente de la función de costo, [math] \ eta [/ math] es el tamaño del paso (constante, elegido mediante la búsqueda de línea, etc.). Da un paso en la dirección del gradiente, con una longitud igual a eta. Esto te pone en [math] x_t – \ eta g_t [/ math]. Una vez que haya hecho esto, verificará si todavía está en el conjunto de restricciones, [math] \ mathcal {X} [/ math]. Si no, encuentra el punto más cercano en ese conjunto y se retira a él. El argmin representa este último procedimiento.
También puede darse el caso de que [matemática] \ eta [/ matemática] se elija con el conocimiento de que una proyección está por venir. En este caso, elige [matemática] \ eta [/ matemática] para optimizar el objetivo después de la proyección, en lugar del objetivo anterior.
- ¿A qué grupo de clasificadores pertenece el MulticlassClassifier que se usa en Weka?
- ¿Qué tan lejos estamos de usar el reconocimiento de voz como interfaz de usuario en un teléfono para cerca del 100% de todas las funciones (sin entradas de teclado o deslizamiento)?
- ¿Para qué sirve el aprendizaje automático?
- ¿Cómo descifrar cualquier entrevista de aprendizaje automático? ¿Qué tipo de preguntas debo esperar? Qué tipos de proyectos paralelos relevantes se verían bien en un CV
- ¿Somos mejores que las máquinas que creamos?