Gracias por el A2A.
La búsqueda de cuadrícula explora un espacio de parámetros de forma sistemática, pero solo busca puntos fijos. Es completamente posible que los puntos óptimos en este espacio no estén en el conjunto de puntos fijos que la búsqueda de cuadrícula observó. Creo que el artículo al que hizo referencia argumenta que la búsqueda en cuadrícula no es mejor que la búsqueda aleatoria, y que la búsqueda aleatoria tiene la misma probabilidad de encontrar un punto óptimo.
También para n hiperparámetros, si desea explorar 5 puntos para cada hiperparámetro, deberá ejecutar 5 ** n experimentos. Con la búsqueda aleatoria, puede limitarlo a cualquier número que sea factible para usted, y aún estar razonablemente seguro de que ha explorado el espacio del hiperparámetro “lo suficientemente bien”.
- ¿Cuál es el sistema operativo de computadora más seguro?
- ¿SQL alguna vez será desplazado por algo mejor?
- ¿Qué hago si Skype muestra "No se puede iniciar una videollamada"? ¿Intenta cerrar otros programas que podrían estar usando su cámara web?
- ¿Cómo compilar programas ARM7-LPC2148 en Linux? Qué cadena de herramientas se requiere y cuáles son los pasos para instalarla
- ¿Cuándo surgirá el anti-nube (almacenamiento local infinito ... vas a la nube solo para obtener información del sensor en tiempo real)?
Otro enfoque es hacer una búsqueda aleatoria junto con una función de aceptación que influye en la dirección de la búsqueda. Esto generalmente producirá mejores hiperparámetros que la cuadrícula o la búsqueda aleatoria. El único problema con eso es que el proceso es secuencial, a diferencia de la cuadrícula o la búsqueda aleatoria.
Editado el 28 de octubre de 2017 : Gracias a George Brova por señalar algunas cosas (ver comentarios) que debería haber llamado explícitamente en mi respuesta: la búsqueda aleatoria explora el espacio del hiperparámetro de manera más eficiente que la búsqueda de cuadrícula (la Figura 1 en el documento le indica por qué), y en la práctica tiene un presupuesto de evaluación limitado, por lo que es probable que el mismo número de ejecuciones con la búsqueda aleatoria produzca un mejor conjunto de parámetros que el mismo número de ejecuciones con la búsqueda de cuadrícula. Observe también la respuesta de George Brova a ¿Por qué la búsqueda aleatoria es mejor que la búsqueda de cuadrícula para la optimización de hiperparámetros?