¿Qué es la optimización de colonias de hormigas y cómo funciona en términos simples?

Las ideas se basan en una colonia de hormigas (de ahí el nombre). Al principio, las hormigas no tienen idea de dónde está la comida, por lo que corren en todas direcciones. Eventualmente, algunas hormigas tropiezan con cierta cantidad de comida y la traen de vuelta a casa. Deja un rastro de pheremone en el proceso que indica a otras hormigas que hay comida allí. Este sendero de pheremone hace que otras hormigas tengan más probabilidades de seguir esa ruta, donde también encontrarán comida, la arrastrarán de regreso a la colonia y reforzarán el sendero, causando que incluso más hormigas bajen por esa ruta …

Para el aprendizaje automático, haces algo similar. Usted crea muchos agentes con diferentes enfoques, y ellos comunicarán su éxito a los otros agentes, haciendo que esos agentes sean más propensos a probar un enfoque similar. Esencialmente, le permite probar una amplia franja del posible espacio de respuesta para sentirlo, y luego enfocarse en las áreas más prometedoras que encuentre.