¿Qué es una explicación intuitiva de la búsqueda A *?

Otros carteles respondieron esto en comparación con Dijkstra, por lo que intentaré una perspectiva diferente: comparar con la búsqueda de amplitud y profundidad.

La búsqueda en profundidad primero es como resolver un rompecabezas de laberinto: recorres un camino lo más lejos que puedes, luego, una vez que llegas a un callejón sin salida, vuelves a la última bifurcación e intentas el otro camino, y así sucesivamente; y retrocede repetidamente y prueba otras horquillas, hasta llegar a la meta. En términos de implementación, es un recorrido de gráficos utilizando una estructura de datos de pila para mantener los nodos por los que hemos caminado y que aún no hemos explorado.

La búsqueda de amplitud primero , en comparación, es como dar vueltas en anillos desde su punto de partida, hasta que finalmente llega a la meta. En términos de implementación, es un recorrido de gráficos utilizando una estructura de datos de cola para realizar un seguimiento de los nodos que hemos recorrido, pero que aún no hemos explorado.

Ahora, ambos algoritmos suponen que la búsqueda es ciega, y esencialmente tropiezas hasta que encuentras el objetivo. Pero, ¿qué pasaría si pudieras ver dónde está el objetivo y si estás caminando en la dirección correcta?

Un * algoritmo hace exactamente eso. Es como una búsqueda de amplitud, pero con un ajuste o dos: utiliza una estructura de datos de cola prioritaria , que empuja a los nodos al frente de la cola en función de lo cerca que se estima que están para el objetivo. En efecto, es como ir directamente hacia la meta y, si llegas a un obstáculo, explorar otros nodos en la misma dirección general para volver a la pista.

La principal diferencia de A * sobre BFS está en 1) usar la cola de prioridad y 2) tener una buena función que estima la distancia de cualquier nodo al objetivo. Si la función es “optimista” (es decir, subestima la distancia real), A * produce el camino más corto hacia la meta. Si la función es “pesimista” (es decir, sobreestima la distancia real), A * se dirige hacia la meta de manera más agresiva en lugar de explorar otros nodos, por lo que podría hacer menos trabajo pero producir caminos subóptimos. A * con una función de distancia pesimista a menudo se usa en juegos donde el tiempo de ejecución es muy importante, y las rutas óptimas no lo son tanto.

¿Qué es la robótica?

¿Qué es una lista de experimentos mentales con IA?

¿Pueden las sociedades ser redes neuronales donde las personas individuales son nodos?

¿Podría la inteligencia artificial crear los primeros cuatrillonarios?

¿De dónde provienen los datos de entrenamiento para analizar las consultas en inglés en un árbol para Facebook GraphSearch?

¿El recocido simulado y la optimización de colonias de hormigas cuentan como aprendizaje automático?

Imagínese en una ciudad como Chicago o Nueva York, con distintas cuadras de la ciudad, algunos edificios muy altos, pero por lo demás una geografía plana. De hecho, Taipei funcionaría mejor.

El desafío : debes llegar del punto A (ubicación actual) al punto B (la torre Taipei 101) lo más rápido posible, pero solo puedes caminar a una velocidad constante. Por lo tanto, se trata de encontrar una ruta más corta (una de varias posibles, o potencialmente una ruta única). No tiene un mapa, y ni siquiera tiene la dirección del punto B, pero una vez que esté allí, reconocerá la torre porque es muy única. Además, tiene un recuerdo perfecto del área que ha visitado desde el comienzo de su búsqueda.

Una solución simple : explore el área alrededor de su ubicación actual, expandiéndose gradualmente en todas las direcciones. Esto corresponde a Breadth-First Search en gráficos no ponderados y la búsqueda de la ruta más corta de una sola fuente (SSSP) de Dijkstra en gráficos ponderados . En particular, uno mantiene una lista de nuevas ubicaciones accesibles en un paso (una cuadra de la ciudad) desde cualquier (alguna) ubicación visitada, y selecciona repetidamente una ubicación que proporcionará una ruta más corta desde la fuente (comparando las longitudes de ruta con diferentes potenciales nuevos ubicaciones). Después de seleccionar una ubicación, las prioridades de las ubicaciones adyacentes deben actualizarse. Para cuando se alcance el punto B, la búsqueda habrá explorado una gran cantidad de áreas innecesarias, incluso en la dirección alejada de B. Entonces, ¿cómo se evita perder el tiempo en la búsqueda?

Información clave : si el edificio alto en el punto B se puede ver desde su ubicación inicial (punto A), entonces la búsqueda puede avanzar hacia el punto B, explorando otras direcciones solo lo necesario para posibles desvíos.

Detalles : el problema es que las manzanas de la ciudad no te permitirán moverte en línea recta. Entonces, A * -search es una pequeña modificación del algoritmo de Dijkstra que agrega algo a la prioridad utilizada para dar el siguiente paso. Específicamente, puede agregar la distancia en línea recta desde la próxima ubicación potencial a la meta (punto B). Se demuestra un teorema que garantiza la búsqueda de caminos más cortos si el término agregado no es mayor que la distancia más corta real (por ejemplo, puede ser la mitad de la distancia). Este término se llama función admisible . La suma de la longitud del camino hasta ahora (A-> X) y la función admisible para su punto final intermedio (X-> B) no excede la longitud real del camino (A-> X-> B) e incluso la longitud del camino más corto (A-> B).

Para resumir , desde la perspectiva de la implementación, A * -search es solo el algoritmo de ruta más corta de Dijkstra con un pequeño ajuste. Se puede aplicar en gráficos explícitos en, por ejemplo, juegos de computadora y navegación basada en GPS. Aún más efectivamente, puede conducir a una aceleración exponencial en gráficos implícitos . Por ejemplo, si desea resolver el rompecabezas de 15, A * -search es el camino a seguir. Una buena función admisible sería la suma de las distancias que cada baldosa necesita recorrer desde la posición actual hasta la posición final. Para casos de más desafíos, como el rompecabezas 24, hay funciones admisibles mucho más elegantes (R.Korf trabajó en este tema durante muchos años y es un placer leer sus documentos). Por lo tanto, es muy posible que la mayor parte de su programa calcule una función admisible que se utilizará en el procedimiento de búsqueda basado en gráficos, que de otro modo sería sencillo.

Jason Li

Para comprender A *, primero debe comprender el algoritmo de Dijkstra.

El algoritmo de Dijkstra se basa en la idea de que si visita vértices en orden creciente de distancia desde la fuente, en cualquier momento dado siempre podrá determinar correctamente la distancia al siguiente vértice que visite. Entonces, en cualquier momento, tiene un conjunto S de vértices que ya ha visitado, y sabe que todos los vértices no visitados (llame a este conjunto T) están más lejos que todos los vértices en S. Ahora puede seleccionar el vértice más cercano en T, al considerar todos los bordes fuera de S y dentro de T. (No hay forma de que el vértice más cercano en T requiera dos o más bordes fuera de S, porque entonces el punto final del primer borde fuera de S estaría más cerca. Tenga en cuenta que esto requiere borde longitudes para que no sean negativas.) Luego mueva este vértice a S y repita hasta que visite su vértice de destino. Ahora sabemos la distancia correcta al destino.

Usamos A * para aplicaciones donde no tiene sentido visitar vértices en orden creciente de distancia desde la fuente, porque simplemente hay demasiados vértices que tendrían que ser visitados antes de que pudiéramos visitar el destino, y también tomaría mucho tiempo y usamos demasiada memoria, y solo nos importa el destino, no ninguno de los otros vértices. Así que tratamos de adivinar qué vértice debemos visitar a continuación para que nos acerque más al destino. En particular, suponemos la distancia desde el vértice hasta el destino. La suposición es una función llamada heurística . A * visita los vértices en orden creciente de (distancia desde la fuente) + heurística. Si elige tomar una ruta desde el origen hasta el destino que atraviesa algún vértice V, entonces, intuitivamente, la longitud total de esa ruta que espera es (distancia desde la fuente hasta V) + (distancia desde V hasta el destino). Cuanto más pequeño es este valor, “mejor” es el vértice, en el sentido de que pasar por ese vértice se predice que dará como resultado una ruta más óptima. Si nuestras suposiciones son bastante buenas, entonces básicamente podemos ignorar la mayoría de los vértices que no se encuentran en el camino más corto y encontrar rápidamente el camino más corto hacia el destino.

De hecho, suponiendo que su heurística nunca sobreestime la distancia al destino, se garantiza que A * encontrará la ruta más corta correcta desde el origen hasta el destino (es decir, en el instante en que visita el destino, conoce la distancia correcta). Intuitivamente, esto se debe a que si la heurística sobreestima, puede ignorar un vértice que debería estar en el camino más corto. Pero siempre que la heurística no se sobreestime, incluso si inicialmente pasa por encima de un vértice que debería estar en el camino más corto (porque subestimó algún otro vértice aún más), eventualmente tendrá que volver a él porque todos los otros caminos explorar primero resultará ser más largo. Por supuesto, si subestimas demasiado, entonces la búsqueda no hace un buen trabajo al explorar buenos caminos desde el principio, y la búsqueda se vuelve muy ineficiente. Cuanto más cerca esté su estimación, más eficiente será la búsqueda. (La última subestimación, el caso donde la heurística siempre devuelve cero, se reduce al algoritmo de Dijkstra).

Brian Bi

Grandes respuestas aquí, pero en su mayoría son bastante profundas. Quería intentar dejar una respuesta mucho más simplificada (específicamente con gráficos ponderados).

Supongamos que tiene un mapa con un montón de destinos. Usted asigna “pesos” a cada conexión (entre puntos). Esto podría ser simplemente la distancia, o también podría incluir cosas como la altura y el tipo de terreno. Puede ser cualquier cosa que necesites que sea.

Ahora, cuando desee encontrar el camino más corto desde su ubicación hasta un destino, simplemente obtendrá el camino con el menor peso. A * hace esto pero también calcula una heurística para hacerlo más eficiente. Para simplificar la explicación de este proceso, esencialmente dibuja una línea directamente al objetivo para elegir la (s) ruta (s) que es más probable que sea la más corta. Esto ayuda a determinar si, por ejemplo, el camino que está mirando no está ni siquiera en la dirección correcta.

De todos modos, es tan simple como puedo hacerlo (al menos escribiendo en mi teléfono). Esperemos que ayude y no confunda. Las otras respuestas son mejor información, pero esto está destinado a la simplicidad.

Jason Li

Aquí hay una explicación del algoritmo de búsqueda A *.

Igor Markov

More Interesting

¿Debo comprar una computadora portátil para juegos para aprendizaje automático / aprendizaje profundo?

¿Qué antecedentes necesito para comprender profundamente las redes neuronales?

¿Quora alguna vez se llenará de usuarios de IA?

¿Los tamaños de kernel de capa maxpooling en CNN son generalmente más pequeños que los tamaños de kernel de capa convolucional? ¿Por qué?

Cómo conseguir un trabajo en Google como desarrollador de aprendizaje automático / IA

Cómo fusionar el aprendizaje automático y la teoría de control

¿Llegará un momento en que los humanos informarán a los robots inteligentes?

¿Qué es algo en inteligencia artificial que no veremos en nuestra vida pero que crees que es posible?