¿Qué es la intuición del filtro de partículas?

Imagínese al detective tratando de resolver un crimen. El objetivo del detective es descubrir quién lo hizo y cómo lo hicieron. Al principio, al detective se le ocurren algunas conjeturas. Por ejemplo, ‘Quizás Sue lo hizo con el cuchillo de cocina, o quizás Bob lo hizo con la vela’. Pero el detective comienza a reunir más evidencia, lo que elimina algunas de sus conjeturas o le dice que algunas de sus conjeturas iniciales estaban en el camino correcto, pero que podrían necesitar modificaciones.

El filtro de partículas funciona de la misma manera. El misterio que el filtro de partículas está tratando de resolver puede ser la ubicación inicial del robot. Cada ‘partícula’ es, de hecho, una suposición sobre la ubicación inicial del robot. Pero a medida que el filtro reúne más detalles, puede eliminar algunas conjeturas. Por ejemplo, una de las partículas es la suposición inicial de que el robot está en la ubicación (1,1), y otra partícula es (2,3). Pero luego el robot mueve 1 unidad hacia la derecha y ve una fuente de luz fuerte. Sin embargo, el robot sabe que no hay luz en (2,1). Por lo tanto, elimina la partícula (1,1). Por otro lado, el robot sabe que es muy probable que se encienda una luz cerca (3,3). Por lo tanto, el robot tiene más confianza en su suposición de que la ubicación inicial era (2,3). Luego, el robot “refinará” su conjetura inicial, generando conjeturas adicionales: también adivinará que su ubicación inicial puede haber sido (2.1,3.2) o (1.9,3). A medida que esto continúa, el robot puede perfeccionar una suposición muy precisa de dónde estaba su ubicación inicial.

En términos muy generales que me sacarían de cualquier grupo de métodos secuenciales de Montecarlo, los filtros de partículas son estimadores que utilizan grandes cantidades de aleatoriedad para acercarse a la verdad. Probablemente se explican más fácilmente con un ejemplo.

Digamos que está tratando de rastrear el camino de una persona en dos dimensiones, (x, y). Todo lo que tiene que seguir es que está parado en un carrusel que gira a una velocidad angular constante, y cada vez que ve a la persona, registra el ángulo del carrusel. (Este es un sensor de “solo rumbo”). Matemáticamente, ahora estás tratando de calcular dos variables (x, y) usando solo una (ángulo), y no puedes hacerlo sin algunas aproximaciones o suposiciones.

Si asumió algo así, la persona tiene una velocidad máxima, podría adivinar la posible región x, y en la que la persona podría haberse movido la próxima vez que la vea. Sus suposiciones limitan el posible conjunto de posiciones, y si realmente estuviese presionado, podría elegir una.

Además, hay árboles y edificios por ahí, y la persona que estamos rastreando no puede caminar a través de un árbol y no puede ingresar a los edificios, por lo que podemos eliminar algunas conjeturas. También podemos reemplazarlos con mejores conjeturas, y si somos sensatos podemos asegurarnos de que no adivinemos en uno de los lugares que ya hemos deducido que es imposible.

En términos generales, los filtros de partículas hacen múltiples conjeturas (una por partícula) y luego promedian (más o menos …) los resultados. Cuando las conjeturas no encajan con los supuestos o restricciones, “eliminamos” estas partículas. Con suficientes partículas y suposiciones razonables, pueden funcionar sorprendentemente bien. Una posible intuición es que funcionan en la misma línea que The Wisdom of Crowds.

Este video hace un trabajo razonable al explicar el principio: