Como mencionó Justin Rising, el MDP viene con la suposición de que el último estado es suficiente para predecir el (probabilidad de) estado actual dada una acción tomada en el último estado. O, de manera equivalente, para predecir el estado futuro, solo necesito mi estado actual; no se requiere mi estado pasado.
Entonces, ¿cuándo no funcionaría la suposición de Markov? Puedo pensar en un par de casos:
- Tienes información incompleta. Por ejemplo, su información de estado proviene de sensores en un robot, pero debido a varias razones, algunos de los sensores no pueden capturar datos. Entonces, si bien con la información completa, un modelo de Markov debería haber funcionado, debe tratar explícitamente la información que falta (dependiendo de su situación exacta, aún podría extender los MDP y usar algo como un proceso de decisión de Markov parcialmente observable).
- Una actividad donde la secuencia importa. Hay una sutileza aquí. En principio, podría diseñar sus estados de manera que codifiquen la historia y un marco de trabajo de Markov todavía funcionaría. Por ejemplo, está intentando modelar el comportamiento de navegación y cree que las últimas tres páginas determinan mejor la siguiente. Entonces, en lugar de tener estados como , , , , … (donde denota la i-ésima página en el viaje), puede tener estados como , , … y todavía uso una suposición de Markov en estos nuevos estados. El problema ahora es que ha explotado el número posible de estados. Si su sitio web tiene n páginas, en la representación original tiene n estados, mientras que en la nueva representación tiene n ^ 3 estados. Con suficientes datos esto funcionaría, pero si quiere ser inteligente con los datos / recursos, es posible que desee ver un modelo de secuencia propiamente dicho.
- ¿Cómo usa Facebook el aprendizaje automático?
- ¿Qué son los hiperparámetros en el aprendizaje automático?
- ¿Cómo es un proyecto de visión por computadora "típico", de principio a fin?
- ¿Qué es el aprendizaje de características?
- ¿Qué usos novedosos hay para el aprendizaje de refuerzo profundo?