¿Cuál es la diferencia y la relación entre un proceso de Markov y un proceso de martingala?

La clave para entender un proceso de Markov es entender que no importa cómo llegaste a donde estás ahora, solo importa dónde estás ahora. Puedes decirme cómo llegaste a donde estás ahora si quieres, pero eso no me ayudará a averiguar a dónde irás ahora más que si me dices dónde estás ahora.

¿Es un juego de baloncesto bien modelado por un proceso de Markov? Si le digo que el puntaje es actualmente 68-62 (equipo local ganador) y quedan 3 minutos y el equipo local tiene la pelota, ¿es todo lo que necesita saber para ayudarlo a determinar qué tan probable es que gane cada equipo? ¿Crees en cosas como el “impulso” en los deportes? ¿Creería que es probable que el equipo local gane si supiera que hace 2 minutos era 58-62 (el equipo local pierde)? ¿Qué pasa si, hace dos minutos, fue 68-40 (equipo local ganador)? Esos dos escenarios pintan una imagen muy diferente de cómo llegamos a nuestro puntaje actual. En un caso, el equipo local estaba caído y acaba de avanzar. En el otro caso, el equipo visitante está en medio de un gran regreso. Si cree que la información adicional cambia la probabilidad de que el equipo local gane en cada caso, entonces el proceso NO es Markovian. Si crees que no importa, entonces podría ser Markovian.

¿Qué pasa con un proceso de martingala? La propiedad clave de una martingala es que la media del futuro es igual al presente (independientemente del pasado). Esto es SOLO una declaración sobre la media, no sobre la distribución completa.

Preparemos un juego que sea una martingala pero que no sea Markovian (a menos que expandas mucho el espacio de estado). El juego es así:

El proceso contará cuánto dinero tiene al comienzo de una ronda. Comienza con un mazo de 2000 cartas (mitad rojo y mitad negro). Dé la vuelta a la tarjeta superior, si es roja, me pagará una cantidad, si es negra, le pagaré una cantidad. ¿Cómo decidimos el monto del pago? Volteamos más cartas hasta que el número de tarjetas negras restantes sea igual al número de tarjetas rojas restantes. Luego, el pago es de un dólar por tarjeta extraída para volver a la igualdad. Entonces, por ejemplo, si primero pongo un rojo, debes pagarme algo. Si cambio un segundo negro, volvemos a la igualdad y me pagas $ 1 (ya que tomó un cambio más para volver a la igualdad). Si, en cambio, la secuencia de volteos era roja (me pagas), seguida de R, R, B, R, B, B, R, B, B; luego tomó 9 vueltas más para alcanzar la igualdad, por lo que me pagas $ 9. (Tenga en cuenta que eventualmente DEBEMOS alcanzar la igualdad incluso si tenemos que agotar el mazo dejando 0 rojo y 0 negro). Última regla del juego: si después del pago, el mazo está vacío, barajamos todas las cartas y volvemos. Si no está vacío, vamos de nuevo con la cantidad de cartas que haya en el mazo.

¿Por qué este proceso es una martingala? Porque cada vez que jugamos, el mazo comienza con la misma cantidad de cartas rojas y negras. Entonces, cada vez, hay una posibilidad de 50/50 de que pague / me paguen. Además, la estructura de pago es simétrica, por lo que el cambio esperado en mi bankroll es cero cada vez que jugamos una ronda del juego. La media del futuro es igual a la media del presente independientemente del pasado.

¿Por qué este proceso NO es markoviano? Porque la estructura de pago cambia dependiendo de cuántas cartas quedan en el mazo cuando comienzas la ronda. Inicialmente, hay 2000 cartas, por lo que la variación de los pagos es bastante grande: posiblemente podría ganar $ 1999 en la primera ronda si la primera vuelta es roja y se necesita todo el mazo para volver a igualar. Sin embargo, supongamos que hemos jugado 5 rondas con cada uno de nosotros ganando la misma cantidad de dólares (por lo que estamos en cero neto), y supongamos que nos quedan 10 cartas en el mazo (5 rojas, 5 negras). Ahora, saber cómo llegamos al cero neto sería importante para predecir la distribución de cuánto dinero tendríamos después de la próxima ronda. En promedio, todavía estaríamos en cero neto, pero con solo 10 cartas restantes en el mazo, hay cero probabilidad de que mi bankroll cambie por encima de 9 o por debajo de -9.

(Última nota, este juego también es realmente Markovian, pero necesitas un espacio de estado más grande que solo considerar tu bankroll. Si tu espacio de estado describe no solo cuánto dinero tienes sino también cuántas cartas hay en el mazo al comienzo de la ronda, entonces no necesita saber cómo llegó a un estado para determinar completamente las probabilidades de transición a cualquier otro estado).

Un proceso de Markov es aquel en el que lo que sucede a continuación es independiente de lo que sucedió antes. El ejemplo clásico es una ruleta: la historia de los resultados no tiene ningún efecto en el próximo giro (razón por la cual los casinos anunciarán felizmente resultados anteriores, números “calientes” y “fríos”, etc.). Un ejemplo de un proceso que no es de Markov es el Blackjack: lo que suceda a continuación depende de las cartas que hayan ido antes (por lo que los casinos prohíben escribir en las mesas de Blackjack y también fruncir el ceño ante el ‘conteo de cartas’).

Un proceso de martingala es aquel en el que la expectativa para el próximo resultado dado todo lo que ha sucedido antes es la misma que la expectativa actual. La estrategia de apuestas de martingala más simple en una apuesta de dinero par es duplicar su apuesta si pierde. Esta estrategia ‘garantiza’ una ganancia de una unidad cuando eventualmente gana sin importar cuáles sean las probabilidades subyacentes (siempre que la probabilidad de una ganancia sea distinta de cero). Sin embargo, el resultado esperado para la secuencia de apuestas depende solo de la cantidad apostada.

Para ilustrar la diferencia, considere una urna con cierto número de bolas negras y cierto número de bolas blancas. El proceso repetido de seleccionar una bola y luego devolver la bola a la urna es un proceso de Markov. Ahora considere la Urna de Polya en la que después de seleccionar una bola, se devuelve la bola y una bola adicional del mismo color, a veces descrita como “los ricos se hacen más ricos”. La selección repetida de una bola de la Urna de Polya es un proceso de martingala porque el valor esperado de la siguiente selección es el mismo que el de la última selección, pero no es Markov porque la probabilidad de la selección se ve afectada por la historia del proceso. .

Gracias por el A2A.

Intuición simple:

Proceso de Markov : no sabe cuál será el valor de algo mañana y adivina cuál es el valor de algo de mañana, en función de su valor actual.

Martingala : la probable / esperada / mejor suposición del valor de algo es exactamente igual a su valor actual (última observación)

Ejemplo:

Tienes £ 100 en tu billetera el lunes.

Proceso de Markov: la cantidad de dinero que tendrá en su billetera el martes se estima mejor por la cantidad que tenía el lunes, es decir = £ 100, y el dinero que tenía su billetera el domingo o el sábado o la semana anterior, etc. cualquier ayuda cuando calcules el valor el martes. es decir, la historia más allá del tiempo (t) es irrelevante.

Conclusión: el proceso de Markov hará varias estimaciones para el dinero en la billetera y todas esas estimaciones se basarán en el valor de los lunes y no en cualquier otra cantidad anterior que tenía antes del lunes.

Martingala: la mejor estimación del dinero en su billetera el martes es exactamente = £ 100. es decir, el valor de los lunes.

Conclusión clave: la mejor estimación del valor futuro es EXACTAMENTE igual al valor de HOY ( no se requiere otra información histórica pasada ).

Diferencia clave y similitudes:

Similitudes : tanto Markov como Martingala, no mire más allá de los valores actuales / actuales cuando intente predecir / estimar / adivinar valores futuros.

Diferencias : Uno me da una estimación exacta ( martingala ) y esta estimación es exactamente igual al valor actual / actual.

El otro me da orientación sobre qué información debo considerar al hacer estimaciones (usando probabilidades de transición) de valores futuros. ( Markov)

More Interesting

¿Qué cosas, como civilización, hemos estado haciendo mal todo este tiempo?

Cómo alcanzar el nivel de matemáticas requerido para participar en el Concurso Internacional de Programación Colegiada

¿Cuáles son los tipos de inteligencia artificial?

¿Realmente necesita saber qué se enseña en una clase de organización / arquitectura como ingeniero de software?

¿Cuáles son los pros y los contras de ir a la UC Santa Cruz para la informática? ¿Cómo pesa UCSC en comparación con otras universidades en términos de CS y empleo después de la universidad?

¿Cuántas longitudes de onda de luz posibles puede identificar una computadora?

¿Cuáles son algunos de los problemas de investigación abierta más interesantes en los sistemas de archivos?

¿Qué debo hacer ya que estoy realmente frustrado con el programa de capacitación de Infosys? Y como no soy de CS, estoy realmente confundido acerca de mi futuro.

¿Qué debe hacer cuando su computadora hace un volcado de memoria?

¿Qué tan grande es un yottabyte, una unidad de medida como un gigabyte? ¿Hay suficientes datos en el mundo para almacenar en un yottabyte?

¿Quién es la persona con más conocimientos sobre computadoras?

¿Por qué la noción de un sistema operativo para múltiples usuarios es tan omnipresente?

¿Las calculadoras usan BODMAS, BIDMAS, PEDMAS, PEMDAS o PEMA?

¿Cómo se mantiene rápido Internet, a pesar de la creciente cantidad de información?

Para aplicaciones web grandes, ¿dónde se almacenan los datos de aprendizaje automático?