¿Cuáles son las ventajas y desventajas de comparar la búsqueda de árboles de Monte Carlo y la programación dinámica aproximada?

Una búsqueda de árboles en Monte Carlo es ingenua, analiza todas las alternativas posibles y hace un promedio de algunas. Considere un montón de caminos, sígalos y cada vez que se tome una decisión, divida ese camino en tantas posibilidades como sea posible, y así sucesivamente … El método es computacional y costoso para la memoria, sin embargo, no requiere ningún supuesto.

La programación dinámica aproximada (ADP) se basa en el supuesto de markovianidad en el proceso estocástico subyacente y en tal supuesto se construye el principio de programación dinámica que permite resolver exactamente el problema dinámico, resolviendo una secuencia de problemas estáticos. ADP considera muchas alternativas como el método de Monte Carlo, sin embargo, retrocede en el tiempo, y paso a paso considera un número controlado de escenarios en cada capa de tiempo. No se consideran todas las posibilidades, pero solo se toma la mejor opción cada vez que se requiere. Se optimiza la optimización de tal manera que no se debe introducir ningún sesgo en la solución.

More Interesting

¿Cómo podemos usar caché (s) para la optimización de la multiplicación de matrices?

¿Cuál es el vínculo entre los algoritmos de optimización y las distribuciones de probabilidad?

¿Puede Quantum Computing acelerar las redes neuronales y los algoritmos genéticos?

¿Qué tipo de algoritmo de procesamiento del lenguaje natural se usaría para replicar los resultados de esta charla TED?

Imagine una cerradura de bicicleta combinada con 4 anillos que contienen 10 letras. ¿Cómo se puede calcular qué letras en cada anillo producirán las palabras más válidas?

¿Cuál es la forma más fácil de eliminar elementos duplicados de una matriz de derecha a izquierda?

¿Cuál es el algoritmo más poderoso en el mundo de las aplicaciones?

¿Alguien podría dar una explicación detallada del algoritmo de Lee para encontrar contornos cercanos en una región?

¿Cuál es la mejor manera de realizar operaciones de intercambio K en un entero de N dígitos para obtener el máximo número posible?

Cómo comenzar a hacer mi propia solución de divide y vencerás

Cómo crear un algoritmo que comprima el código binario

En un algoritmo de búsqueda binaria existe la línea, si la clave == A [mid] return (mid + 1). ¿Por qué (mediados + 1)?

¿Pueden los pesos de Bellman-Ford ser funciones y no constantes?

¿Qué es un algoritmo recursivo (pseudocódigo) que calcula la suma de los primeros enteros positivos impares?

Siempre sueño con trabajar en grandes empresas tecnológicas como Google o Facebook, pero mi habilidad con los algoritmos es muy débil. Intento resolver problemas en Google Code Jam y CodeChef, pero solo puedo resolver los fáciles. ¿Qué tengo que hacer?