Andrew Ng: ¿Qué opinas sobre el futuro del aprendizaje de Bayesian Networks? La tecnología cambia la vida futura

Esta pregunta me llevó algún tiempo responder, porque la respuesta más fácil hubiera sido “francamente no lo sé”. Pero como profesional retirado que amaba el concepto de bayesiano y había sufrido una considerable humillación durante el curso de doctorado. por ser bayesiano, pensé que debería ser lo suficientemente valiente como para escribir lo que realmente pienso. Entonces, aquí está, mi propia opinión, con mi conocimiento limitado de la Red Bayesiana.

El propósito principal para construir una Red Bayesiana es estimar ‘Estados’ de algunas variables dadas ‘Evidencia’.

Esto en términos bayesianos simples es cómo estimar la información posterior de un parámetro con cierta información previa y actual al respecto. Pero en Bayesian Network, los términos son poco diferentes.

Por lo tanto, el estado anterior de un parámetro se transforma con la información existente en otro estado, que es su estado posterior. En una situación bayesiana simple que se obtiene aplicando la regla de Bayes con probabilidades condicionales. En redes, este proceso no se detiene después de una iteración de la regla de Bayes. El Estado posterior obtenido, se convierte en el Prior para estimar el siguiente Estado, y así sucesivamente. Entonces, cuanto más complicada es la red, la derivación se vuelve igualmente compleja. Y si está haciendo un seguimiento de las Redes, quizás haya notado lo que quiero decir. Simplemente no hay fin a las redes nuevas y más complicadas que evolucionan. Con herramientas como las redes neuronales, ahora se ha vuelto muy útil pero también extremadamente desafiante. A medida que las redes se hacen más grandes y complejas, derivar información en cada estado (rama) se vuelve igualmente complicado y desafiante.

Un enfoque que se convirtió en una forma natural de resolver es la ‘Simulación estocástica’ por razones obvias. De hecho, el primer método de simulación para generar el Estado Posterior fue el MCMC o el método Markov Chain Monte Carlo. En este enfoque, la simulación de MonteCarlo fue inteligentemente diseñada para ejecutar una cadena de Markov durante mucho tiempo, siendo los estados de la cadena de Markov los estados del posterior para la variable o el parámetro. Este enfoque resolvió muchos problemas y aún lo hace.

Hoy en día, las redes son de tal escala que incluso los sofisticados hardwares de hoy se ven abrumados por las complejidades. Existen muchas aplicaciones y estudios con simulaciones estocásticas en las que la red bayesiana es muy útil, pero a veces se toman decisiones, no para utilizar toda la información proporcionada por la simulación, sino solo las pertinentes pertinentes al problema en cuestión.

Entonces, para mí, la dirección futura de cualquier tema específico está determinada por la utilidad y la exploración del mismo. Entonces, aunque las Redes pueden evolucionar sin límites, la extracción de información relevante y su utilidad a partir de ella necesitará más exploraciones.