¿Las PGM son esenciales para el aprendizaje profundo?

¡Te recomiendo que estudies modelos gráficos probabilísticos! Claro, las redes neuronales (o “aprendizaje profundo”) son divertidas de estudiar, pero si las ve desde una sólida base matemática, sacará más provecho de la experiencia e incluso podría llegar a tener algunas ideas interesantes. Además, aprender cómo funcionan los modelos gráficos y cómo se aprenden sus parámetros lo abrirá a una clase mucho más amplia de algoritmos de aprendizaje que si simplemente se sumerge en redes neuronales (es decir, diferenciación automática + alguna forma de descenso de gradiente, que es simple al final, como habrás visto de primera mano de la serie de conferencias de Hugo).

Las redes neuronales artificiales (ANN) se pueden ver como una clase de modelo gráfico, pero digamos el tipo de modelo gráfico que realmente no se puede interpretar (los nodos y los bordes no necesariamente tienen significados intuitivos como los de una red bayesiana). Ahora, si quieres hundir tus dientes en lo que considero las rodillas de la abeja (autoencoders variacionales (VAE)), entonces ven armado con algún conocimiento de probabilidad / estadística bayesiana y una comprensión de los modelos gráficos. Si bien los VAE tampoco tienen una arquitectura que se pueda interpretar limpiamente como un modelo gráfico intuitivo, sí representan una clase de modelos neuronales que se construyen desde una perspectiva de principios =]

Actualmente estoy siguiendo la especialización PGM por el Dr. Koller. Por lo que he aprendido hasta ahora, PGM es un enfoque totalmente diferente de DL o ML en general. Para ser conciso, mientras que ML se trata de encontrar un modelo que mapee con mayor precisión un conjunto de entrada a un conjunto de salida etiquetada, PGM implica observar la evidencia empírica proporcionada por el conjunto de datos y realizar inferencia estadística.

More Interesting

¿Cuál es la diferencia entre SVD y factorización matricial en el contexto del motor de recomendación?

¿Cómo determina el reconocimiento facial al dueño de la cara que detecta?

¿Qué es un método de kernel en el contexto del aprendizaje automático?

¿Cómo puedo hacer que mi computadora esté disponible para Google, Quora, Facebook, para poder contribuir a sus tareas de aprendizaje automático durante el tiempo de inactividad?

¿Cuál es la próxima gran cosa en el aprendizaje automático después de que hayamos terminado con el aprendizaje profundo?

Inferencia bayesiana: si tuviera que trazar un millar de correos electrónicos basados ​​en "spaminess" utilizando un algoritmo simple de Naive Bayes para establecer la probabilidad de "spaminess" para el eje x, ¿cuál debería ser mi eje y?

En los modelos gráficos, ¿cuál es la diferencia entre un gráfico de clúster y un gráfico de factores?

¿Los científicos de datos y el ingeniero de aprendizaje automático necesitan saber implementar algoritmos ML / DL desde cero o simplemente usar las bibliotecas existentes en producción?

¿Cómo reconoce la red neuronal convolucional los objetos de las imágenes sin la percepción o reconocimiento 3D?

¿Cómo sabemos de antemano qué características funcionarán mejor para la clasificación?

¿Cuáles son los diferentes modelos de aprendizaje automático?

Cómo construir un modelo de propensión a comprar para el marketing de bases de datos utilizando el aprendizaje automático en un entorno financiero

¿Cuáles son las desventajas de [math] abs (x) [/ math] como función de activación en redes neuronales?

¿Qué aprendizaje automático usa Quora para extraer la entrada del usuario?

¿Cuál es una explicación intuitiva para el equilibrio de sesgo-varianza?