¿Es Bayes jerárquico básicamente una introducción de hiperparámetros en el modelo?

Sí, si entiendo la pregunta correctamente. Los hiperparámetros estaban allí para empezar. Pocos modelos están libres de parámetros. La parte jerárquica (en el contexto de los hiperparámetros) implica que, en lugar de utilizar algún procedimiento empírico (p. Ej., Validación cruzada), traeremos los hiperparámetros al modelo y aprenderemos las distribuciones para ellos también para los datos.

Esto significa que los hiperparámetros ahora tienen sus propias distribuciones previas, y parte del proceso de inferencia inferirá su distribución posterior dada una vez que introduzcamos los datos. Por supuesto, al hacer esto, lo más probable es que hayamos introducido más hiperparámetros (aquellos que parametrizan las distribuciones de HP). Esto puede continuar, pero generalmente una de esas capas es suficiente ya que el modelo generalmente se vuelve más y más robusto para la parametrización de niveles más altos en la jerarquía.

Aprendizaje automáticoestadísticasInferencia bayesiana

Related Content

Estamos viendo el comienzo de las máquinas que pueden codificar. ¿Aprender un lenguaje de programación aún sería útil en la carrera de ML?

¿Cuáles son los últimos desarrollos en clasificación?

¿Tiene sentido el uso de bosques aleatorios en los datos financieros si se supone que los rendimientos dependen en serie (es decir, que los rendimientos actuales dependen de los rendimientos pasados)?

¿Cuáles son algunos de los problemas de desarrollo que enfrenta la inteligencia artificial?

¿Existe un programa de tipo PageRank para organizar mis canales RSS diarios?

¿Es posible usar la red neuronal para predecir múltiples valores respetando ciertas condiciones?

¿Por qué la agrupación de datos del panel reduce los errores estándar?

More Interesting

¿Hay alguna empresa india que trabaje con IA y aprendizaje automático? En caso afirmativo, ¿en qué campo y en qué se diferencia de otros en ese campo?

¿Qué parte de la investigación de aprendizaje profundo es empírica versus teórica?

¿Cómo funciona el algoritmo de fijación de precios de Uber?

¿Qué es la agrupación?

¿Cuál es la relación entre física y aprendizaje automático / IA?

¿Cuál es mejor, el aprendizaje automático de Stanford en Coursera o un nanogrado Udacity?

¿Se están realizando estudios actuales que utilicen la minería de datos o el aprendizaje automático en campos científicos?

¿Cuál es la posibilidad de que un humano gane el juego de entropía?

¿Cuáles son los beneficios de convertir una capa totalmente conectada en una red neuronal profunda a una capa convolucional equivalente?

¿Cómo puede un estado en el aprendizaje por refuerzo tener dos valores? Por ejemplo, como en el blackjack donde el as es 1 u 11.

¿Cuál es el orden jerárquico del universo?

¿Cuáles son los desafíos tecnológicos involucrados en alimentar el código fuente de una máquina Linux y hacer que aprenda a codificar un núcleo Linux similar?

¿Qué clases de modelos se pueden usar para predecir distribuciones de series de tiempo?

¿Cuáles son los métodos actuales o estándar de combinación de datos estructurados y no estructurados en redes neuronales convolucionales?

¿Por qué hay tantas redes de aprendizaje profundo?

Web Analytics