¿Cómo calcula el tema antes en el análisis latente probabilístico?

Para adoptar algunas ideas de LDA, la primera pregunta es qué familia de distribuciones se debe usar para la anterior. Lo más simple y más común es usar una distribución simétrica de Dirichlet (ver http://people.cs.umass.edu/~wall… para más justificación).

La segunda pregunta es cómo deben establecerse los parámetros de la distribución. En el caso de un Dirichlet simétrico, solo necesita decidir el parámetro de concentración. Cómo lo hagas depende de cuán bayesiano quieras ser; algunos podrían abogar simplemente por elegir un número “razonable” (como 0.1). Un enfoque más basado en principios podría ser utilizar la búsqueda de cuadrícula en un conjunto de validación para seleccionar el valor que produce la mayor probabilidad de retención. Otro enfoque es aplicar un Gamma antes del parámetro de concentración; luego puede usar algo como Metropolis-Hastings para muestrear valores para este parámetro.

Aprendizaje automático

¿Qué harás cuando entrenes a tu modelo?

¿Cuál es la explicación de la fórmula de compensación de Bias Variance?

¿Cómo se puede comparar Big data con Machine Learning?

¿Cómo afectará el aprendizaje automático a la economía, tanto a corto plazo (2–5 años) como a largo plazo?

¿Cuáles fueron algunos de los artículos de conferencias / revistas de investigación del discurso más interesantes / dignos de mención en 2012?

¿Cuál es la diferencia entre el almacenamiento de archivos, el almacenamiento en bloque y el almacenamiento de objetos? ¿Cuál es la arquitectura de los sistemas de almacenamiento en cada caso? ¿Cómo se recuperan los datos en cada caso?

No ‘computas’ un previo. Usted lo especifica Y la especificación se basa en sus creencias sobre el fenómeno subyacente que genera los datos.

Ahora, en el caso específico de LDA, dado que es un modelo bayesiano jerárquico, debe especificar hiperpriors alfa y beta. Si cree que los documentos están compuestos principalmente por un tema predominante, entonces debe elegir un valor apropiado de [math] alpha [\ math], por otro lado, cree que los documentos están formados por una mezcla de número de temas, entonces debe especificar un valor diferente de alfa. Lo mismo ocurre con la asignación de temas de palabras (es decir, hiperparámetro beta).

Para obtener una explicación, puede consultar las conferencias en video del Prof. David Blei, coautor de la publicación original de LDA: Topic Models – videolectures.net

Charles H Martin

lo anterior se establece en función de lo que puede resolver de forma numérica y conveniente y no realmente en conocimiento previo

Alberto Bietti

More Interesting

¿Cuáles son las buenas formas de combinar dos salidas de un clasificador?

¿Cuál es el resultado de un modelo de omisión de gramo en Word2Vec?

¿Una máquina de máquina virtual de big data ayuda a analizar archivos grandes?

¿Qué debería aprender primero para el aprendizaje automático y la autoeducación: cálculo, probabilidad, estadística o álgebra lineal?

Cómo hacer ingeniería de características para la regresión no lineal correcta

¿Cuáles son los temas que debo saber antes de comenzar el aprendizaje automático?

¿Cuáles son los buenos algoritmos para la extracción de características para grandes conjuntos de datos?

¿Qué requisitos previos debe tener para aprender la teoría de las redes neuronales artificiales?