Para adoptar algunas ideas de LDA, la primera pregunta es qué familia de distribuciones se debe usar para la anterior. Lo más simple y más común es usar una distribución simétrica de Dirichlet (ver http://people.cs.umass.edu/~wall… para más justificación).
La segunda pregunta es cómo deben establecerse los parámetros de la distribución. En el caso de un Dirichlet simétrico, solo necesita decidir el parámetro de concentración. Cómo lo hagas depende de cuán bayesiano quieras ser; algunos podrían abogar simplemente por elegir un número “razonable” (como 0.1). Un enfoque más basado en principios podría ser utilizar la búsqueda de cuadrícula en un conjunto de validación para seleccionar el valor que produce la mayor probabilidad de retención. Otro enfoque es aplicar un Gamma antes del parámetro de concentración; luego puede usar algo como Metropolis-Hastings para muestrear valores para este parámetro.
- Investigadores de aprendizaje automático, ¿algún día los robots nos matarán a todos?
- ¿Cuál es el propósito de usar la variable slack en SVM?
- ¿Qué áreas debo conocer bien para ser un buen ingeniero de visión por computadora?
- ¿Para qué tipo de problemas de aprendizaje automático no sería adecuado el aprendizaje profundo?
- ¿Debería aprender aprendizaje automático, desarrollo en la nube o desarrollo de juegos en Unity como estudiante universitario de primer año?