Hola
Bueno, en la práctica, el Proceso de Dirichlet jerárquico es una forma de implementar Dirichlets jerárquicos. En la medida en que desee modelar Dirichlets jerárquicos, los HDP hacen el trabajo. En la implementación, cuando se realiza correctamente, son un poco más lentas que la implementación estándar (ingenua) de Dirichlets. Aunque ahora hay muestreadores rápidos utilizados para Dirichlets (por ejemplo, implementado en la implementación Mallet de LDA por Mimno etal .) Que son mucho más rápidos nuevamente.
Notas:
- Dado el mismo tamaño de lote, ¿hay algún beneficio en transferir la capacitación CNN de una sola GPU a múltiples GPU (para un tamaño de lote de 128 en 4 GPU, cada GPU procesará 32 muestras)?
- ¿Qué hace una capa convolucional 1 × 1?
- Cómo dar un peso diferente a los conjuntos de características mientras se entrena un clasificador con Scikit
- Kaggle: ¿Cuáles son las técnicas utilizadas para reducir el número de columnas antes de predecir la variable dependiente? Por favor vea la descripción
- ¿Qué necesitas para hacer aprendizaje automático?
- Supongo que sabes por qué quieres Dirichlets jerárquicos. Puede ser útil en modelado de idiomas y modelado previo en métodos bayesianos. Los usamos para hacer agrupaciones de tweets o para especializar un diccionario de sentimientos para un dominio en particular. También son parte integral de los modelos LDA de mejor rendimiento.
- En la práctica, a menudo uso procesos jerárquicos de Pitman-Yor porque modelan mejor el comportamiento Zipfiano, por ejemplo, con modelos de lenguaje.
- Existe una gran cantidad de teoría asociada con los HDP, y no todo esto es útil para comprender la implementación. (Considere esto una subestimación académica)