¿Cuáles son algunas historias de éxito para Dirichlet Process Clustering?

Entonces Tanmoy Mukherjee cubre esto bien.

Agregaré otro aspecto. Para la agrupación, lo que realmente está haciendo con el DP es priorizar qué tan rápido espera que crezca la cantidad de agrupaciones dada la cantidad actual de puntos de datos. Las entradas de Wikipedia son bastante inútiles porque no describen este punto importante. Todo está enterrado en los tomos estadísticos masivos de la comunidad estadística matemática, en particular el trabajo de Pitman. Así que escribimos un tutorial sobre esto en arXiv, “Una visión bayesiana del proceso de Poisson-Dirichlet” en arxiv.org, consulte la sección 5.2. El proceso Pitman-Yor (PYP) proporciona una extensión, y ambos tienen parámetros para ajustar.

Ahora hay muchas maneras de configurar un previo similar para un Bayesiano. No veo ninguna razón real para estar encerrado en un DP o un PYP. Pero tienen una elegancia matemática.

Su poder real viene cuando se aplica jerárquicamente, que es donde los Dirichlets paramétricos estándar son intractibles, por lo que es muy poco práctico. Hay muchas historias de éxito para los DP jerárquicos y los PYP jerárquicos en términos de brindar un mejor rendimiento en problemas reales.

Cómo comenzar a aprender Neural Network y PNL

¿Cuántos idiomas hay para las redes neuronales?

Cuando se estandarizan los datos como un paso de preprocesamiento, ¿por qué se usa la media y la varianza utilizadas en el tiempo del tren también en el momento de la prueba?

¿Qué tan fácil es aprender una función booleana con Descenso de gradiente usando un aprendizaje profundo?

¿Qué significa splines de regresión adaptativa múltiple (MARS) en términos simples?

¿Por qué el embolsado es más preciso que solo mirar todo el conjunto de datos y tomar el promedio?

El éxito de la agrupación de procesos Dirichlet? ¿Quieres decir en entornos industriales?
Veamos si esto se cuenta como un éxito:

1) Análisis de texto: – [1] se ha utilizado para ver la naturaleza evolutiva de los grupos / aspectos temporales de los grupos. [2] se ha utilizado para ver el nacimiento y la muerte de grupos. [3]

2) Redes sociales: – Detección comunitaria [4], [5]

3) Biología: – Genética de poblaciones [6], [7]

4) Visión por computadora: – Segmentación de región [8], [9]

Creo que la historia de éxito aquí es bastante mínima, así que siéntase libre de agregar más a la lista 🙂

Referencias
[1] Modelos dinámicos de mezclas no paramétricas y los chinos recurrentes
Proceso de restaurante: con aplicaciones para la agrupación evolutiva (página en Cmu)
[2] Línea de tiempo: un modelo dinámico de proceso de Dirichlet jerárquico para recuperar el nacimiento / muerte y la evolución de los temas en la secuencia de texto
[3] Inferencia distribuida escalable de los intereses dinámicos del usuario para la orientación por comportamiento.
[4] Detección de comunidad dinámica con proceso de Dirichlet temporal
[5] Página sobre Uiuc
[6] Un modelo jerárquico de mezcla de procesos de Dirichlet para la reconstrucción de haplotipos a partir de datos de múltiples poblaciones
[7] Página sobre Berkeley
[8] Página sobre Waset
[9] Página sobre Duke

Wray Buntine

More Interesting

¿Cómo se usa el aprendizaje automático en FinTech (P2P, pagos), particularmente fuera de algo trading? ¿Alguien tiene ejemplos específicos en punto a punto, verificación de crédito, pagos, etc.?

¿Cómo reconocemos a un usuario en particular en un registro de chat de Internet multiusuario largo?

¿Cómo funciona el mecanismo de atención de múltiples cabezas en el aprendizaje profundo?

¿Cuáles son algunos problemas de aprendizaje automático que están más allá del poder de scikit-learn para resolver?

¿Por qué algunos clasificadores no pueden manejar los atributos continuos?

¿Cuál es la diferencia entre Empirical Bayes e inferencia bayesiana?

¿Qué nivel de experiencia en aprendizaje automático se espera de un científico de datos?

¿Cuál es la forma correcta de calcular la similitud de coseno entre una consulta y un documento? Cuando calculo la magnitud del documento, ¿sumo los cuadrados de todos los términos del documento o solo los de la consulta?

Además de las redes neuronales profundas, ¿existen antecedentes para cálculos largos con una inferencia máxima a posteriori eficiente?

¿Hay algún lugar en la ciencia donde la biblioteca estadística de Python sea pobre o inmadura en comparación con R?