¿Qué tan exitoso ha sido el modelo tópico LDA en la categorización de imágenes?

LDA para el modelado de temas está destinado a ser utilizado para texto. LDA aquí significa “Asignación de Dirichlet Latente”. En este modelo, cada tema está asociado con una distribución multinomial sobre el vocabulario del corpus, y cada documento tiene una distribución multinomial de temas. Es un modelo generativo: imagine crear un documento mediante el muestreo de una distribución multinomial de temas (de un Dirichlet anterior, de ahí el nombre “LDA”), y luego por cada palabra muestreando un tema de ese tema, y ​​muestreando una palabra del multinomial sobre el vocabulario. En la práctica, en realidad no usamos el modelo generativo de esa manera, pero es lo que está detrás de todas las matemáticas.

En resumen: esto requiere que tengas algún tipo de “vocabulario” y documentos que consisten en “palabras”. No es estrictamente necesario que sea texto natural, pero puede ser cualquier tipo de modelo que tenga cualquier número de variables observadas de valores múltiples (“palabras”) por instancia (“documento”). No estoy seguro de cómo lo usaría para la clasificación de imágenes, a menos que tenga un conjunto de módulos de reconocimiento de objetos (que actuarían como las “palabras”) y asocie cada imagen por el conjunto de objetos u otras características.

El nombre “LDA” aparece en otra parte de Machine Learning como en “Análisis discriminante lineal”. Esta es una técnica básica para encontrar la “mejor” transformación lineal de características, a menudo utilizada para la clasificación. Esto podría ser mejor para las imágenes, pero probablemente desee realizar primero una construcción de entidades de nivel bajo a medio (es probable que el uso de una transformación lineal en el vector de entrada original no dé muy buenos resultados).

More Interesting

MLconf 2015 Seattle: ¿Cómo funciona la técnica de aproximación simbólica agregada (SAX)?

¿Cuál es la filosofía de la matriz, la descomposición del tensor para encontrar la estructura latente?

¿Qué habilidades necesito para la IA?

¿Cómo detectar el sarcasmo en frases u oraciones mientras se extrae texto? ¿Hay alguna metodología utilizada?

¿Cómo almacena un sistema de aprendizaje automático su memoria aprendida?

Cómo realizar el aprendizaje de refuerzo en una red neuronal de alimentación oculta de capas múltiples

¿Keras es mejor que Tensorflow para el aprendizaje profundo?

¿Qué versión de Python debería usar en 2016 en Machine Learning y Data Science, Python 2.7 o Python 3.0+?

¿Está muriendo la investigación en aprendizaje profundo?

¿Cuál es la relación entre IA, aprendizaje automático y ciencias de la computación? ¿Hay especializaciones en IA o aprendizaje automático, o son especializaciones en informática?

Aprendizaje automático: al construir un modelo de regresión lineal, ¿cómo decido entre variar el grado del polinomio y variar el parámetro de regularización?

¿Qué tecnologías que no son de IBM se están utilizando para mejorar el ecosistema de IBM Watson?

¿Cuáles son los desafíos tecnológicos involucrados en alimentar el código fuente de una máquina Linux y hacer que aprenda a codificar un núcleo Linux similar?

¿Cuáles son algunas aplicaciones de muestreo de importancia en Deep Learning?

¿Por qué una red neuronal no es propensa al sobreajuste a pesar de tener tantos parámetros?