¿Existe algún modelo de aprendizaje profundo o algún otro método que ingrese como una colección de documentos y pueda predecir la probabilidad de un nuevo documento?

Lo que está buscando es lo que se llama un modelo generativo , un modelo que le dice qué tan probable es la salida dada. Tenga en cuenta que esto también significa que los modelos generativos podrían usarse para generar aleatoriamente nuevos ejemplos de documentos, de ahí el nombre.

Por lo general, en el aprendizaje profundo, hay más interés en los modelos discriminatorios , cosas que le dicen a la clase algo.

Los enfoques bayesianos son típicamente generativos. Por lo tanto, cosas como n-gramos se pueden usar para estimar la probabilidad de un documento, si se entrena en la entrada.

En el mundo del aprendizaje profundo, recientemente ha habido un aumento de los modelos generativos. Quizás el más conocido de estos es el trabajo sobre autoencoders variacionales de Kingma et al.

Pero para manejar el texto necesitaríamos tener codificadores automáticos que funcionen en secuencias, por lo que necesitamos algo como codificadores automáticos recurrentes variacionales. Puedo encontrar uno o dos documentos sobre el tema (por ejemplo, [1412.6581] Codificadores automáticos recurrentes variacionales) pero no conozco el campo lo suficientemente bien.

AprendizajeAprendizaje profundoautomáticoProcesamiento del lenguaje natural

Related Content

¿Qué son los vectores de características basados en cuadros (como se usan en el reconocimiento de voz)?

¿Debo aprender el aprendizaje automático para IoT?

¿Hay algún paquete de código abierto para aplicar ML a las publicaciones de Twitter?

¿Es demasiado tarde para sumergirme en Data Science, ya que se están desarrollando poderosas herramientas de aprendizaje automático y ya hay muchos científicos de datos hábiles?

¿Existen demostraciones efectivas de relevancia semántica?

¿Está bien usar kNN para este problema de clasificación de símbolos musicales?

¿Puedo encontrar algo útil en la web profunda?

Waleed Kadous es perfecto. Lo que necesitas es un modelo generativo. Una manera fácil de comenzar es usar la suposición de bolsa de palabras e intentar la asignación de Dirichlet latente. Hay otras variantes aumentadas con enfoques de recuperación de información como modelos de lenguaje con enfoques de minería de datos. Sin embargo, LDA parece ser un lugar justo para comenzar fuera de las redes neuronales.

Waleed Kadous

More Interesting

¿Se pueden usar las redes neuronales para resolver problemas de aprendizaje no supervisados?

¿Es el curso de aprendizaje automático de Andrew Ng en Coursera una versión simplificada del curso CS 229: aprendizaje automático que enseñó en Stanford?

¿Cuál es la relación entre relevancia y aprendizaje automático?

¿Por qué el error cuadrático medio es equivalente a minimizar la entropía cruzada entre la distribución empírica y un modelo gaussiano?

¿El reconocimiento facial basado en CNN todavía se clasificaría correctamente si la imagen facial presentada está al revés?

Cómo construir un horario usando un algoritmo genético

¿Cuáles son las mejores bibliotecas de redes neuronales de Python y Java con soporte multi gpu y multiplataforma?

¿Qué haces como programador de Machine Learning y qué hace que lo que haces sea interesante?

¿Cuáles son algunos algoritmos para resolver el problema de los bandidos multi-armados?

Árboles de decisión: ¿Cómo podar un CARRITO?

¿Podría la red neuronal de convolución completa aprender a discriminar entre clases si no hay muestreo descendente y la entrada es igual a salida?

¿Cómo se usa Machine Learning en las diferentes etapas de los sitios web de comercio electrónico (compras en línea)?

¿Podría la IA volverse autónoma y aprender y adaptarse de manera no supervisada a través del aprendizaje profundo?

¿Cuáles son los beneficios de convertir una capa totalmente conectada en una red neuronal profunda a una capa convolucional equivalente?

¿Cuál es la mejor manera de manejar los valores atípicos en Machine Learning?

Web Analytics