¿Cómo ayuda el enfoque ontológico con la clasificación de texto?

Gracias por el A2A. Defino su frase “enfoque ontológico” como el enfoque que se utilizó ampliamente en mi último trabajo y, en menor medida, en mi trabajo actual. Esencialmente, codifica el conocimiento humano en un gráfico (la ontología), donde los vértices representan conceptos y las aristas representan relaciones (nombradas y ponderadas) entre estos conceptos. El gráfico admite la búsqueda por vertexID (ID de concepto). Junto con esto, tiene un componente de búsqueda, que le permite buscar conceptos por nombre (y devolver el ID del concepto).

La clasificación en este contexto es enviar una secuencia de texto (su documento para clasificar) contra el componente de búsqueda, y convertirlo en una bolsa de conceptos. Luego, puede acumular estos conceptos en el conjunto de nuevos conceptos que forman la base de la clasificación. Por ejemplo, si su objetivo era clasificar un conjunto de documentos por especialidad médica, podría buscar todos los conceptos en el documento que tengan un concepto vecino que sea un concepto de especialidad médica, luego reemplazar ese concepto con el concepto de especialidad y descartar los demás . La distribución de concepto así formada (normalizada para sumar 1) le da el equivalente de las probabilidades de predicción para los enfoques de clasificación “tradicionales”. Esto es solo un ejemplo, puede haber otras variaciones. Por ejemplo, también podría restringirse a las relaciones IS-A en lugar de buscar vecinos.

Un profesional importante de este enfoque es que no está supervisado. Esto le permite ir rápidamente contra un corpus sin etiqueta (y que no tiene metadatos convenientes para asignar etiquetas). Sin embargo, una desventaja importante de este enfoque es que puede ser muy sensible al dominio, es decir, la calidad de su clasificación dependerá en gran medida de qué tan bien su ontología cubra el área temática de sus documentos y sus etiquetas de clasificación.

More Interesting

¿Es inútil seguir el aprendizaje automático como segundo año?

¿Qué tema es importante para la ingeniería integrada, las redes neuronales o la automoción moderna?

¿Qué prueba estadística usar para cuantificar la similitud entre dos distribuciones cuando no son normales?

¿Cuáles son las diferencias entre el enfoque basado en reglas y el enfoque de aprendizaje automático en el análisis de sentimientos?

¿Por qué es que los RNN con conexiones desde la salida al estado oculto pueden expresar menos máquinas de turing?

¿Existen demostraciones efectivas de relevancia semántica?

Cómo aprender y construir un chatbot inteligente basado en inteligencia artificial como Google Allo desde cero, con un mayor enfoque en el modelo de dominio cerrado basado en la recuperación y el aprendizaje de ML y NLP

¿Por qué el error cuadrático medio es equivalente a minimizar la entropía cruzada entre la distribución empírica y un modelo gaussiano?

Cómo dibujar un múltiple de un autoencoder variacional en Keras

¿Cuáles son las formas de ingresar a Stanford para obtener una maestría en informática o una maestría en aprendizaje automático e inteligencia artificial?

¿Cómo puedo interpretar las predicciones en un modelo de aprendizaje automático de salud (bosque aleatorio) para infarto agudo de miocardio?

¿Qué necesito, como principiante, para comprender y construir un modelo generativo como WaveNet?

¿Qué papel juegan las redes neuronales y el aprendizaje automático en la atención médica?

¿Cuáles son los mejores cursos o referencias para la probabilidad de aprendizaje y las estadísticas para el aprendizaje automático?

Cómo entrenar una red neuronal con grandes datos