¿Cuáles son las diferentes técnicas de minería de texto?

Las técnicas en minería de texto se pueden clasificar en dos grandes categorías:

(Esta categorización es independiente del clasificador que use para la minería de texto (se prefiere SVM, NN, CNN, etc.)

  1. Sin semántica
  2. Con semántica (integración de ontología)

En la primera categoría, estamos enfocados en las siguientes actividades:

  1. Reconocimiento de entidad de nombre (entidades explícitas)
  2. Sinónimos y antónimos
  3. Sentimiento, Emociones, Intención, Objetividad y Subjetividad.
  4. Categorización y resumen

En la segunda categoría, ampliamos el alcance de las actividades mencionadas anteriormente y agregamos algunas actividades conocidas. Estos se enumeran a continuación:

  1. Extracción y vinculación de entidades (explícito e implícito)
  2. Sinónimos, antónimos, hipónimos, etc. (Uso de relaciones en la ontología)
  3. Categorización y resumen utilizando WordNet, DbPedia (YSO – Ontología general finlandesa).
  4. Identificación y clasificación de términos de argot.

Espero eso ayude !!

More Interesting

Cómo detectar regiones de texto solo de documentos escaneados

¿Cuál es la diferencia entre el análisis factorial y el análisis de conglomerados?

¿Cuáles son algunos buenos proyectos de aprendizaje automático que implican el uso de estructuras de datos y tienen aplicaciones de la vida real y se pueden hacer en 2-3 semanas?

¿Cuáles son algunos talleres sobre aprendizaje a gran escala?

¿Cuáles son algunas aplicaciones del aprendizaje semi-supervisado?

¿Cómo agrupamos el comportamiento de navegación de usuarios similares y seleccionamos características separables?

¿Qué 2 cursos entre estructuras de datos y algoritmos, diseño de software, introducción a IA, aprendizaje automático y sistemas operativos, debo elegir?

Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

¿Cuál es la diferencia entre las redes de Markov y las redes bayesianas?

¿Cuáles son algunos ejemplos de inteligencia artificial en sitios web?

¿Se utiliza Machine Learning fuera de las startups y otras "nuevas" empresas?

¿Cómo identificar el contexto basado en la oración?

¿Cuál es la diferencia entre embolsado y bootstrapping en ML / estadísticas?

¿Cómo puede ayudar el conocimiento de un proceso estocástico, el movimiento browniano y un proceso de martingala con el aprendizaje profundo y la investigación del aprendizaje automático?

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?