¿Cuáles son las diversas técnicas de aprendizaje automático (no sentimiento) que se pueden utilizar en documentos grandes?

La agrupación de documentos puede ser una de las técnicas que está buscando. Es para organizar documentos relacionados de manera no supervisada.
Sin embargo, para aplicar métodos de agrupamiento, los documentos deben representarse como vectores de términos que generalmente son de alta dimensión. Por lo tanto, debe proyectar los documentos en un subespacio dimensional inferior para evitar la maldición de la dimensionalidad .
Pocos de estos métodos son:
1. Agrupación espectral: primero realiza la incrustación espectral y luego aplica el algoritmo de agrupación tradicional como k-means.
2. Agrupación de modelos de mezcla: modela los datos de texto con un modelo de mezcla estadística como modelos de componentes multinomiales.

Otros métodos de reducción de dimensionalidad lineal incluyen la indexación semántica latente (LSI) y la indexación de preservación de localidad (LPI) y pueden manejar grandes cantidades de datos de documentos.

Espero eso ayude. 🙂

Aparte de los sentimientos, hay bastantes problemas con el uso de ML. Por ejemplo, validación legal de documentos / contratos, e-discovery (consulte brainspace.com), corrección de gramática / oración (seguro que gramerly lo está usando), búsqueda semántica, etc.

Echa un vistazo a Google Académico para conocer las últimas áreas de investigación para obtener una mejor comprensión.

¡Todo lo mejor!

Soporte de máquinas de vectores (SVM), ingenuos Bayes y árboles de decisión.

More Interesting

¿Cómo puede un bebé aprender a caminar sin resolver conscientemente un problema de control dinámico?

¿Cuándo comenzaste con la inteligencia artificial y el aprendizaje automático?

¿Cómo cambiará el desarrollo de la IA el mercado laboral en el futuro?

¿Alguna vez ha habido una situación en la que la IA no funcionó correctamente e hizo algo para lo que no estaba programada?

¿Puedo cursar una maestría en inteligencia artificial con una licenciatura en matemáticas?

Si todas las respuestas de Quora son solo combinaciones de 100,000 palabras, ¿por qué no cree que la inteligencia artificial no puede generar todas las respuestas?

¿Qué opina de la posibilidad de reemplazar los principales roles gubernamentales con IA?

¿Qué asignaturas de informática son necesarias para aprender Machine Learning e IA ya que mi experiencia es eléctrica?

¿Cuál es la probabilidad de que la inteligencia artificial y la realidad aumentada (no virtual) dominen el futuro? Por favor lea los detalles

¿Cuáles son las principales startups de IA en Israel?

¿Cuál es un posible escenario en el que Google podría convertirse en Skynet?

¿La IA se convertirá en el día del juicio final del futuro?

¿Qué modelo de red neuronal es eficiente para la predicción del mercado de valores mediante el análisis de sentimientos? ¿Y qué herramienta / biblioteca usar?

¿El uso del aprendizaje automático creará alguna vez una máquina en el comercio de acciones / materias primas / FX que expulse completamente a los humanos del juego?

¿Qué sistemas basados ​​en IA han superado las expectativas de sus creadores?