¿Cómo se pueden aprender las características del corpus en bruto mediante el aprendizaje automático / aprendizaje profundo?

Las características pueden depender del tipo de problema con el que está lidiando. Puede ser

-Cuenta simple de palabras (bolsa de palabras)

-Uni Grams, Bi Grams, Tri Grams cuenta

-Matriz de documentos a plazo

-Partes del discurso de las palabras también son características

-Frases nominales en oración

Si su problema es el reconocimiento de entidades con nombre, le sugiero que mire el algoritmo CRF (campo aleatorio condicional)

Aquí puede crear características personalizadas para entrenar al modelo

Las características de ejemplo pueden ser

[Palabra,

Palabra anterior,

Etiqueta de POS de Word anterior,

Siguiente palabra,

Etiqueta de POS de la siguiente palabra,

IsWordCaps,

FirstWordCaps,

WordStartsWith

Word termina con

Primeras tres letras de la palabra

Últimas tres letras de la palabra

]

Puede agregar tantas funciones como desee.

Hay un enlace de python para CRF (“python-crfsuite”), puede seguir el ejemplo en la documentación

Si desea aprender las características, mire automáticamente el modelado de temas / LDA. Esto funciona basado en clustering suave. La salida le mostrará la distribución de frecuencia de las palabras en cada grupo

hay un genismo de implementación de python para modelar temas

Related Content

Cómo comenzar a crear un bot de Python

¿Cómo se puede usar Machine Learning en la historia?

¿Cuál es la diferencia entre el aprendizaje en línea y el aprendizaje fuera de línea en la red neuronal?

¿Qué tan pronto los robots reemplazarán la mano de obra en trabajos físicos de alta habilidad como la construcción?

¿Deberíamos dejar que exista una IA omnisciente?

Si los robots están reemplazando a los humanos, ¿necesitamos el crecimiento de la población para impulsar el crecimiento económico?

¿Cuál es la probabilidad de que alguien piratee computadoras NORAD e indique que los rusos están atacando a los Estados Unidos?

More Interesting

Si no podemos aceptar la aparición de IA y robots, ¿no deberíamos volver a la Edad de Piedra y dormir en cuevas?

¿Por qué la arquitectura ARM no es adecuada para el aprendizaje automático?

¿Pueden las computadoras reemplazar a los abogados?

¿La IA es realmente una amenaza tan grande como Elon Musk cree que es?

¿Estamos muriendo constantemente debido a los grandes cambios que sufre nuestro cerebro todos los días?

¿Qué es un agente de inteligencia?

¿Por qué las variables ficticias realmente producen más precisión en algunos casos para el aprendizaje automático?

¿Qué juego tiene la mejor inteligencia artificial para sus NPC?

¿El entorno secreto de Apple les impide ser líderes en inteligencia artificial y aprendizaje automático?

¿Cuáles son algunos buenos chistes de aprendizaje automático?

¿Pueden las sociedades ser redes neuronales donde las personas individuales son nodos?

Sinestesia: ¿Existe algún producto que pueda simular una percepción sinestésica utilizando algoritmos de IA?

¿Alguna vez habrá un programa que use estilometría para descubrir toda mi actividad anónima en Internet?

¿Me puede sugerir un problema / proyecto de aprendizaje de robots de nivel principiante?

¿Existe una solución analítica para la regresión logística, similar a la de la ecuación normal para la regresión lineal?