¿Cómo podemos usar la red neuronal para la clasificación de texto?

Clasificación de texto usando redes neuronales

Comprender cómo funcionan los chatbots es importante. Una pieza fundamental de la maquinaria dentro de un chat-bot es el clasificador de texto . Veamos el funcionamiento interno de una red neuronal artificial (ANN) para la clasificación de texto.

Usaremos 2 capas de neuronas (1 capa oculta) y un enfoque de “bolsa de palabras” para organizar nuestros datos de entrenamiento.

La clasificación del texto viene en 3 sabores: coincidencia de patrones, algoritmos, redes neuronales. Si bien el enfoque algorítmico que utiliza Bayes ingenuos multinomiales es sorprendentemente efectivo, presenta tres fallas fundamentales:

  • El algoritmo produce una puntuación en lugar de una probabilidad. Queremos una probabilidad de ignorar las predicciones por debajo de algún umbral. Esto es similar a un dial ‘silenciador’ en una radio VHF.
  • el algoritmo ‘aprende’ de ejemplos de lo que está en una clase, pero no de lo que no está . Este aprendizaje de patrones de lo que no pertenece a una clase es a menudo muy importante.
  • Las clases con conjuntos de entrenamiento desproporcionadamente grandes pueden crear puntajes de clasificación distorsionados, obligando al algoritmo a ajustar los puntajes en relación con el tamaño de la clase . Esto no es lo ideal.

Para comprender un enfoque de algoritmo para la clasificación: –

  1. referirse a las bibliotecas que necesitamos
  2. proporcionar datos de entrenamiento
  3. organizar nuestros datos
  4. iterar : codificar + probar los resultados + ajustar el modelo
  5. resumen

Lee mas…

Un buen blog para esto está disponible en Clasificación de texto usando redes neuronales – Aprendizaje automático

Está hecho en openclassifier. Verifique el código fuente en Maulik-Miracle / openclassifier