Clasificación de texto usando redes neuronales
Comprender cómo funcionan los chatbots es importante. Una pieza fundamental de la maquinaria dentro de un chat-bot es el clasificador de texto . Veamos el funcionamiento interno de una red neuronal artificial (ANN) para la clasificación de texto.
Usaremos 2 capas de neuronas (1 capa oculta) y un enfoque de “bolsa de palabras” para organizar nuestros datos de entrenamiento.
- ¿Cuál es una buena definición de Generalización wrt Deep Learning?
- ¿Cuáles son las aplicaciones no computacionales de las lecciones del aprendizaje automático?
- En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?
- ¿Cómo puede un estudiante de segundo año de Informática llegar al estudio del aprendizaje automático? ¿Cómo comienza uno?
- En LSTM, ¿cómo calculas qué tamaño deben tener los pesos?
La clasificación del texto viene en 3 sabores: coincidencia de patrones, algoritmos, redes neuronales. Si bien el enfoque algorítmico que utiliza Bayes ingenuos multinomiales es sorprendentemente efectivo, presenta tres fallas fundamentales:
- El algoritmo produce una puntuación en lugar de una probabilidad. Queremos una probabilidad de ignorar las predicciones por debajo de algún umbral. Esto es similar a un dial ‘silenciador’ en una radio VHF.
- el algoritmo ‘aprende’ de ejemplos de lo que está en una clase, pero no de lo que no está . Este aprendizaje de patrones de lo que no pertenece a una clase es a menudo muy importante.
- Las clases con conjuntos de entrenamiento desproporcionadamente grandes pueden crear puntajes de clasificación distorsionados, obligando al algoritmo a ajustar los puntajes en relación con el tamaño de la clase . Esto no es lo ideal.
Para comprender un enfoque de algoritmo para la clasificación: –
- referirse a las bibliotecas que necesitamos
- proporcionar datos de entrenamiento
- organizar nuestros datos
- iterar : codificar + probar los resultados + ajustar el modelo
- resumen
Lee mas…