Esto se debe a que hemos estado utilizando el modelado de nivel de palabra en PNL desde hace tiempo. El número de palabras es alto. Además, la forma tradicional de representar palabras (bolsa de palabras como) requiere vectores dispersos de tamaño k (donde k es el tamaño del vocabulario).
Luego hay n-gramos que se utilizan. (hay k ^ n posibles n-gramas si hay k palabras en el idioma).
Sin embargo, si observa una investigación reciente, ha habido intentos de abordar este problema. Podemos usar el aprendizaje de representación o bajar a modelos de nivel de caracteres para modelos más pequeños.
Dos métodos alternativos que vale la pena mencionar son:
1. Incrustaciones de palabras: usar un vector pequeño y denso para representar palabras (y, por lo tanto, ngrams y oraciones) en lugar de los grandes vectores BOW.
Puede ver nuestra implementación de código abierto recientemente de una incrustación de palabras basada en conteo tan ligera para probarla: ParallelDots / WordEmbeddingAutoencoder
Utilizamos redes neuronales recursivas para combinar incrustaciones de palabras en n gramos e incrustaciones de oraciones en ParallelDots. Por lo tanto, cada característica del lenguaje es un vector dimensional bajo (digamos 100-500).
- ¿Cuál es el papel del aprendizaje automático en defensa?
- ¿Por qué la mayoría de la gente todavía piensa que nuestro proceso de "pensamiento" es inherentemente diferente al de una computadora?
- ¿Cuál es la mejor plataforma / sitio web para el aprendizaje automático de autoaprendizaje?
- ¿Qué tan bien defienden las especificaciones profundas o los sistemas informáticos verificados formalmente que se ejecutan en unidades de estado sólido contra ataques avanzados de canal lateral?
- ¿Cuál es la diferencia entre los formatos de video: 2160p a 30 fps y DCI 2160p a 24 fps?
2. Modelado de nivel de caracteres: si bien el número típico de palabras en inglés es de 150k, el número de caracteres es máximo de 256. Los modelos de nivel de caracteres parecen estar haciendo maravillas en los últimos días. Lea esta publicación de Andrej Karpathy si desea obtener más información al respecto. (También contiene enlaces a código si desea probarlo) La efectividad irracional de las redes neuronales recurrentes