¿Qué son los vectores en el contexto del procesamiento del lenguaje natural?

Los vectores en PNL son los mismos que en cualquier otro contexto de Machine Learning: una representación numérica de un objeto, en forma de un conjunto ordenado de coordenadas con respecto a un espacio vectorial numérico.

Tenga en cuenta que digo numérico en lugar de real porque una coordenada (también conocida como entidad ) puede ser booleana, un entero no negativo o real no negativo, dependiendo de si codifica la aparición / no ocurrencia de un término, el número de ocurrencias de un término, o la importancia relativa de un término dentro de un documento y / o su corpus. El formulario posterior generalmente usa lo que se conoce como puntaje TF-IDF. Un término puede ser una palabra (también conocido como 1-gramo ) o una secuencia de palabras (también conocido como n-gramo ).

La forma más común de decidir sobre una base o espacio vectorial es fijar el vocabulario de posibles términos en su corpus (esto puede proporcionarse o crearse automáticamente a partir del corpus). Suponga que la representación vectorial en cuestión usa características booleanas, cada característica significa la aparición de un término en un objeto textual (un documento, un tweet o incluso un código fuente). Luego, cada objeto en un corpus está representado por un vector (es decir, un punto) en el espacio vectorial predefinido.

La desventaja de corregir el vocabulario a priori es la necesidad de ver todos los documentos en un corpus, lo cual no es factible en aplicaciones a gran escala. Una solución inteligente pero con pérdida en este caso es el Hashing de características. Consulte, por ejemplo, ¿Puede explicar el hashing de características de una manera fácilmente comprensible? para una introducción rápida

More Interesting

¿Las herramientas como BigML o Google Prediction API dejarán a los expertos en aprendizaje automático fuera del trabajo?

En una unidad LSTM, ¿cuál es la razón detrás del uso de una activación de tanh?

¿Por qué la pérdida logística es una mejor métrica para la clasificación probabilística que RMSD?

¿Es malo tener una gran cantidad de funciones en Machine Learning?

¿Qué tan útiles son los límites de convergencia en la aplicación práctica del aprendizaje automático?

¿El aprendizaje automático es malo para la economía?

¿Qué significa realmente la matriz de covarianza de la estimación de máxima verosimilitud de la distribución normal multivariante?

¿Cuál es la diferencia entre D3M y el aprendizaje profundo?

¿Cuál es el artículo o recurso web más informativo sobre el modelado similar?

¿Cómo detectaría el modelo de aprendizaje profundo los mismos objetos varias veces en un parche de imagen si existe?

Cómo aprender machine learning para construir startups

¿Por qué un niño de 6 años puede realizar tareas de reconocimiento de objetos mejor que una red neuronal distribuida a gran escala con decenas de miles de núcleos de CPU, pero incluso un cerebro adulto no puede competir con un procesador anticuado cuando se trata de cálculos de procedimientos? ¿Qué falta en nuestro procesador?

Yoshua Bengio: ¿cuáles son las preguntas abiertas más importantes en el aprendizaje profundo?

Cómo planear mover mi carrera hacia el aprendizaje automático en India

¿Tiene sentido tener un conjunto de validación y realizar una validación cruzada al construir modelos?