Suponiendo por análisis de co-palabras, el autor de la pregunta significa encontrar palabras clave concurrentes.
Para responder en resumen, NO. Word2vec no está destinado a encontrar cooccurance sino a encontrar palabras similares que se hayan utilizado en contextos similares. Por ejemplo, si oraciones como:
Me gusta comer mango.
- Cómo hacer clustering de tipos de datos mixtos en Python
- ¿Cómo se usa el aprendizaje automático en FinTech (P2P, pagos), particularmente fuera de algo trading? ¿Alguien tiene ejemplos específicos en punto a punto, verificación de crédito, pagos, etc.?
- ¿Cómo se puede utilizar el aprendizaje automático para construir un sistema de predicción del comportamiento del cliente?
- Las redes neuronales se han vuelto muy populares en los últimos años, sin embargo, gran parte de la teoría se desarrolló hace 20 años. ¿Qué avances explican los éxitos recientes?
- ¿Cómo se determina la significación estadística para las curvas ROC y los valores de AUC?
Me encanta comer naranjas.
Word2Vec aprendería que el mango y las naranjas son similares entre sí o similares, y el amor también es similar. Pero no aprenderá a comer y son palabras comunes. Estas palabras similitud no se pueden garantizar.
Teóricamente, word2vec tomaría una matriz de coaseguro para alimentar la capa de salida de neuronas. Y aprende vectores para cada palabra. Si algunas palabras se encuentran principalmente en una ventana de decir palabra a y palabra b, entonces aprenderá vectores de palabras similares para la palabra ay la palabra b. (Esta es una manera ingenua de explicar word2vec). Pero si la palabra c está cerca de la palabra a, entonces las palabras cercanas en la ventana no serán tan similares.
#Si tiene un conjunto de datos pequeño, es muy posible que word2vec aprenda sobre seguridad.