¿Puedo usar word2vec para hacer el análisis de co-palabras?

Suponiendo por análisis de co-palabras, el autor de la pregunta significa encontrar palabras clave concurrentes.

Para responder en resumen, NO. Word2vec no está destinado a encontrar cooccurance sino a encontrar palabras similares que se hayan utilizado en contextos similares. Por ejemplo, si oraciones como:

Me gusta comer mango.

Me encanta comer naranjas.

Word2Vec aprendería que el mango y las naranjas son similares entre sí o similares, y el amor también es similar. Pero no aprenderá a comer y son palabras comunes. Estas palabras similitud no se pueden garantizar.

Teóricamente, word2vec tomaría una matriz de coaseguro para alimentar la capa de salida de neuronas. Y aprende vectores para cada palabra. Si algunas palabras se encuentran principalmente en una ventana de decir palabra a y palabra b, entonces aprenderá vectores de palabras similares para la palabra ay la palabra b. (Esta es una manera ingenua de explicar word2vec). Pero si la palabra c está cerca de la palabra a, entonces las palabras cercanas en la ventana no serán tan similares.

#Si tiene un conjunto de datos pequeño, es muy posible que word2vec aprenda sobre seguridad.

More Interesting

¿Son todos los problemas de programación cuadrática convexos?

¿El aprendizaje automático es un tema torpe?

¿Cuáles son algunas estructuras de datos esenciales y conocimiento de algoritmos necesarios para estudiar ciencia de datos?

Cómo usar el procesamiento del lenguaje natural (PNL) para resumir un documento en una serie de ideas principales

¿Cómo reconocemos a un usuario en particular en un registro de chat de Internet multiusuario largo?

Cómo usar Tensorflow para Python en Windows

Cómo construir una aplicación web con capacidades de aprendizaje automático

¿Las herramientas como BigML o Google Prediction API dejarán a los expertos en aprendizaje automático fuera del trabajo?

¿Alguien consiguió un trabajo en Machine Learning después de completar un Nanodegree de Machine Learning?

¿Cómo puedo seleccionar todos los archivos que se modifican todos con un día de diferencia en un directorio UNIX?

¿Qué métodos de conjunto / aprendizaje automático pueden incorporar covariables que varían con el tiempo?

¿Cuál es una buena secuencia de autoaprendizaje para el aprendizaje automático?

¿Qué significa decir que las redes neuronales convolucionales comparten cálculos comunes a las regiones superpuestas?

¿Es justo evaluar una red neuronal profunda solo de acuerdo con su rendimiento en algunos conjuntos de datos específicos?

¿Cómo creo un conjunto de datos como MNIST para reconocer caracteres de otro idioma? Tengo un conjunto de datos como una carpeta de imágenes. ¿Cómo uso eso en Tensorflow?