¿Hay orden entre las características de las incrustaciones de palabras?

Por lo que sé:

  1. No hay orden entre estas características 100d. Si reorganiza el orden de las columnas de la matriz de contexto en Glove, puede obtener incrustaciones de palabras diferentes. Como se demostró en el artículo de Levy (2014) que w2v es igual a la factorización matricial en la matriz de contexto de palabras, el orden de incrustación de palabras por w2v también depende del orden de las columnas en la matriz. Como puede cambiar el orden de las columnas de contexto, también puede cambiar el orden de incrustación de w2v.
  2. Está bien cambiar el orden.
  3. No creo que aquí haya relaciones lineales o no lineales (no lo pruebo).
  4. Actualmente no existe una interpretación explícita de estas características. Sin embargo, puede usar directamente la incrustación como características de palabras para hacer otra cosa, como entrenar un modelo de regresión para predecir la etiqueta o intensidad de la palabra u otra información semántica de las palabras.

1 y 2: No hay orden en estas características. Puede cambiar libremente el orden y no perderán nada de su poder expresivo.

3: No lo creo.

4: Son variables latentes, no se pueden interpretar con solo mirarlas. Sin embargo, puede usarlos como características para otras tareas (entrada a regresión, redes neuronales, etc.). Luego puede verificar estas soluciones para ver qué características son importantes para sus resultados.

More Interesting

¿Puedes explicar el hashing de características de una manera fácil de entender?

¿Hay escasez de científicos de datos?

¿Cuáles son algunos trabajos de investigación basados ​​en ciencia de datos y aprendizaje automático en los que R se utiliza como lenguaje de programación?

¿Cuál es una buena distribución para usar para simular un conjunto de entrenamiento para la clasificación supervisada?

¿Por qué hay una compensación entre exploración y explotación en el aprendizaje por refuerzo?

¿Cuáles son actualmente los temas candentes en la investigación de aprendizaje automático y en aplicaciones reales?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

¿Qué es una explicación intuitiva de los modelos de proceso gaussianos?

¿Qué factores además del conjunto de datos afectan cómo se elige el tamaño de lote para el descenso de gradiente estocástico (SGD) mini-lote?

¿Cómo probar formalmente que el producto de dos núcleos es un núcleo? Si K1 (x, x1) y K2 (x, x2) son ambas funciones del núcleo, entonces K1 (x, x1) K2 (x, x2) también es un núcleo

¿La máquina está aprendiendo la 'versión del hombre tonto' de intentar recrear la inteligencia?

Hay muchas críticas positivas para Pytorch. Actualmente uso Keras y TensorFlow. ¿Recomienda hacer un cambio o apegarse a Tensorflow y dominarlo?

¿Puedo crear un programa de aprendizaje automático en otro idioma que no sea un flujo de tensor o scikit-learn?

¿El aprendizaje automático es el futuro del mundo de la programación?

¿Qué herramienta es mejor para aprender una red neuronal AI, C ++ o MATLAB?