¿Hay orden entre las características de las incrustaciones de palabras?

Por lo que sé:

No hay orden entre estas características 100d. Si reorganiza el orden de las columnas de la matriz de contexto en Glove, puede obtener incrustaciones de palabras diferentes. Como se demostró en el artículo de Levy (2014) que w2v es igual a la factorización matricial en la matriz de contexto de palabras, el orden de incrustación de palabras por w2v también depende del orden de las columnas en la matriz. Como puede cambiar el orden de las columnas de contexto, también puede cambiar el orden de incrustación de w2v.
Está bien cambiar el orden.
No creo que aquí haya relaciones lineales o no lineales (no lo pruebo).
Actualmente no existe una interpretación explícita de estas características. Sin embargo, puede usar directamente la incrustación como características de palabras para hacer otra cosa, como entrenar un modelo de regresión para predecir la etiqueta o intensidad de la palabra u otra información semántica de las palabras.

Aprendizaje automáticoAprendizaje profundoMinería de datosProcesamiento de lenguaje naturalRedes neuronales artificiales

¿Qué tan lejos estamos de usar el reconocimiento de voz como interfaz de usuario en un teléfono para cerca del 100% de todas las funciones (sin entradas de teclado o deslizamiento)?

¿Cuál es la relación entre el modelo Log Linear, el modelo MaxEnt y la regresión logística?

¿Cómo funciona la codificación de características de alta cardinalidad con regresión de cresta?

¿Por qué está disminuyendo el número de concursos públicos de Kaggle con premios en efectivo?

ELI5: ¿Qué son las redes neuronales?

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

1 y 2: No hay orden en estas características. Puede cambiar libremente el orden y no perderán nada de su poder expresivo.

3: No lo creo.

4: Son variables latentes, no se pueden interpretar con solo mirarlas. Sin embargo, puede usarlos como características para otras tareas (entrada a regresión, redes neuronales, etc.). Luego puede verificar estas soluciones para ver qué características son importantes para sus resultados.

Matúš Pikuliak

More Interesting

¿Puedes explicar el hashing de características de una manera fácil de entender?

¿Hay escasez de científicos de datos?

¿Cuáles son algunos trabajos de investigación basados en ciencia de datos y aprendizaje automático en los que R se utiliza como lenguaje de programación?

¿Cuál es una buena distribución para usar para simular un conjunto de entrenamiento para la clasificación supervisada?

¿Por qué hay una compensación entre exploración y explotación en el aprendizaje por refuerzo?

¿Cuáles son actualmente los temas candentes en la investigación de aprendizaje automático y en aplicaciones reales?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

¿Qué es una explicación intuitiva de los modelos de proceso gaussianos?

¿Qué factores además del conjunto de datos afectan cómo se elige el tamaño de lote para el descenso de gradiente estocástico (SGD) mini-lote?

¿Cómo probar formalmente que el producto de dos núcleos es un núcleo? Si K1 (x, x1) y K2 (x, x2) son ambas funciones del núcleo, entonces K1 (x, x1) K2 (x, x2) también es un núcleo