¿Cómo se evalúa si uno tiene una buena palabra incrustada?

Por favor, consulte el siguiente documento

Schnabel, Tobias, Igor Labutov, David Mimno y Thorsten Joachims. “Métodos de evaluación para incrustaciones de palabras sin supervisión”. Actas de la Conferencia de 2015 sobre métodos empíricos en el procesamiento del lenguaje natural , 2015, 298–307. ”

Resumen que la evaluación para la inclusión de palabras sin supervisión se puede dividir en dos tipos: extrínseca e intrínseca.

El método extrínseco evalúa la inclusión de palabras en tareas posteriores, como la clasificación de sentimientos a nivel de oración, etiquetado POS. Sin embargo, esto se ve afectado por el proceso de composición.

El método intrínseco evalúa la inclusión de palabras en la tarea semántica léxica, como la relación, la analogía, la categorización, la preferencia selectiva.

En mi opinión, la inclusión de palabras se puede ver como la representación característica de las palabras, por lo que también se debe evaluar si se puede utilizar para extraer significados semánticos de la inclusión de palabras, como significados afectivos, categoría semántica. Consulte el documento “Un enfoque de regresión para las valoraciones de palabras y palabras de excitación de valencia
Incrustación, IALP 2016 ”que utiliza la regresión y la inserción de palabras para inferir las calificaciones de palabras de activación de valencia y logra el mejor resultado.

Las tareas de similitud de palabras y analogía de palabras se utilizan para evaluar la calidad de las incrustaciones de palabras aprendidas. Ambos están construidos por respuestas de sujetos humanos.

More Interesting

¿Qué son las máquinas complejas?

¿Cuál es la mejor manera de aprender la programación CUDA C para implementar nuevas ideas de aprendizaje profundo?

¿Cuáles son las nuevas modificaciones en las redes neuronales recurrentes cuando se considera el aprendizaje profundo?

Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?

¿Cuáles son los métodos actuales o estándar de combinación de datos estructurados y no estructurados en redes neuronales convolucionales?

¿Qué campos de la robótica tienen mucho espacio para la investigación (mucho antes de la madurez)?

¿Cuáles son algunos buenos recursos para aprender sobre el control y la optimización de procesos sin modelos?

¿Existe una lista de conferencias de minería de datos / aprendizaje automático organizadas en los Estados Unidos?

¿Cuáles son las ventajas de la maximización de la expectativa sobre el gradiente decente para ajustar un modelo de mezcla gaussiana?

Explica qué son la precisión y el recuerdo. ¿Cómo se relacionan con la curva ROC?

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Cuál es una explicación simple de un espacio de características multidimensionales?

¿Cuáles son las aplicaciones prácticas del análisis de componentes principales?

¿Cuál es la diferencia entre la red neuronal profunda y la factorización de matriz profunda?

Como científico de datos, ¿qué te inspiró a seguir una carrera en ciencia de datos?