Cómo evaluar el rendimiento de un sistema que agrupa vectores de palabras

Respuesta corta: tienes que decidir qué quieres de las clases de palabras, luego puedes evaluarlas.

Respuesta más larga: puede decidir que lo que quiere son clases de palabras que se vean bien para los profesionales del diccionario. En ese caso, contrate profesionales de diccionarios, muéstreles pares de palabras y pregúnteles cómo les gustan los pares. Estás evaluando las clases de palabras según su utilidad para las cosas que realmente quieres hacer.

O puede decidir que desea clases de palabras que lo ayuden con el modelado de idiomas, la clasificación de documentos o el MT. En ese caso, alimente las clases de palabras en el sistema para la tarea posterior y vea si ayudan.

Hay varios conjuntos de datos estándar de sinónimos y palabras relacionadas que puede usar en su lugar (por ejemplo, The WordSimilarity-353 Test Collection). Si lo hace, realmente se debe pensar si los objetivos que llevaron a la creación del conjunto de datos son una buena combinación con lo que realmente estás tratando de hacer.

More Interesting

Dado que la mayoría del software de procesamiento de flujo de Apache está escrito en Java, ¿debería estudiarlo exclusivamente para Big Data y el campo de transmisión de datos?

¿Cuál es la mejor manera de ganar mucho dinero en menos tiempo?

¿Quién gana más? Analista de datos o analista de negocios?

¿Es la ciencia de datos y big data la próxima gran novedad en tecnología?

En un iPhone, ¿Siri es CASE en Interestelar? ¿Cuál es el origen de Siri?

¿Cuál es el siguiente paso después de descargar un conjunto de datos sobre regresión?

¿Cuál es la mayor barrera para la adopción de soluciones de big data en la asistencia sanitaria?

Cómo comenzar mi carrera en Data Science si mi estudio es diferente de Data Science o Computer Science

Visualización de datos: ¿Qué paquete de código abierto puedo usar para crear una nube de temas (como The Economist)?

¿Existe un papel significativo para el big data en la economía?

¿Cuál es la diferencia entre extraer datos y comprimir datos?

¿Cómo vender legalmente los datos disponibles públicamente desde aplicaciones móviles en Internet? ¿Cómo aumento el valor de los servicios de datos?

Acabo de terminar algunos cursos de especialización en análisis de datos de Coursera. ¿Debo solicitar funciones de análisis de datos o prácticas para asegurar un trabajo?

¿Qué nivel de preguntas de codificación del algoritmo Python le pedirían para una entrevista de ciencia de datos (nivel interno)?

¿Cómo difieren las redes neuronales y los algoritmos genéticos en términos de método, procesos y resultados?