¿Qué método aparte del análisis de sentimientos puedo usar para obtener el puntaje de una oración?

Esta es una pregunta muy generalizada. Por lo general, obtener un puntaje de una oración está asociado con un objetivo o tarea en particular. ¿Qué estás intentando lograr?

De todos modos, como lo preguntaste, aquí hay algunas ideas de puntaje a nivel conceptual, pero no todas:

  1. Subjetividad / Objetividad (cerca del sentimiento).
  2. Spam / no spam mirando el asunto del correo electrónico.
  3. Viralidad: ¿será esta frase pegadiza para los lectores de este blog / sitio?
  4. Gramaticalidad: ¿qué tan gramaticalmente correcto es en alguna escala?
  5. Presencia de sarcasmo? Consulte este documento para conocer unas 300 características de Detección de sarcasmo en Twitter (podría llevarlo a nuevas ideas de puntaje).
  6. Riqueza por alguna métrica de presencia de ciertas etiquetas POS: verbos, adverbios, frases nominales, adjetivos, etc.
  7. Perplejidad con respecto a un modelo de lenguaje estadístico dado.
  8. Número de palabras prestadas (no en el idioma principal de la oración).

Estoy seguro de que la lista se puede ampliar.

Depende de lo que intentes hacer. ¿Para qué se va a utilizar el puntaje? Los puntajes de los sentimientos generalmente se usan para medir el estado de ánimo del texto, y son útiles solo para eso.

La similitud de coseno [1] a veces se usa para evaluar la similitud de las oraciones junto con las puntuaciones de Jaccard [2].

Por lo tanto, depende de lo que quieras hacer.

Notas al pie

[1] Similitud de coseno – Wikipedia

[2] Índice Jaccard – Wikipedia

More Interesting

¿Hay alguna diferencia entre los codificadores automáticos y el codificador-decodificador en el aprendizaje profundo?

En el aprendizaje profundo, ¿se pueden obtener buenos resultados cuando usas una función lineal entre las capas ocultas?

Los hiperparámetros del modelo de sintonización no encontraron los parámetros óptimos que uso en mi modelo. ¿Por qué?

¿Dónde puedo encontrar un buen tutorial para la red neuronal de convolución regional?

¿El sobreajuste en un conjunto de datos implica que el modelo realmente puede aprender y generalizar sobre ese conjunto de datos, pero desafortunadamente demasiado entrenado?

¿Qué son las redes amplias?

¿Es un análisis de regresión múltiple más útil / perspicaz para la relación entre IV y DV que un ANOVA?

Tengo una entrevista telefónica técnica para una pasantía la próxima semana con el aprendizaje automático y el equipo de fraude de Uber. ¿Debo esperar DS y algoritmos generales o algo más?

¿Puedo usar el concepto de aprendizaje automático para predecir cuánta cantidad de comida cocinar por día en un restaurante?

Cómo probar la profundidad del fondo del procesamiento del lenguaje natural de alguien en una entrevista

¿Cuál es una buena puntuación porcentual en los problemas de conocimiento de Kaggle para principiantes?

¿Cuál es la mejor manera de aprender el aprendizaje automático, en línea o sin conexión?

Conjuntos de datos: ¿Cuáles son los principales corpus de texto utilizados por los lingüistas computacionales y los investigadores del procesamiento del lenguaje natural, y cuáles son las características / sesgos de cada corpus?

¿Por qué el aprendizaje del 'lenguaje ensamblador y máquina' se enfatiza menos en las universidades en comparación con el aprendizaje de lenguajes de programación generales?

¿Cuál es una buena manera de entender la pérdida de Minkowski con una configuración diferente?