Esta es una pregunta muy generalizada. Por lo general, obtener un puntaje de una oración está asociado con un objetivo o tarea en particular. ¿Qué estás intentando lograr?
De todos modos, como lo preguntaste, aquí hay algunas ideas de puntaje a nivel conceptual, pero no todas:
- Subjetividad / Objetividad (cerca del sentimiento).
- Spam / no spam mirando el asunto del correo electrónico.
- Viralidad: ¿será esta frase pegadiza para los lectores de este blog / sitio?
- Gramaticalidad: ¿qué tan gramaticalmente correcto es en alguna escala?
- Presencia de sarcasmo? Consulte este documento para conocer unas 300 características de Detección de sarcasmo en Twitter (podría llevarlo a nuevas ideas de puntaje).
- Riqueza por alguna métrica de presencia de ciertas etiquetas POS: verbos, adverbios, frases nominales, adjetivos, etc.
- Perplejidad con respecto a un modelo de lenguaje estadístico dado.
- Número de palabras prestadas (no en el idioma principal de la oración).
Estoy seguro de que la lista se puede ampliar.
- ¿Cómo escapa / resiste una red neuronal profunda a la maldición de la dimensionalidad?
- ¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?
- ¿Cómo puede una red neuronal ser capaz de razonamiento simbólico? ¿Cómo puede unir variables?
- ¿Cuál es el papel del análisis de datos exploratorios (EDA) en el aprendizaje automático?
- Cómo eliminar una fila completa de un conjunto de datos si encuentro entradas faltantes en R