¿Cuál podría ser un proyecto divertido para un hackathon de dos días sobre procesamiento del lenguaje natural?

Estoy de acuerdo en que es difícil, pero se puede escribir un sistema simple de control de calidad no factoide. Un sistema de control de calidad no factoide es principalmente IR puro. Consulte, por ejemplo, el siguiente documento: Página en aclweb.org

Puede implementar fácilmente alguna versión simple usando Solr y características basadas en texto. No se preocupe por las anotaciones sofisticadas (tal vez solo algunas etiquetas POS).

También puede escribir algunos módulos para un sistema de control de calidad. Por ejemplo, un módulo de reformulación de preguntas. Ante la pregunta: quién escribió “adiós a las armas” puede escribir reglas (o entrenar a un modelo) para reformular estas preguntas en forma declarativa, por ejemplo, X escribió “adiós a las armas”.

Es posible que necesite aprender algo por adelantado, sin embargo, la implementación en sí misma puede ser bastante rápida.

PD: no te preocupes por las características basadas en la traducción. Me parece que el software de traducción de código abierto tiene casi cero documentación y es difícil de ejecutar.

Esa es una dificil. El lapso de tiempo es realmente corto, lo que dificulta hacer algo serio.
Uno que podría ser divertido de probar es averiguar si un espacio de texto dado está hablando de algo de manera positiva o negativa. Por ejemplo, mira las críticas de películas. Por lo general, tiene una calificación de 1-5 estrellas que indica cuán positivos se sintieron y un texto asociado con él. Puede ver qué tan bien su sistema puede predecir los puntajes asociados con las revisiones.