Este es un problema típico de clasificación de oraciones. Puede pensar en un pequeño conjunto de “características”, suponiendo que la oración dada esté en inglés, por ejemplo, si la oración acompaña o no a un signo de interrogación, si la oración contiene o no las palabras como “Do”, “Does, “” Qué “,” Cómo “, etc.
Sin embargo, cuanto mayor es el número de tales reglas, más difícil es administrar todo el conjunto de reglas. En su lugar, puede utilizar un enfoque de aprendizaje automático, donde define algunas características relacionadas (como las binarias enumeradas anteriormente) y proporciona un conjunto de capacitación. El algoritmo aprenderá un modelo para clasificar si el texto dado es interrogativo o no. Cualquier algoritmo de aprendizaje automático puede ser aplicable, como árboles de decisión, perceptrón, SVM, etc.
Aquí hay un buen punto de partida para aprender a clasificar texto [1]. Puede probar esto fácilmente a través de NLTK, un kit de herramientas de PNL basado en el lenguaje de programación Python.
- ¿Cuál es la implementación más rápida del árbol de búsqueda binario? (auto-equilibrio)
- ¿Cómo se puede usar la IA para ayudar a los reclutadores en la toma de decisiones?
- ¿Cómo se les ocurrió el algoritmo de MD5?
- Dada una lista de cadenas, ¿cómo puedo determinar si existe un orden de caracteres para el cual las cadenas están ordenadas en orden lexicográfico?
- ¿Cuál es el mejor algoritmo para calcular automáticamente un puntaje de crédito?
[1] http://nltk.googlecode.com/svn/t…