Es posible pero no directo. La generación de consultas estructuradas a partir del lenguaje natural se ha investigado durante mucho tiempo. Los paquetes modernos como NLTK en Python lo hacen más fácil. Pero no te dan una solución plug and play. El marco de código abierto más prometedor que he visto es Quepy: un marco de Python para transformar preguntas de lenguaje natural en consultas. Pero eso requiere mucho desarrollo adicional.
Nosotros (en G-Square Solutions) hemos creado una herramienta interna para convertir el lenguaje natural en consultas estructuradas similares a SQL. Utilizamos una combinación de varias técnicas para lograr esto. Algunos de ellos son:
- Usando NLTK para identificar entidades nombradas
- Usando NLTK para identificar partes del discurso
- Aprender de los datos sobre qué columnas están presentes y cuáles son los distintos niveles.
- Uso del aprendizaje automático en preguntas generadas por el usuario para predecir asociaciones entre palabras y secuencia de palabras en una consulta.
- Un poco de codificación dura 🙂
También se requiere cierta cantidad de personalización específica de la aplicación en la mayoría de los casos. Por ejemplo, si sus consultas son del tipo “quién es el presidente de Zambia”, se debe adoptar un enfoque particular, mientras que si las consultas son del tipo “¿Cuál es el total de ventas de G-Square en India en 2010?”, Un enfoque diferente necesita ser tomado El primer caso es una recuperación de información simple, en el segundo caso también se requiere un poco de agregación / análisis.
- Proyectos para el procesamiento del lenguaje natural y herramientas de lenguaje para un lenguaje índico
- ¿Hay algún trabajo interesante en la clasificación utilizando la regresión logística bayesiana?
- Cómo identificar la ubicación de cualquier mensaje de texto usando ML o NLP
- ¿Tiene sentido entrenar clasificador para cada clase?
- ¿Qué es diferenciar los bosques aleatorios de otros métodos de conjunto en Data Science y por qué?