Cómo construir una consulta a partir de una pregunta de lenguaje natural en Python

Es posible pero no directo. La generación de consultas estructuradas a partir del lenguaje natural se ha investigado durante mucho tiempo. Los paquetes modernos como NLTK en Python lo hacen más fácil. Pero no te dan una solución plug and play. El marco de código abierto más prometedor que he visto es Quepy: un marco de Python para transformar preguntas de lenguaje natural en consultas. Pero eso requiere mucho desarrollo adicional.

Nosotros (en G-Square Solutions) hemos creado una herramienta interna para convertir el lenguaje natural en consultas estructuradas similares a SQL. Utilizamos una combinación de varias técnicas para lograr esto. Algunos de ellos son:

  1. Usando NLTK para identificar entidades nombradas
  2. Usando NLTK para identificar partes del discurso
  3. Aprender de los datos sobre qué columnas están presentes y cuáles son los distintos niveles.
  4. Uso del aprendizaje automático en preguntas generadas por el usuario para predecir asociaciones entre palabras y secuencia de palabras en una consulta.
  5. Un poco de codificación dura 🙂

También se requiere cierta cantidad de personalización específica de la aplicación en la mayoría de los casos. Por ejemplo, si sus consultas son del tipo “quién es el presidente de Zambia”, se debe adoptar un enfoque particular, mientras que si las consultas son del tipo “¿Cuál es el total de ventas de G-Square en India en 2010?”, Un enfoque diferente necesita ser tomado El primer caso es una recuperación de información simple, en el segundo caso también se requiere un poco de agregación / análisis.

More Interesting

¿Qué tipo de programas de back-end ejecuta YouTube, como el aprendizaje automático y otros programas funcionales?

¿Hay nueva información sobre el tema X o la gente sigue copiando y pegando?

Redes neuronales convolucionales: ¿Qué están haciendo los regresores de cuadro delimitador en Fast-RCNN?

¿Cuáles son los mejores cursos de ciencia de datos en Udemy?

Cómo detectar logotipos si están distorsionados

¿Cuántos idiomas hay para las redes neuronales?

¿Algún investigador utiliza ReLU en un modelo de aprendizaje no profundo? ¿ReLU es solo para aprendizaje profundo?

¿Cuáles podrían ser las características posibles para detectar fraude en transacciones en cajeros automáticos?

En cuanto al aprendizaje automático o el aprendizaje profundo, ¿existe el fenómeno de que el modelo funciona bien pero el diseñador no puede explicar la razón?

¿Qué consejo le darías a alguien que acaba de comenzar el curso de Andrew Ng sobre aprendizaje automático?

¿En qué técnicas de aprendizaje automático se puede confiar para identificar (y posiblemente tratar) la deriva del concepto?

¿Cómo se puede modelar la interacción Radar y Jammer a través del aprendizaje automático?

¿Cuál es el mejor instituto de capacitación para el aprendizaje automático en Hyderabad?

¿El rendimiento de la regresión logística se ve afectado negativamente por características altamente correlacionadas?

¿Qué tipo de aumento de datos se puede usar para imágenes médicas?