¿Cómo se usa el aprendizaje automático en la generación de preguntas?

A partir de hoy, la generación de preguntas se basa principalmente en reglas. El sistema puede confiar en patrones (las relaciones se extraen de un documento), transformaciones léxicas (un árbol de análisis se modifica para formar una pregunta) y, últimamente, reemplazos semánticos (por ejemplo, los elementos en las oraciones analizadas se reemplazan por entidades más generales).

El número especial sobre QG en Diálogo y Discurso, editado por el Dr. Piwek y el Dr. Boyer (Vol 3, No 2 (2012)), da cuenta del estado actual de la técnica en el campo y describe el QGSTEC 2010 (Pregunta Desafío de evaluación compartida de generación).

Arthur Graesser (“Generación de preguntas a partir de mapas conceptuales”), evaluando el problema de decidir el tipo de pregunta para una pregunta generada a partir de la oración “John comerá sushi”, escribe: “Entonces parece que se requiere cierto grado de representación del conocimiento con este nivel superior grado de precisión ”(el sistema necesita recuperar información sobre el sushi para, por ejemplo, comprender que no es una persona).

La cantidad de representación necesaria para generar una buena pregunta es un problema abierto y su respuesta decidirá cómo se pueden utilizar los métodos estadísticos en los sistemas QG.

Hasta donde he estado leyendo, en la tesis doctoral de Michael Heilman (2011), Machine Learning se utiliza para derivar un parámetro de aceptabilidad, utilizado para clasificar las preguntas producidas por el sistema de la CMU (Universidad Carnegie Mellon), y así decidir cuál es el mejor.

El objetivo principal de los sistemas de control de calidad es recuperar respuestas relevantes a preguntas de lenguaje natural de una colección de documentos en lugar de utilizar técnicas de concordancia de palabras clave para extraer documentos.

El cuestionamiento es uno de los puntos más débiles en la generación actual de asistentes digitales (DA) y tecnologías de procesamiento del lenguaje natural (PNL). Si no está familiarizado con Microsoft Maluuba, es un equipo compuesto principalmente por investigaciones de inteligencia artificial (IA) que Microsoft adquirido a principios de año. Los beneficios de la generación de preguntas son la recopilación de información contextual, las preguntas conducen a mejores respuestas, la incertidumbre a la certeza, la clasificación y el auto entrenamiento.

Benefíciese de los sistemas automatizados de generación de preguntas (QG) que pueden ayudarlo a satisfacer sus necesidades de consulta. Otro beneficio de QG es que puede ser una buena herramienta para ayudar a mejorar la calidad de los sistemas de control de calidad. Estos beneficios de un sistema QG nos motivan a abordar el importante problema de la generación de tema a pregunta, donde el objetivo principal es generar todas las preguntas posibles sobre un tema determinado.

Para más detalles: BEPEC | ¿Por qué ciencia de datos? Bangalore

Un ejemplo reciente: Uso de la red neuronal artificial para generar preguntas: https://aclweb.org/anthology/P/P

Si entiendo esto correctamente: las variables X son respuestas y las variables Y son preguntas, el conjunto de datos comerciales tiene algunas X y Nosotros, y el conjunto de datos de prueba tiene algunas otras X (respuestas).

Esto es posible mediante el uso de algún tipo de procesamiento del lenguaje natural junto con otras bibliotecas estándar de aprendizaje automático.

More Interesting

¿Se pueden usar las redes neuronales para resolver problemas de aprendizaje no supervisados?

¿Es posible generar datos de expresión genética artificial? Las imágenes a veces se pueden perturbar para aumentar el tamaño de las muestras con fines de aprendizaje automático.

¿Qué es un buen marco de visualización de datos en tiempo real?

Cómo evaluar la agrupación de k-medias en R

¿Existe un concepto de API semántica - API que acepta oraciones simples como consultas?

¿Cómo funcionan las capas de incrustación en TensorFlow?

¿Cómo se puede aplicar el aprendizaje automático al póker?

Procesamiento de señal digital: ¿Conoce las razones por las que la deconvolución de imagen (deblur) no siempre funciona?

¿Qué funciona mejor: Autoencoder Variacional o Redes Adversarias Generativas?

¿Cuál es la forma mejor y más simple de agrupar productos por sus nombres?

¿Cuáles son las relaciones entre el aprendizaje automático, el aprendizaje profundo, el aprendizaje supervisado y el aprendizaje no supervisado?

Suponga que la máquina es multinúcleo, el tiempo de ejecución de un programa en una máquina que ejecuta solo ese proceso es igual al tiempo de ejecución en una máquina en la que hay otros procesos ejecutados junto con él, ¿no es así?

¿La red neuronal profunda es realmente un aprendizaje profundo?

¿Qué paradigma / algoritmo de aprendizaje automático puedo usar para seleccionar de un grupo de posibles opciones?

¿Qué tipo de problemas puede resolver AI / Machine Learning en los países en desarrollo?