He hecho algo similar a esto: diseñé un sistema que sugería coincidencias entre estudiantes y tutores, en base a la información que teníamos sobre ambos: con qué luchaba el estudiante, con qué era bueno el entrenador para enseñar, su coincidencia de personalidad, qué días de la semana que ambos estuvieron libres, etc.
Con este tipo de cosas, lo mejor es comenzar de manera simple. ¿Cuál es la solución más fácil que podría funcionar?
Intentaría crear una función de puntuación, que evalúe la calidad de una coincidencia entre una pregunta y un estudiante. Básicamente es una ecuación que arroja un número alto si la pregunta es adecuada para este estudiante, y un número bajo de lo contrario. La idea es que podría incluir solo las preguntas que obtengan una buena puntuación para este estudiante en su examen.
- ¿Qué hará Keras con TensorFlow-Slim?
- ¿Cuándo es el final de la red neuronal profunda? La gente está loca por esto y muchos de ellos no saben lo que está pasando dentro
- Cómo comenzar con el modelado predictivo
- ¿Cómo es tomar CS 228: modelo gráfico probabilístico en Stanford?
- ¿Qué tan útiles son los límites de convergencia en la aplicación práctica del aprendizaje automático?
Supongo que esto no será lo suficientemente bueno, pero por qué no es lo suficientemente bueno le dirá qué es importante enfatizar cuando lo hace más inteligente.
Por ejemplo, lo anterior podría no ser bueno para construir exámenes con una combinación de dificultades de preguntas: no hay forma de evaluar qué tan difícil es un examen en su conjunto (qué tan cerca de esa meta del 75% espera obtener) simplemente mirando el preguntas individuales Eso significa que probablemente también necesite una forma de clasificar grupos de preguntas (exámenes en su conjunto, o posiblemente subsecciones de exámenes también), así como las preguntas individualmente.
Luego aplique el mismo proceso a grupos de preguntas: ¿qué propiedades de los exámenes en su conjunto le interesan? ¿Cómo los medirías?
En el aprendizaje automático, definir claramente lo que quiere y con qué datos tiene que trabajar es más importante que elegir la herramienta perfecta para encontrar una respuesta. Una vez que tenga una lista cualitativa de las cosas que valora en un examen / pregunta, y una lluvia de ideas sobre las formas en que podría medirlas, estará en una buena posición para analizar qué herramientas usar.
En términos de los comentarios de los maestros, realmente desea canalizar esto en categorías significativas con formas claras de abordarlos. Por ejemplo, en lugar de una entrada de texto de forma libre del revisor (una computadora no tendrá una forma efectiva de interpretar esto), pídales que califiquen la pregunta en una variedad de categorías, por ejemplo:
- Dificultad para este estudiante
- Relevancia para las otras preguntas en el examen
Del mismo modo, pídales que evalúen el examen de la misma manera, y deje un cuadro de texto al final para cualquier otra cosa, que puede revisar manualmente para mejorar su enfoque. Puede crear más categorías como estas mirando las revisiones reales que la gente ya ha hecho.
Por lo general, la automatización se realiza mejor en etapas: si actualmente tiene personas que crean los exámenes manualmente, comience con el objetivo de un sistema que cree exámenes de plantilla que sean 90% correctos, para retocar por personas reales. Aprenderá mucho sobre lo que su sistema no está haciendo bien al hablar con esos creadores de exámenes, lo que realmente puede ayudarlo a mejorar su modelo de maneras que son importantes para el usuario.