¿Qué paradigma / algoritmo de aprendizaje automático puedo usar para seleccionar de un grupo de posibles opciones?

He hecho algo similar a esto: diseñé un sistema que sugería coincidencias entre estudiantes y tutores, en base a la información que teníamos sobre ambos: con qué luchaba el estudiante, con qué era bueno el entrenador para enseñar, su coincidencia de personalidad, qué días de la semana que ambos estuvieron libres, etc.

Con este tipo de cosas, lo mejor es comenzar de manera simple. ¿Cuál es la solución más fácil que podría funcionar?

Intentaría crear una función de puntuación, que evalúe la calidad de una coincidencia entre una pregunta y un estudiante. Básicamente es una ecuación que arroja un número alto si la pregunta es adecuada para este estudiante, y un número bajo de lo contrario. La idea es que podría incluir solo las preguntas que obtengan una buena puntuación para este estudiante en su examen.

Supongo que esto no será lo suficientemente bueno, pero por qué no es lo suficientemente bueno le dirá qué es importante enfatizar cuando lo hace más inteligente.

Por ejemplo, lo anterior podría no ser bueno para construir exámenes con una combinación de dificultades de preguntas: no hay forma de evaluar qué tan difícil es un examen en su conjunto (qué tan cerca de esa meta del 75% espera obtener) simplemente mirando el preguntas individuales Eso significa que probablemente también necesite una forma de clasificar grupos de preguntas (exámenes en su conjunto, o posiblemente subsecciones de exámenes también), así como las preguntas individualmente.

Luego aplique el mismo proceso a grupos de preguntas: ¿qué propiedades de los exámenes en su conjunto le interesan? ¿Cómo los medirías?

En el aprendizaje automático, definir claramente lo que quiere y con qué datos tiene que trabajar es más importante que elegir la herramienta perfecta para encontrar una respuesta. Una vez que tenga una lista cualitativa de las cosas que valora en un examen / pregunta, y una lluvia de ideas sobre las formas en que podría medirlas, estará en una buena posición para analizar qué herramientas usar.


En términos de los comentarios de los maestros, realmente desea canalizar esto en categorías significativas con formas claras de abordarlos. Por ejemplo, en lugar de una entrada de texto de forma libre del revisor (una computadora no tendrá una forma efectiva de interpretar esto), pídales que califiquen la pregunta en una variedad de categorías, por ejemplo:

  • Dificultad para este estudiante
  • Relevancia para las otras preguntas en el examen

Del mismo modo, pídales que evalúen el examen de la misma manera, y deje un cuadro de texto al final para cualquier otra cosa, que puede revisar manualmente para mejorar su enfoque. Puede crear más categorías como estas mirando las revisiones reales que la gente ya ha hecho.


Por lo general, la automatización se realiza mejor en etapas: si actualmente tiene personas que crean los exámenes manualmente, comience con el objetivo de un sistema que cree exámenes de plantilla que sean 90% correctos, para retocar por personas reales. Aprenderá mucho sobre lo que su sistema no está haciendo bien al hablar con esos creadores de exámenes, lo que realmente puede ayudarlo a mejorar su modelo de maneras que son importantes para el usuario.

Me parece que su descripción del problema encaja directamente en el ámbito de los sistemas de recomendación, donde le gustaría recomendar un conjunto de preguntas a cada grupo de estudiantes de acuerdo con las características de las preguntas y las características de los estudiantes.

Podría comenzar con algo como el algoritmo de filtrado colaborativo.

Como no conozco sus datos, no puedo ayudarlo más, pero también hay otras formas de implementar sistemas de recomendación, pero son más avanzados.

Se explica aquí (siga los enlaces de YouTube para obtener el resto de las conferencias):

More Interesting

¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?

¿Debo elegir PHP para el aprendizaje automático?

¿Cuándo debo coseno similitud? ¿Se puede usar para la agrupación?

¿Qué tan difícil sería implementar el aprendizaje por refuerzo para un juego de mesa?

¿Qué áreas del aprendizaje automático son más importantes para los fondos de cobertura y los bancos de inversión (en equipos cuantitativos)?

¿Cuál es el significado / interpretación de la varianza de validación cruzada?

¿Cuál es la diferencia entre los ingenuos Bayes y los algoritmos de máquina de vectores de soporte?

¿Hay algún solucionador que minimice la función objetivo [matemática] f (x) = \ matemática {e} ^ x [/ matemática] donde [matemática] x> 0 [/ matemática]?

¿Cuál es la tecnología detrás de la aplicación Summly recién adquirida por Yahoo?

Cómo dominar el aprendizaje automático para poder unirme a Google para puestos relacionados con el aprendizaje automático

¿Cuál es la diferencia entre el aprendizaje de refuerzo basado en modelos y sin modelos?

¿Qué significa "tomar la media geométrica de la distribución predictiva producida por las redes de abandono exponencialmente numerosas" en redes neuronales profundas?

¿Cuáles son las ventajas y desventajas de las API de servicios cognitivos de Microsoft?

¿Qué se debe considerar al decidir entre usar un algoritmo de filtrado colaborativo basado en el usuario y en el elemento?

¿Es c # una buena opción para el aprendizaje automático de producción?