¿Cómo puede un oficial de admisiones universitarias usar la programación de computadoras y la ciencia de datos para mejorar su grupo de solicitantes?

Me encuentro volviendo a este cómic de XKCD la mayoría de las veces. Tómelo con un poco de humor, mientras reemplaza la palabra: “Estudiantes de posgrado” por “Expertos de dominio” mientras lo lee a continuación:

URL: xkcd: Impostor

El primer grupo de personas a las que recurriría, cuando la caricatura intenta insinuarlo, es el `experto en dominios`. Estoy hablando, en este caso, del departamento de admisión de dicha escuela y simplemente pregunto a cada uno de los miembros:

“¿Cómo define a un estudiante en un grupo de admisión?”

Seguido por:

“¿Cuáles son las formas actuales que utiliza para aumentar el grupo de admisión?”

A partir de aquí, seguirán un par de declaraciones. Hice un ejercicio rápido con alguien que conozco tenía un trabajo como uno, para usarlo como un ejercicio de ejemplo para esta respuesta.

De la primera pregunta obtuve un par de ejemplos de lo que define a una persona en el grupo de admisión, pero más importante cuando la persona ya no está en un grupo de admisión: “Después de que comience la clase”. La razón es que, hasta entonces, el estudiante puede darse por vencido, en cuyo caso el grupo sería más pequeño de lo que se esperaba.

Esta definición nos da una marca de tiempo específica en algunos datos que buscaremos para darnos un número del grupo de aplicaciones de un semestre determinado. Genial, ahora podemos observar cómo fluctúa sujeto a algunas restricciones. Obtuvimos, libremente, la variable que estamos tratando de optimizar.

Para la segunda pregunta , la persona respondió (entre otras cosas):

  • Tenemos un sistema en el lugar donde podemos ver qué tan lejos están los estudiantes en el proceso de admisión.
  • Organizamos eventos, en cuyo caso tenemos acceso a posibles solicitantes que aún no están en el sistema.

Tenga en cuenta que la parte del analista de datos comenzó haciendo las preguntas correctas para obtener información que él / ella puede entregar en números. La lista puede ser mucho más grande, pero lo que sigue es una evaluación del esfuerzo por parte del analista para convertir la pregunta en números (por ejemplo, sacar los datos de los sistemas existentes, preprocesar y remodelar), y también hablar con la derecha personas y la gestión de sus agendas ocupadas existentes.

Luego, los datos, números y visualizaciones se realizan a partir de los procesos existentes para observar cuáles son exitosos y cuáles no. El éxito en sí mismo se define con los “expertos en el dominio”, o personas interesadas de la escuela respectiva.

Para empezar, el producto presentaría una imagen clara para cada semestre qué estrategias funcionaron y cuáles no. Esto generaría debate e ideas en el departamento, que podrían medirse aún más para mejorar el proceso existente.


TL; DR: Mi punto de vista como analista de datos es de un jugador de equipo, no de alguien que trabaja en el vacío. Él / ella lo ayudará a crear preguntas de datos, evaluar el esfuerzo para responderlas y pintarle una respuesta a través de una historia en números en un proceso iterativo. Como beneficio adicional, si él / ella está inclinado a la investigación, puede mirar en la web o artículos científicos lo que se utilizó anteriormente como una variable de investigación en los grupos de admisión de las escuelas con éxito. Entonces, diría: comience a buscar en el grupo existente que estaría dispuesto a pasar un tiempo con el analista de datos contratado para trabajar juntos, y / o lo difícil que es obtener datos de lo que está disponible en un formato fácil como un .csv o .xlsx.

En lo que respecta a las expectativas, él / ella no le dará la bala de plata al problema, a menos que haya trabajado en un dominio similar antes. Aún así, me preocuparía por sus posibilidades de implementar una solución que no tomó a los principales protagonistas de la historia desde el día 1 para mejorar el proceso, es decir (supongo) el departamento de admisión.

Hay algunas cosas obvias, pero necesitan al menos una comprensión básica del aprendizaje automático / estadísticas (por ejemplo, al nivel del curso de Andrew Ng). Una gran cosa es que para que esto funcione, necesita datos suficientes de un tipo similar al estudiante (por ejemplo, si usted es MIT, el modelo puede no funcionar bien cuando tiene un estudiante débil que nunca ha sido admitido) .

  • Use la clasificación para predecir si un estudiante se graduará dentro de x años.
  • Utilice la regresión logística o similar para estimar la probabilidad de que el estudiante encuentre un trabajo dentro de los tres años posteriores a la graduación.
  • Use la clasificación para predecir si este estudiante ingresará a la academia o la industria
  • Use la regresión ordinal para predecir el nivel de la escuela de posgrado en la que entraría este estudiante, incluso si todavía están en la escuela secundaria (no estoy seguro de qué tan bien funcionaría).
  • Use la regresión para predecir el salario de un estudiante después de graduarse.
  • Use la regresión para predecir cuánto dinero donarán los padres de este estudiante. Si bien técnicamente podría intentar predecir aún más con cuánto dará el estudiante, diría que un pronóstico a tan largo plazo probablemente no sería exacto, dada la naturaleza cambiante de la tecnología y la economía.