Me encuentro volviendo a este cómic de XKCD la mayoría de las veces. Tómelo con un poco de humor, mientras reemplaza la palabra: “Estudiantes de posgrado” por “Expertos de dominio” mientras lo lee a continuación:
URL: xkcd: Impostor
- ¿Qué tecnología está en auge ahora, aparte de Big Data y Hadoop?
- ¿Cuánto tiempo te llevó convertirte en analista / desarrollador junior de BI productivo?
- ¿Qué herramientas existen para resumir documentos muy especializados (por ejemplo, documentos legales o médicos)? ¿Cuál es la diferencia entre estas herramientas y las genéricas?
- ¿Hay alguna manera de que podamos incorporar la genómica y las imágenes médicas a la ciencia de datos como postgrado?
- ¿Por qué debería elegir Krux como mi plataforma de gestión de datos?
El primer grupo de personas a las que recurriría, cuando la caricatura intenta insinuarlo, es el `experto en dominios`. Estoy hablando, en este caso, del departamento de admisión de dicha escuela y simplemente pregunto a cada uno de los miembros:
“¿Cómo define a un estudiante en un grupo de admisión?”
Seguido por:
“¿Cuáles son las formas actuales que utiliza para aumentar el grupo de admisión?”
A partir de aquí, seguirán un par de declaraciones. Hice un ejercicio rápido con alguien que conozco tenía un trabajo como uno, para usarlo como un ejercicio de ejemplo para esta respuesta.
De la primera pregunta obtuve un par de ejemplos de lo que define a una persona en el grupo de admisión, pero más importante cuando la persona ya no está en un grupo de admisión: “Después de que comience la clase”. La razón es que, hasta entonces, el estudiante puede darse por vencido, en cuyo caso el grupo sería más pequeño de lo que se esperaba.
Esta definición nos da una marca de tiempo específica en algunos datos que buscaremos para darnos un número del grupo de aplicaciones de un semestre determinado. Genial, ahora podemos observar cómo fluctúa sujeto a algunas restricciones. Obtuvimos, libremente, la variable que estamos tratando de optimizar.
Para la segunda pregunta , la persona respondió (entre otras cosas):
- Tenemos un sistema en el lugar donde podemos ver qué tan lejos están los estudiantes en el proceso de admisión.
- Organizamos eventos, en cuyo caso tenemos acceso a posibles solicitantes que aún no están en el sistema.
Tenga en cuenta que la parte del analista de datos comenzó haciendo las preguntas correctas para obtener información que él / ella puede entregar en números. La lista puede ser mucho más grande, pero lo que sigue es una evaluación del esfuerzo por parte del analista para convertir la pregunta en números (por ejemplo, sacar los datos de los sistemas existentes, preprocesar y remodelar), y también hablar con la derecha personas y la gestión de sus agendas ocupadas existentes.
Luego, los datos, números y visualizaciones se realizan a partir de los procesos existentes para observar cuáles son exitosos y cuáles no. El éxito en sí mismo se define con los “expertos en el dominio”, o personas interesadas de la escuela respectiva.
Para empezar, el producto presentaría una imagen clara para cada semestre qué estrategias funcionaron y cuáles no. Esto generaría debate e ideas en el departamento, que podrían medirse aún más para mejorar el proceso existente.
TL; DR: Mi punto de vista como analista de datos es de un jugador de equipo, no de alguien que trabaja en el vacío. Él / ella lo ayudará a crear preguntas de datos, evaluar el esfuerzo para responderlas y pintarle una respuesta a través de una historia en números en un proceso iterativo. Como beneficio adicional, si él / ella está inclinado a la investigación, puede mirar en la web o artículos científicos lo que se utilizó anteriormente como una variable de investigación en los grupos de admisión de las escuelas con éxito. Entonces, diría: comience a buscar en el grupo existente que estaría dispuesto a pasar un tiempo con el analista de datos contratado para trabajar juntos, y / o lo difícil que es obtener datos de lo que está disponible en un formato fácil como un .csv o .xlsx.
En lo que respecta a las expectativas, él / ella no le dará la bala de plata al problema, a menos que haya trabajado en un dominio similar antes. Aún así, me preocuparía por sus posibilidades de implementar una solución que no tomó a los principales protagonistas de la historia desde el día 1 para mejorar el proceso, es decir (supongo) el departamento de admisión.