¿Cuáles son los antecedentes de los miembros del equipo de datos de Quora?

¡Hola! Acabo de comenzar en el equipo y también salgo directamente de la escuela (-ish).

Hace mucho, mucho tiempo que estaba en la universidad en UPenn estudiando Ciencias Cognitivas. Siempre tuve algo de interés en la IA (los padres son Trekkies), y hacer Ciencias Cognitivas me permitió tomar clases relevantes (aproximadamente 1/3 de psicología y neurociencia, 1/3 de filosofía, 1/3 de informática). Comenzando el segundo año, trabajé en el Kahana Lab, donde utilicé modelos cognitivos para estudiar la memoria espacial humana. Con los enfoques de modelado cognitivo, los investigadores intentan comprender cómo funciona la mente diseñando programas capaces de replicar los comportamientos de las personas (* señal AI nerd giddiness *).

Me enamoré de la ciencia cognitiva computacional / psicología cognitiva (uso los términos de manera más o menos intercambiable, pero veo otros) y decidí hacer un doctorado en Psicología en UCSD en el Laboratorio Vul. Mi investigación continuó centrándose en el modelado cognitivo, pero más aún dentro de un marco estadístico bayesiano. Trabajé con algunas personas excelentes allí y realmente desarrollé mis estadísticas, programación y habilidades de investigación (entre sesiones en la playa, por supuesto 😉).

Unos años después, comencé a escuchar sobre estas nuevas cosas de ciencia de datos, que se parecían mucho a la investigación de psicología que estaba haciendo, pero sobre datos increíbles del mundo real. Para prepararme para esa transición, me re familiaricé con Python, la programación web y cosas similares y en otoño de 2016 hice el programa Insight Data Science. Procedente de un entorno académico, Insight fue fantástico para aprender sobre cómo funcionan los trabajos de la industria y establecer conexiones con personas amigables e inteligentes en situaciones muy similares. ¡Y no mucho después de eso me entrevisté en Quora y ahora estoy aquí!

Al igual que algunos otros científicos de datos en el equipo de datos (incluida Olivia Angiuli), también fui a pregrado en Harvard.

Comencé la universidad queriendo hacer algo sobre Matemáticas y Economía, pero tomé Harvard Stat 110 con Joe Blitzstein en un primer año de capricho. Esa clase (¡y su profesor!) Cambió la trayectoria de todos mis intereses académicos y me enfocó mucho más en las estadísticas.

Terminé declarando Matemáticas y Estadística como mi “especialidad”, y luego, en algún momento, abandoné la parte de Matemáticas para mantener la parte de Estadística, ya que finalmente se hizo más claro dónde estaban mis intereses.

Terminé tomando muchas clases avanzadas de estadística con el estímulo de Joe y junto con un grupo central de otros tres compañeros de clase: Sebastian, Raj y Jessy. También pasé 4 semestres como “Asistente de enseñanza” para varias clases de introducción de estadísticas (en particular, Stat 110), que también disfruté.

El enfoque e interés hacia las Matemáticas se debió a un interés desde hace mucho tiempo en las matemáticas en toda la escuela intermedia, secundaria y parte de la escuela primaria. Sin embargo, tomé la teoría de grupo y finalmente me di cuenta de que mi amor por las matemáticas estaba más en sus aplicaciones que en la investigación basada en pruebas, lo que me llevó a encontrar la estadística como un sustituto ideal.

Hice algún tipo de programa en Harvard que me permitió graduarme en 4 años con una Licenciatura en Estadística y una Maestría en Matemática Aplicada. La elección del campo de las Matemáticas Aplicadas fue sobre todo para averiguar qué especialidad se ajustaba mejor a las clases que ya había tomado. Del mismo modo, tengo un “menor” en Ciencias de la Computación, pero eso fue principalmente cuando descubrí que tenía suficientes clases para obtener esta credencial sin ningún trabajo adicional.

Hice una tesis con el profesor David Parkes (que ahora es uno de los dos presidentes de la iniciativa de ciencia de datos de Harvard) y el estudiante de doctorado Hossein Azari que propuso y evaluó un nuevo método para agregar datos de rango. Mi tesis principal se tituló “Cómo pedir sushi: un enfoque no paramétrico para modelar datos de rango”. Fue un tema divertido en la teoría de la elección social que se encontraba en una clara intersección entre el aprendizaje automático, la economía y la estadística.

La ciencia de datos en Quora fue mi primer trabajo después de graduarme, pero tuve la fortuna de hacer también dos pasantías relacionadas con datos durante mis últimos dos años en la escuela. El verano después de mi segundo año, hice una pasantía en Etsy (compañía) como pasante analista de datos trabajando con el equipo de inteligencia de negocios (esta pasantía se extendió un poco al trabajo remoto a tiempo parcial). El verano siguiente, hice una pasantía en Quora (compañía) como pasante de ciencia de datos. Disfruté mucho mi pasantía en Quora, así que decidí regresar.

Tuve dos fases en mi vida en las que decidía entre trabajar en finanzas cuantitativas y ciencia de datos. Elegí la ciencia de datos en ambas ocasiones (ver ¿Por qué elegiste trabajar en ciencia de datos sobre finanzas cuantitativas?). Durante esas mismas dos fases, también elegí a Quora sobre otros puestos de ciencia de datos (ver ¿Por qué elegiste trabajar en Quora?).

Algunas preguntas más respondidas sobre mis antecedentes: ¿por qué William Chen eligió estadísticas en lugar de ciencias de la computación o ingeniería informática ?, ¿William Chen quería trabajar como científico de datos de la escuela secundaria ?, ¿qué clases tomó William Chen mientras estaba en la Universidad de Harvard? ?.

Al igual que Mathew, actualmente no estoy en el equipo de datos en Quora, pero empiezo en julio de 2017, así que bueno, ¿por qué no?

Crecí en Madison, Wisconsin y fui a la escuela secundaria en Palo Alto en Palo Alto High School, por lo que mi viaje de regreso a South Bay es una especie de regreso a casa. Era un nadador competitivo y un buzo de trampolín en la escuela secundaria (reclutado para algunas escuelas Ivies y algunas escuelas de la División III), y pensé que estaba destinado a la escuela de medicina.

En 2013, ingresé a UC Berkeley con una especialidad en Biología Molecular y Celular (MCB), pero inmediatamente supe que no era adecuado para mí, por las razones que Olivia menciona en su respuesta. Decidí tomar una clase de Introducción a Python en Udacity durante el verano de mi último año de secundaria, y me enamoré del proceso de resolución de “rompecabezas” usando código. Por supuesto, no pude, en ese momento, identificar esto como un amor por analizar problemas y crear algoritmos, así que pasé unos años sintiéndome decepcionado por el plan de estudios de Ciencias de la Computación en Berkeley mientras caminaba por cursos de división inferior hipercompetitivos y llenos de gente que enfatizaban los paradigmas de programación y el diseño del sistema sobre la resolución de problemas matemáticos.

Reduje mi enfoque a través de algunas clases increíbles, experiencias de investigación y pasantías. Mi tercer año en Cal me dio mis tres clases favoritas, CS 170 (“Algoritmos eficientes y problemas intratables”), Estadísticas 134 (“Conceptos de probabilidad”) y CS 189 / 289A (“Introducción al aprendizaje automático”). Terminé uniéndome al personal del curso para CS 189 / 289A en la primavera de 2017, con Jonathan Shewchuk, e investigando en procesos estocásticos y combinatorios (más precisamente, coloración gráfica, diagramas de permutación y elevación de árboles) con Helmut Pitters.

Hace dos veranos, hice una pasantía en BetterWorks (compañía) como ingeniero de software, a través del programa KPCB Fellows. El verano pasado, hice una pasantía en Wealthfront como ingeniero de datos, donde me interesé en Finanzas cuantitativas, y finalmente hice un estudio externo sobre la recolección de pérdidas fiscales en las carteras de inversión, utilizando algunas técnicas de modelado de series temporales elementales. Espero seguir CS 294–136 en el otoño para más.

Me ha encantado usar Quora durante años y realmente disfruté conocer a las personas brillantes en este hilo durante mis entrevistas en septiembre pasado. ¡Estoy emocionado de comenzar!

Al igual que Tom Haxton, me gradué de la Universidad de Chicago, aunque muchos años después lo hizo. Me especialicé en matemáticas, pero siempre me he sentido un poco falso al decir esto porque no era un matemático acérrimo como muchos de los otros. Al principio había decidido que iba a aprender las cosas que quería aprender y no preocuparme por el nombre del mayor. Las matemáticas resultaron ser las más convenientes para completar con mis cursos.

Terminé incursionando ampliamente, completando las secuencias introductorias durante aproximadamente cinco especializaciones. Hubo una semana cuando estaba usando multiplicadores de Lagrange en mis cursos de Análisis, Mecánica Clásica y Microeconomía. Eso fue bastante memorable.

En general, pensé que era una educación bastante buena. No profundicé mucho, pero me pareció muy útil aprender los paradigmas de cada campo y construir un andamiaje mental para cada uno de ellos. En los años posteriores, ha sido relativamente fácil y satisfactorio llenar los vacíos. Felicitaciones a la tradición de artes liberales de UChicago.

Terminé en ciencia de datos por dos razones. En mi segundo año, hice una pasantía en una compañía de préstamos de día de pago, Enova Financial, construyendo modelos para detectar solicitudes de préstamos fraudulentos. Encontré el trabajo satisfactorio debido a cómo las ideas abstractas directamente se tradujeron en resultados comerciales tangibles. Me pareció que el análisis de datos era uno de los pocos casos en los que la inteligencia contaba para algo en el mundo real.

La segunda razón también fue algo ingenua en retrospectiva. Durante mucho tiempo he tenido un sueño prolífico. Cuando tengo sueño, casi nada me mantendrá despierto. (Esto me dio muchos problemas durante mis días en el ejército). Sin embargo, observé con mis problemas de CS que casi nunca me dormía mientras codificaba. Como tal, las únicas noches en que me las arreglé en la universidad fueron para codificar tareas. De alguna manera, este hecho tomó gran importancia en mi mente y me convenció de que tenía que hacer algo relacionado con la codificación después de la graduación.

Elegí Quora porque era fanático del producto y de cuán centrada en los datos es la compañía. Llevo aquí casi tres años y ha sido genial.

Estudié en la Wharton School de la Universidad de Pensilvania para obtener una licenciatura, especializándome en estadística y finanzas con una especialización en ciencias de la computación. Me uní a Quora después de graduarme, e hice una pasantía en Airbnb y Expedia en roles de ciencia de datos antes de eso. En Wharton, también fundé el programa Wharton Analytics Fellows y pasé muchas horas felices.

Mi experiencia en ciencia de datos es en gran parte autodidacta. Me interesé en hacer trabajo de datos en mi segundo año, después de tomar algunas clases de estadística y ser presentado a la programación estadística. Poder trabajar de forma independiente y buscar proyectos me ayudó a comenzar con la ciencia de datos, viniendo de una escuela donde no había una estructura o historia de ciencia de datos establecida. Como he escrito en otras respuestas (por ejemplo, la respuesta de Chris Hua a ¿En qué carreras se habrían metido los científicos de datos si no hubiera ciencia de datos?), Los estudiantes altamente cuantitativos en Wharton también han sido tradicionalmente absorbidos por el agujero oscuro de las finanzas.

Tengo algunas otras historias divertidas sobre cómo terminé haciendo el trabajo que hice en Expedia, pero básicamente creé un modelo de aprendizaje automático para la detección de anomalías en las tasas de error del sitio. El modelo pudo clasificar períodos anómalos más rápidamente que las herramientas existentes del equipo, incluido, de manera memorable, diagnosticar una interrupción en parte del sitio durante mi presentación final antes de que otros equipos se dieran cuenta.

También tuve una oferta para hacer una pasantía de software en Google ese verano. Elegí Expedia en lugar de Google por algunas razones, que incluyen que probablemente tendría más libertad para hacer análisis de negocios y que Expedia estaba más cerca de casa, pero principalmente porque mi reclutador de Google olvidó llamarme con mi decisión de igualar el host.

Airbnb se contactó conmigo muy temprano en el otoño de mi tercer año, y pasé por su proceso de entrevista rápidamente. Recuerdo haber pensado que la parte más difícil del proceso fue encontrar el tiempo para organizar videollamadas entre San Francisco y Bélgica, donde estudiaba en el extranjero. Durante el verano, modelé varias tasas de crecimiento e identifiqué áreas para apuntar a un crecimiento potencial. También trabajé mucho en herramientas internas para el equipo de ciencia de datos, incluido el (airbnb / knowledge-repo) y el almacenamiento en caché en R (stillmatic / catcher).

Para el otoño de mi último año, sabía que no quería hacer finanzas o consultoría. Aunque muchos de mis amigos terminaron en finanzas y consultoría, muy pocos de ellos estaban contentos con sus trabajos. Sabía que Quora tenía una sólida reputación por ser muy ingeniosa y orientada a los datos, y por tener una barra muy alta en el proceso de la entrevista. Solicité en línea para el puesto de New Grad Data Scientist e hice una pantalla de teléfono y luego una entrevista en el sitio. Estaba bastante satisfecho con el rigor y la inteligencia de mis entrevistadores, así como con lo abierta y comunicativa que era la cultura.

Terminé eligiendo Quora sobre una serie de otras ofertas de ciencia de datos debido a la gran barra general de los otros miembros del equipo de datos, el enfoque basado en datos de la compañía para el desarrollo de productos y el potencial de crecimiento general, especialmente en el equipo de anuncios.

Fui a la universidad en Harvard College, donde comencé con la intención de ser un estudiante de Biología Molecular y Celular. Sin embargo, después de trabajar en varios laboratorios de biología durante aproximadamente un año y medio, me di cuenta de que el trabajo diario a menudo tendía a ser lento y poco inspirador y me preocupaba que esto no encajara con el trabajo acelerado que realicé. tienden a gustar

Experimenté con algunas clases de estadísticas (¡Stat 110 impartido por Joe Blitzstein!) Y clases de CS (CS50) y realmente me encantaron las clases de estadísticas. Cambié mi especialidad a Estadística y completé una pasantía de Ciencia de datos en Akamai Technologies. Durante esta pasantía, me di cuenta de que es importante saber cómo codificar bien y de manera efectiva, así que agregué una doble especialización en Ciencias de la Computación e hice una pasantía de Ingeniería de Software en Google (¡aquí hablo de mi proyecto!)

Durante mi último año, completé una tesis superior que examinó el efecto distorsionador que tiene el anonimato de un conjunto de datos a través del anonimato k sobre la representatividad estadística de un conjunto de datos. Sigo interesado en la privacidad de los datos.

Cuando llegó el momento de buscar roles a tiempo completo, me atrajo el tamaño mediano de Quora (sentí que podría tener un gran impacto), su equipo de ciencia de datos existente y su cultura basada en datos. ¡No podría estar más feliz con la decisión!

Tomé un camino más largo que el típico para convertirme en miembro del equipo de datos de Quora.

Fui a la universidad en la Universidad de Chicago, donde estudié matemáticas y física. Luego, hice un doctorado en física en la Universidad de Pensilvania, donde utilicé mecánicas estadísticas y simulaciones de dinámica molecular para descubrir conexiones entre materiales desordenados que se fluidizan por diferentes parámetros de control como temperatura, presión y esfuerzo cortante. Continué en la academia después de mi doctorado, trabajando como investigador postdoctoral en el Laboratorio Nacional Lawrence Berkeley. Allí utilicé mecánica estadística y nuevos tipos de simulaciones de Monte Carlo para desarrollar reglas de diseño para el autoensamblaje de estructuras complejas a partir de bloques de construcción macromoleculares como proteínas, polímeros sintéticos o nanopartículas.

Aunque disfruté de la investigación académica y tuve algunas entrevistas exitosas para trabajos docentes de seguimiento de tenencia, decidí cambiar de carrera a ciencia de datos para que mi familia y yo pudiéramos quedarnos en el Área de la Bahía. Mi esposa y yo amamos vivir aquí y ambos tenemos familia aquí. Trabajé en Chegg a partir de agosto de 2015, donde fui el científico de datos de los Tutores de Chegg. Allí, entre otras cosas, ayudé a diseñar, probar y optimizar un nuevo flujo para conectar a los estudiantes y tutores en línea en su mercado de dos lados.

Fui reclutado por Quora y comencé en noviembre de 2016. Me inspiró la misión, el alcance, el equipo de alto rendimiento y el compromiso de Quora con sus usuarios y empleados.

Actualmente no estoy trabajando en Quora, ¡pero me uniré al Equipo de datos a fines de agosto de 2017! Este será mi primer trabajo fuera de la universidad.

Fui a una universidad llamada Simon Fraser University (SFU), ubicada en la costa oeste de un país relativamente desconocido llamado Canadá. En la escuela secundaria, descubrí que mis clases favoritas eran Matemáticas y Física, así que naturalmente (?) Comencé mi licenciatura estudiando Ingeniería Física. Aproximadamente dos años después, me di cuenta de que no era el mayor admirador del diseño de hardware, así que cambié a un programa principal conjunto que combinaba las matemáticas y la informática.

No mucho tiempo después, mi interés en la ciencia de datos comenzó durante una pasantía que hice en Microsoft, donde el diseño de tuberías de ETL despertó mi curiosidad sobre el posible conocimiento que se podía obtener de los datos. En los semestres que siguieron, tomé más clases en modelos lineales, aprendizaje automático y minería de datos. Poco a poco, mis pasantías convergieron en algo que parecía cada vez más ciencia de datos, ¡y eventualmente hice una pasantía en Quora como científica de datos!

He realizado prácticas en algunos laboratorios de investigación, algunos de los cuales están en SFU, otro de los cuales estaba en Alemania, que encontré mientras estudiaba en el extranjero en Inglaterra. Además de las compañías que mencioné anteriormente, también hice una pasantía en Hootsuite, ubicada en mi ciudad natal, Vancouver, Canadá.

En este momento, estoy terminando un proyecto de investigación en SFU, donde estoy desarrollando un algoritmo que mejorará la capacitación de los modelos ML cuando los datos de capacitación no sean perfectamente confiables.

A lo largo de este proceso, aprendí que mis intereses abarcaban una habilidad matemática combinada, una exploración de investigación de preguntas abiertas, compartir mis hallazgos de los datos y ayudar a desarrollar un producto impactante que realmente me interesa. ¡Resulta que el equipo de ciencia de datos de Quora hace exactamente esto!

Un poco de curiosidad: el primer analista de datos de Quora, Matyas Tamas, fue a Caltech con Adam. Cuando me presenté a Quora el día 1, no había un escritorio disponible para mí en la oficina principal del segundo piso, por lo que Matyas y Albert Sheu tuvieron que subir al tercer piso y ayudarme a mover un escritorio abajo.