Academia VS Industry, ¿qué entorno es más adecuado para adquirir habilidades en “ciencia de datos” (por ejemplo, limpieza de datos, minería / análisis, visualización)?

Por supuesto, no hay una respuesta definitiva, yo diría que un doctorado / maestría fuerte en un buen laboratorio de aprendizaje automático puede ser mejor. Aquí hay factores que consideraría:

Ciencia de datos versus data jiu jitsu: en la academia, es más probable que aprenda ciencia de datos / aprendizaje automático, en la industria es más probable que aprenda “data jiu jitsu”. Data jiu jitsu es cuando simplemente hackea un algoritmo para trabajar en un gran conjunto de datos, eso tiene sentido intuitivo y luego trata de encontrar una explicación post-hoc de por qué funcionó, cómo podría mejorarse. La ciencia de datos real / aprendizaje automático es cuando primero piensa en el problema, forma un entendimiento, un modelo y luego propone algoritmos más o menos consistentes con sus modelos y trabaja en grandes conjuntos de datos. Es como la diferencia entre “programación” e “ingeniería de software”. Este último es un enfoque más sostenible y es más fácil de aprender en un buen ambiente académico.

Encontrar un mentor: para aprender de manera efectiva las habilidades analíticas y la forma de pensar, necesitará un buen mentor. Alguien que sepa de qué está hablando cuando se trata de ciencia de datos / aprendizaje automático, alguien en quien confía como fuente de asesoramiento, etc. Creo que, en general, es más fácil encontrar un buen mentor en la academia que en la industria. . En la industria, a menudo encontrará “científicos de datos” en puestos superiores que realmente no tienen las habilidades analíticas que le gustaría aprender. Entonces, por supuesto, también hay algunos lugares no tan buenos en la academia. Pero la academia es más transparente, por lo tanto, es más fácil tener una idea acerca de las personas en un laboratorio antes de solicitar / ir allí.

Trabajando en problemas reales: Por supuesto, en la industria trabajará en problemas reales y datos reales y se verá obligado a producir respuestas / resultados razonables rápidamente. Es demasiado fácil en la academia trabajar en problemas a menudo poco realistas y simplificados. A menudo encontrará algún método para analizar datos, y luego es libre de elegir el conjunto de datos para demostrarlo y obtener un documento aceptado. No hace falta decir que aprenderá más sobre cosas prácticas, como la limpieza de datos, la construcción de conjuntos de datos a gran escala, etc. en una empresa (pero estas habilidades prácticas las aprenderá más rápido de todos modos)

Diversidad de problemas: en la industria, lo más probable es que se concentre en unos pocos problemas que son importantes para la empresa. Esto significa que no aprenderá mucho sobre el resto del mundo. En un buen grupo de investigación en la academia, estás expuesto a una amplia gama de problemas de aprendizaje automático / análisis de datos, y probablemente asistirás a muchos seminarios / conferencias, de los cuales aprenderás mucho. Por un lado, trabajé simultáneamente en física cuántica y en un proyecto de análisis de datos de psicología cognitiva en la academia. Esta es una experiencia extremadamente valiosa y le ayuda a desarrollar una idea muy general sobre cómo debería funcionar el análisis de datos.

En resumen, creo que pasar un tiempo (una maestría y / o doctorado) en un buen laboratorio en la academia es un mejor primer paso, incluso si desea trabajar en la industria más adelante. Pero de nuevo, depende. Puede terminar en un laboratorio académico no tan bueno, donde no aprenderá tanto. Y a la inversa, puede terminar en una gran compañía con excelentes mentores y la oportunidad de ver un conjunto diverso de problemas.