__________________________________
Pre-script : Gracias por el A2A . Para empezar, creo que todos estamos tratando colectivamente de descubrir qué constituye una ‘carrera de ciencia de datos’. Muchas veces, deduzco que un científico de datos es visto como esta criatura unicornio bastante evasiva (un cambio entre un código-ninja y un asistente de estadísticas) y hay una pequeña pero razonable posibilidad de que su existencia y definición en la forma actual se relega a ser un artefacto efímero de los primeros días de la revolución del big data.
Ahora, simplificando su consulta para que lea “ conseguir una posición de científico de datos ordenada que exija emplear un rigor matemático sólido en el día a día en el valle del silicio y hacer un buen trabajo ”, puedo intentarlo.
- ¿Qué pasos de procesamiento previo recomendaría para un aprendizaje automático exitoso en un conjunto de datos MNIST?
- Serie temporal: ¿Existe un enfoque para la detección de anomalías que no se base en datos de entrenamiento anteriores?
- ¿Qué es mejor para el aprendizaje profundo: TensorFlow o Chainer?
- Cómo recopilar datos para problemas de la vida real mientras se entrena un modelo de aprendizaje automático
- ¿El aprendizaje automático va a derrocar al sistema dinámico?
__________________________________
Es una elección difícil realmente. Esta dicotomía intrigante de las culturas entre CS (contextualmente Machine Leaning and Computation) y bueno, estadísticas incondicionales , ha sido bien explorada por las luces principales de los campos como Leo Breiman [1] -Modelo estadístico: las dos culturas (con comentarios y un réplica del autor) – y más recientemente, por Max Welling [2] – [http://www.ics.uci.edu/~welling/…]
Dado que ya tiene una licenciatura de CS, espero que haya elegido la disciplina de ingeniería de software para escribir, mantener y compartir software de buena calidad y se sienta cómodo discutiendo grandes volúmenes de datos que NO residen en una sola unidad. En ese caso, no podría equivocarse demasiado si busca una admisión de Stat-PhD.
Puedo volverme poético acerca de estas dos opciones (y por una razón) y pseudointelectualizar mi sesgo (que es hacia CS). Pero al final del día, siempre y cuando sobresalgas en tus estudios de doctorado, no debería importar.
Si yo fuera usted, examinaría seriamente el Programa Conjunto de Doctorado en Estadística y Aprendizaje Automático que se ofrece en mi alma mater [3] – Departamento de Aprendizaje Conjunto PhD mlstat-Machine – Universidad Carnegie Mellon]. Si no es así, concéntrese en las escuelas que tienen departamentos excepcionales de CS y estadísticas, para que pueda registrarse en los cursos clave y también asistir a seminarios doctorales y clubes de revistas organizados en ambos departamentos.
Hablando pragmáticamente, es posible que le resulte más fácil obtener una admisión de la escuela de primer nivel de los departamentos de Stat (cuando se yuxtapone con la carrera de ratas de admisión de doctorado CS terriblemente competitiva), especialmente dado que muchos profesores de Stat ahora están buscando estudiantes con mejores habilidades de ingeniería de software. {Cita relacionada: ‘… a menudo escuché a investigadores con citas en departamentos de estadísticas gemir sobre las habilidades de programación de sus estudiantes ‘ -Max welling en [2].}
Concluiría sugiriéndole que lea las referencias [1, 2] una vez y vea cuál de las dos culturas le abre el apetito.
¡La mejor de las suertes!
______________________________
Referencias
[1] Modelado estadístico: las dos culturas (con comentarios y una réplica del autor)
[2] http://www.ics.uci.edu/~welling/…
[3] Departamento de Aprendizaje conjunto de phd mlstat-Machine – Universidad Carnegie Mellon