¿Vale la pena obtener una maestría dual en estadística e informática (para una carrera en ciencia de datos)?

Sé que a Silicon Valley le gusta retratar a los científicos de datos como desarrolladores virtuosos de software y maestros de todas las estadísticas, y eso es lo que pueden desear para sus startups de 10 personas (que valdrán miles de millones en 5 años, ¿verdad?).

Sin embargo, tendría cuidado con el plan de estudios del título de CS. Ya existe una distinción creciente entre Data Engineer y Data Scientist. Es mejor que los primeros tengan experiencia en CS, mientras que los segundos pueden ser más eclécticos, pero deben tener un fuerte enfoque en la implementación de análisis . Tenga en cuenta que dije desplegar capaz.

Necesitará apreciar las cargas que está imponiendo sobre el sistema de producción y las limitaciones dentro de las cuales debe trabajar. Por lo tanto, debe poder perfilar su código y tener una idea de las estructuras de datos apropiadas para usar (por ejemplo, es posible que desee reconsiderar el uso de una lista si necesita una adición / eliminación rápida y búsquedas … una tabla hash puede ser mejor). Sin embargo, apuesto a que la mayoría de los ingenieros de software le dirán que las estructuras de datos y los algoritmos son solo una pequeña fracción de sus preocupaciones diarias, a pesar de cómo están estructuradas las entrevistas modernas de software (¿nivel de entrada?).

Idealmente, desea poder escribir código limpio, bien documentado, eficiente (suficiente) que resuelva su problema de ciencia de datos. Además, sabrá cómo trabajar con bases de datos y estará familiarizado con los diferentes tipos (p. Ej., Relacional, gráfico, documento, valor-clave), así como también podrá realizar algunos modelos de datos básicos.

Sin embargo, un título de CS puede centrarse demasiado en el desarrollo de software y eso llevará tiempo desarrollando habilidades de modelado y análisis. Hay un puñado de temas de CS que son realmente cruciales para la ciencia de datos y muchos que no lo son.

¿Ha considerado reducirse en CS, con un enfoque en, tal vez, la computación distribuida y la computación científica? Luego podría tomar algunos cursos en bases de datos / modelos de datos / consultas avanzadas, raspado web y minería de texto, y algoritmos y estructuras de datos.

Creo que eso suena bien. Una cosa que dudaría es que es mucho tiempo para pasar en la universidad. Podrías hacer un doctorado en solo un poco más de tiempo.

Hacer una maestría en estadística le dará una base mucho más sólida que simplemente hacer unos pocos documentos de estadísticas y una tesis enfocada en estadísticas.

El título de CS es más opcional pero le enseñará ingeniería, SQL, algoritmos y algunas técnicas de programación que no obtendría con las estadísticas. También muestra que no eres demasiado teórico.

Las estadísticas y la experiencia laboral lograrían lo mismo y pagarían mejor

La estadística es más apropiada, ya que la ciencia de datos es una extensión del trabajo de un estadístico para incluir big data y métodos estadísticos más flexibles.

Tengo 4 títulos universitarios. Disfruté de cada uno de ellos, pero mi trabajo solo se preocupaba por 1. Si quieres los títulos de conocimiento, valen la pena. De lo contrario, averigüe qué le interesará a su futuro empleador.