Si un doctorado en física con experiencia mínima en programación, pero con buenos antecedentes en matemáticas, quiere encontrar un trabajo en ciencia de datos en el mercado estadounidense, ¿qué más debe aprender?

Si está buscando un trabajo en la industria, un doctorado en física es un excelente lugar para comenzar. Muchos de los mejores científicos de datos que conozco son ex físicos. Suponiendo que recogió las estadísticas estándar en su investigación, lo siguiente que debe hacer es adquirir algunas habilidades de codificación ligeras. Python parece ser el lenguaje de propósito general más popular para la ciencia de datos, pero el dominio de los fundamentos de cualquier otro lenguaje de programación estándar es suficiente. Probablemente no necesite construir los sistemas complejos o los algoritmos sofisticados que se esperan de un ingeniero de software, pero debería poder escribir los tipos de programas sencillos que caben en un solo archivo. Probablemente también se espera que recoja un par de otras herramientas como R / Matlab y SQL también, pero espero que cualquiera que pueda manejar Python las recoja sobre la marcha.

La otra cosa que debes hacer es aprender a pensar sobre el producto. La habilidad más importante para los científicos de datos es saber cómo hacer las preguntas correctas. Es bastante fácil convertir una gran cantidad de datos en gráficos y estadísticas, pero ¿cuáles son los correctos para mirar y qué significan? Comience a buscar productos con los que esté familiarizado y pregúntese qué datos podría usar para evaluar su éxito y descubrir cómo deberían cambiar. Esta es una habilidad que crece mejor con experiencia práctica, pero al menos debería haber comenzado el proceso usted mismo.

Si puede convertir muchos números en consejos para un producto, está listo para ser un científico de datos.

Sugeriría R. La mayoría de los lugares que realizan prototipos de I + D se centrarán primero en las matemáticas y contratarán a un experto en resolución de problemas y matemáticas junto con programadores. Las oficinas generalmente usan R o Python con fuertes habilidades cuantitativas. R no es tan malo si eres un novato en programación (los PDF de tutoriales en línea son buenos), y tiene paquetes para implementar la mayoría de los métodos estadísticos y de aprendizaje automático (la mayoría de los documentos estadísticos publican un paquete R o un código R para implementar su nuevo algoritmo) .

Trabajé con un chico que estaba en una situación similar.

Tenía un doctorado en Estadísticas y sabía lo suficiente como para obtener un puesto como científico de datos.

Era absolutamente inútil.

No conocía los conceptos básicos de Python, por lo que todo lo que pudo hacer fue hacer recomendaciones de modelos.

Si no conoce Python, honestamente no sé cómo obtendrá un trabajo en el espacio aplicado.

Todo en el mundo real es Python. (MXNet, TensorFlow, Gluon … etc.)

Independientemente de su educación, si no conoce Python, creo que estará en problemas.

Si eres nuevo en el espacio, toma mi curso GRATUITO sobre aprendizaje automático.

Una introducción al aprendizaje automático para ingenieros de datos

Parece que debería aprender programación.

More Interesting

¿Cuál puede ser un buen comienzo para una persona que no es de TI como yo en el campo de los datos?

¿Cuáles son algunas de las principales conferencias de ciencia de datos y análisis en India?

Ya no estoy dispuesto a ir a los Estados Unidos para obtener una maestría. ¿Dónde debería estudiar ciencia de datos y aprendizaje automático?

¿Cuáles son algunos paquetes de R que el científico de datos o un estadístico deben saber usar?

¿Por qué no se puede usar el porcentaje (%) para la normalización de datos en estadísticas?

¿Cuál es la próxima gran cosa que NO está relacionada con los datos o la informática?

Mientras se construye un modelo de datos predictivos, ¿el tratamiento para valores perdidos y valores atípicos debe realizarse tanto en los conjuntos de datos de entrenamiento como de prueba?

¿Qué empresas de TI en India contratan para desarrolladores de Big Data / Hadoop?

He realizado mi pasantía en una empresa B2B y he realizado algunos análisis de datos como el porcentaje de daños, el retorno al origen y algunos otros. ¿Qué más puedo hacer con estos datos?

¿Cuántos estudiantes han completado la especialización en ciencia de datos de Coursera hasta la fecha?

¿Qué es el álgebra relacional y para qué se utiliza? ¿Cómo se relaciona con la ciencia de datos?

¿Cuál es la mejor manera de compartir y guardar consultas / investigaciones / resultados dentro de un equipo de ciencia de datos?

Tengo un dato de 50 filas de Lakh. ¿Cómo lo abro en R o Python? ¿O hay alguna otra alternativa que no sea usar Hadoop?

Cómo aprender análisis de datos en línea

Soy un desarrollador de Java pero quiero hacer un doctorado en ciencia de datos de Canadá. ¿Cuáles son las buenas universidades en Canadá y cuáles son sus requisitos?