Para que pueda tomar una decisión usted mismo, debe comprender un poco acerca de cómo se utilizan estas habilidades en la industria.
Ten paciencia conmigo mientras te doy un ejemplo.
Digamos que una compañía de tarjetas de crédito descubre que hay muchas transacciones fraudulentas en las tarjetas que ha emitido. Quiere detectar estas transacciones a medida que ocurren, y evitar o bloquear las transacciones.
- ¿Qué es el analista de datos? ¿Qué él ha hecho?
- ¿Cuáles son las principales diferencias entre Python y R para la ciencia de datos?
- ¿Qué son pasantías geniales orientadas a datos que no requieren un fondo intensivo de codificación?
- ¿Qué libros recomendarías para aprender ciencia de datos?
- ¿Cómo es el futuro en Big Data?
Para hacer esto, la compañía de tarjetas de crédito, a un nivel muy alto, necesita dos cosas:
- Algún método que puede identificar y separar la transacción fraudulenta de los miles de transacciones genuinas que suceden. El trabajo de un científico de datos es crear esta solución. Un científico de datos tomaría datos históricos de transacciones de tarjetas de crédito, traería otros tipos de datos y luego usaría técnicas estadísticas para construir un modelo predictivo (una ecuación) que separe la transacción fraudulenta de la transacción genuina. Esta ecuación o modelo predictivo aún no es “software”. En este momento, solo existe en el papel.
- Una vez que el método anterior ha sido “desarrollado”, debe “desplegarse”. Lo que esto significa es que alguien tiene que tomar la ecuación que creó el Data Scientist y convertirla en una pieza de “software” que funcione en tiempo real. Cuando se desliza una tarjeta en cualquier parte del mundo, este “software”, que tiene el modelo predictivo codificado en su interior, determina si la transacción es fraudulenta y la detiene. Los ingenieros de datos generalmente terminan construyendo este “software” trabajando codo a codo con los científicos de datos .
Ahora tenga en cuenta lo siguiente:
- Se requieren científicos de datos e ingenieros de datos para resolver el problema.
- Hay personas que pueden desempeñar ambos roles, pero generalmente verá esta distinción en la mayoría de los equipos. Estos comienzan a convertirse en roles especializados.
- Los científicos de datos hacen muchas otras cosas además de construir modelos predictivos. Del mismo modo, los ingenieros de datos hacen otras cosas además de implementar modelos creados por científicos de datos. Lo que describí anteriormente es un ejemplo simplificado para ayudarlo a comprender la diferencia.
- Por lo general, se espera que los científicos de datos conozcan la “metodología” (estadística, matemáticas, aprendizaje automático, etc.). Generalmente no se espera que los ingenieros de datos conozcan la “metodología”.
- Los ingenieros de datos generalmente terminan construyendo “software” (tienden a usar Java la mayor parte del tiempo; usan mucho más de la pila de tecnología Big Data), por lo que se espera que tengan o desarrollen las habilidades apropiadas. Por lo general, no se espera que los científicos de datos sepan cómo construir un “software”, aunque saber cómo funciona el software generalmente los ayuda (no muchos científicos de datos usan Java en su trabajo diario; por lo general, también tienden a usar menos del Big Pila de tecnología de datos).
- En la India, en el nivel de entrada de aproximadamente 4-5 años de experiencia, tanto los científicos de datos como los ingenieros de datos pueden esperar rangos salariales similares, aunque esto (todo lo demás es igual) dependerá en última instancia de la filosofía de una empresa y la forma en que ven estos dos roles Te sugiero que mires las encuestas en Glassdoor y te decidas.
- Desde una perspectiva profesional a largo plazo, a pesar de que Harvard Business Review llama a “Data Scientist” el trabajo más sexy del siglo XXI, los ingenieros de datos que se convierten en arquitectos de Big Data tienen la misma demanda en la industria actualmente y tienen escalas salariales similares a las experimentadas. Científicos de datos en la India.
Para responder tu pregunta:
- Tanto los científicos de datos como los ingenieros de datos tienen demanda y tienen grandes perspectivas de futuro.
- Dado que ya tiene experiencia con Java, una opción práctica sería construir sobre lo que ya sabe y seguir el camino del ingeniero de datos con el objetivo de convertirse en un arquitecto de Big Data dentro de unos años.
- Habiendo dicho lo anterior, si siente que quiere convertirse en un Científico de Datos, nadie debería disuadirlo de perseguir lo que quiere. Hay mucho material en Quora y en otras partes de Internet para guiarte.
Espero que esto ayude.