Quizás esta pregunta podría reformularse mejor. La pregunta, en su estado actual, parece sugerir que big data y machine learning son dos carreras paralelas, lo cual no es del todo correcto.
En el verdadero sentido, se puede decir que BigData es en realidad un ecosistema de algún tipo. Una visión bastante conservadora del dominio abarca herramientas y marcos para la recopilación y transmisión ( telemetría ), así como el almacenamiento en formatos accesibles, de una gran cantidad de datos de rápido movimiento de diversas fuentes, como datos de sensores IoT [1] y sociales datos de medios [2] por ejemplo. También implica el preprocesamiento, modelado, análisis y visualización ( análisis ) oportunos de estos datos para que tengan sentido. El dominio involucra a muchos profesionales dependiendo de la industria en cuestión.
Una función típica para los aspectos de telemetría y almacenamiento es un ingeniero de datos o ingeniero de BigData, generalmente ocupado por una persona con antecedentes técnicos / de programación / sistemas. Es su responsabilidad garantizar una telemetría y un almacenamiento eficientes para que la fase de análisis sea lo más fácil posible.
- ¿Cuáles son las mejores conferencias sobre aprendizaje automático para el procesamiento de imágenes médicas en 2016?
- ¿En qué debería concentrarme después de aprender el aprendizaje automático si no estoy interesado en el aprendizaje profundo?
- Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?
- ¿Cuáles son los documentos más importantes en el aprendizaje activo?
- ¿Cuál es la forma correcta de calcular la similitud de coseno entre una consulta y un documento? Cuando calculo la magnitud del documento, ¿sumo los cuadrados de todos los términos del documento o solo los de la consulta?
Los roles en el aspecto analítico incluyen analistas de datos, analistas de negocios, científicos de datos, ingenieros de aprendizaje automático, científicos de aprendizaje automático dependiendo de las designaciones en la industria o empresa respectiva. Los profesionales en estos roles suelen tener experiencia estadística / matemática / informática. Son responsables de desarrollar o aplicar una variedad de aprendizaje automático, análisis estadístico y otras técnicas de IA en el proceso analítico de BigData hacia la extracción de información procesable para apoyar la toma de decisiones. Lea más sobre algunos de estos roles aquí y aquí.
Entonces, como puede ver, BigData es solo uno de los dominios donde Machine Learning se utiliza activamente. Y en términos de carreras futuras, la perspectiva parece bastante buena. Según un informe reciente de McKinsey, ¡podría haber entre 140-190,000 puestos vacantes para profesionales de ‘Big Data‘ en 2018 solo en los EE. UU.! [3] Vea más información sobre cómo se ven las tendencias en los siguientes enlaces:
- Oportunidades de trabajo de Big Data en 2017 y los años venideros
- IBM predice que la demanda de científicos de datos se disparará un 28% para 2020
- Perspectivas de carrera en el aprendizaje automático: prepararse para el futuro
- El futuro del aprendizaje automático: tendencias, observaciones y pronósticos – DATAVERSITY
Además, tenga en cuenta que no he incluido los aspectos académicos / de investigación de BigData, Machine Learning y AI en general, uno que es una gran fuerza detrás del ecosistema. Habrá necesidad de miles de investigadores y profesores en BigData y campos aliados ahora y en el futuro más cercano.
Notas al pie
[1] Conozca los cuatro tipos de datos en Internet de las cosas – ReadWrite
[2] 5 tipos de datos sociales
[3] Big data: la próxima frontera para la innovación, la competencia y la productividad