Estas son las habilidades que necesita para tener un buen operador en big data
1- MapReduce, Hadoop, Cloudera, IBM Big Insights, Hortonworks o MapR. La mayoría de las personas tienden a tener experiencia con una implementación de MapReduce (ya que muchas de estas herramientas tienen solo unos pocos años), pero los algoritmos subyacentes facilitan el aprendizaje de nuevos con unas pocas semanas de tiempo de aceleración. Si está familiarizado con una de las herramientas enumeradas aquí, o uno de los muchos sabores de MapReduce (como Hive o Pig), lo más probable es que pueda asumir un rol con una herramienta similar.
2-Minería de datos o aprendizaje automático. Esto puede incluir tecnologías como Mahout o técnicas más especializadas como redes neuronales. Tener estas habilidades puede ser una gran ventaja para usted sobre otros candidatos si el rol requiere este tipo de trabajo, ya que estas habilidades son más especializadas y más difíciles de aprender.
Software de análisis estadístico: R, SPSS, SAS, Weka, MATLAB. La mayoría de los científicos de datos tienen cierta experiencia estadística, pero no todos usarán software para hacer su trabajo. Si eres tú, si usas Java, por ejemplo, se espera que aprendas estas herramientas de software, pero debería ser bastante fácil aumentar de lo que estás acostumbrado.
- ¿Cuál es la forma más rápida de realizar un EDA en un conjunto de datos con más de 100 variables?
- Cómo ingresar al campo de la ciencia de datos
- ¿Hay revistas revisadas por pares para análisis de datos y BI? ¿Dónde puedo encontrar la información o la inspiración sobre cuáles son los conocimientos de los datos de ventas que suelen ser útiles para las empresas?
- ¿Cómo comienza un novato con la ciencia de datos?
- ¿Cuáles son las mejores consultoras de ciencia de datos?
3- Habilidades de programación: Java, Scala, Ruby, C ++. Por lo general, se requerirán más habilidades de programación de levantamiento pesado para implementaciones personalizadas o implementaciones especializadas (aprovechando cosas como el aprendizaje automático, etc.).