Cómo ingresar al mundo de los grandes datos con una licenciatura en física

Estas son las habilidades que necesita para tener un buen operador en big data

1- MapReduce, Hadoop, Cloudera, IBM Big Insights, Hortonworks o MapR. La mayoría de las personas tienden a tener experiencia con una implementación de MapReduce (ya que muchas de estas herramientas tienen solo unos pocos años), pero los algoritmos subyacentes facilitan el aprendizaje de nuevos con unas pocas semanas de tiempo de aceleración. Si está familiarizado con una de las herramientas enumeradas aquí, o uno de los muchos sabores de MapReduce (como Hive o Pig), lo más probable es que pueda asumir un rol con una herramienta similar.

2-Minería de datos o aprendizaje automático. Esto puede incluir tecnologías como Mahout o técnicas más especializadas como redes neuronales. Tener estas habilidades puede ser una gran ventaja para usted sobre otros candidatos si el rol requiere este tipo de trabajo, ya que estas habilidades son más especializadas y más difíciles de aprender.
Software de análisis estadístico: R, SPSS, SAS, Weka, MATLAB. La mayoría de los científicos de datos tienen cierta experiencia estadística, pero no todos usarán software para hacer su trabajo. Si eres tú, si usas Java, por ejemplo, se espera que aprendas estas herramientas de software, pero debería ser bastante fácil aumentar de lo que estás acostumbrado.

3- Habilidades de programación: Java, Scala, Ruby, C ++. Por lo general, se requerirán más habilidades de programación de levantamiento pesado para implementaciones personalizadas o implementaciones especializadas (aprovechando cosas como el aprendizaje automático, etc.).

More Interesting

¿En qué se diferencia el desarrollador de SQL del análisis de big data? ¿Y qué es Hadoop?

Estoy interesado en obtener un título de licenciatura en línea post-bac de la Oregon State University en Data Science. ¿Sería una responsabilidad obtener un título en línea?

¿Qué es más preciso entre la media de datos agrupados y la media de datos no agrupados?

¿Qué es lo primero que haces al mirar un nuevo conjunto de datos?

¿Qué es una explicación intuitiva de una regresión multivariada?

¿Cuáles son algunos pasatiempos que a los científicos de datos les gustan?

¿Cuál es el mejor beneficio de ser bueno en el lenguaje de programación Java para un científico de datos?

¿Qué deportes son más conocidos por el análisis de datos?

¿Podemos hacer aprendizaje automático escalable con R? ¿Puede R trabajar con Hadoop para procesar una matriz de 100 GB?

Para un estadístico, ¿qué áreas necesitan mejorar para convertirse en un buen científico de datos?

¿Cómo se utilizan los grandes datos para identificar a los mejores compradores potenciales?

¿Cuál es la mejor manera de compartir y guardar consultas / investigaciones / resultados dentro de un equipo de ciencia de datos?

¿Qué debo hacer para crear una base de datos efectiva?

¿Cuáles son algunos libros que debe tener un científico de datos?

Andrew Ng: ¿Qué proyectos personales mejorarían la empleabilidad de un estudiante de ML / Data Science (suponiendo que no haya antecedentes en CS / STEM)?