¿Comenzando con Big Data?
Muy a menudo recibo la consulta que estoy familiarizado con X, Y y Z, ¿es lo suficientemente bueno para comenzar con Big Data?
¿Esto está comenzando con Big Data? La publicación de Kovid Academy es para abordar lo mismo. Aquí veremos qué se requiere para comenzar con Big Data y lo racional que hay detrás.
- ¿Qué proyectos combinan ciencia de datos y aerodinámica?
- ¿Cómo funciona Data Scramblr?
- ¿Quién es el ganador del desafío ImageNet LSVRC-2016? ¿Cuál es su enfoque?
- ¿Qué campo tiene mejores perspectivas de carrera, Big data o data science?
- ¿Cómo puede un principiante aprender big data, aprendizaje profundo y aprendizaje automático de forma rápida y sencilla?
Hay mucha información en Internet para comenzar con cada uno de ellos y es fácil perderse. Por lo tanto, también se incluyen las referencias para comenzar con esas tecnologías.
Linux: Big Data (la revolución de Hadoop) comenzó en el sistema operativo Linux. Incluso ahora, la mayoría de los softwares de Big Data se desarrollan inicialmente en Linux y la migración a Windows ha sido una idea posterior.
Microft se asoció con Hortonworks para acelerar la transferencia del software Big Data a Windows.
Para comenzar con los últimos softwares sobre Big Data, el conocimiento de Linux es imprescindible. Lo bueno de Linux es que es gratuito y abre muchas oportunidades.
Hay más de 100 sabores diferentes de Linux y Ubuntu es una de las distribuciones populares para comenzar para aquellos que son nuevos en Linux.
Java: la mayoría de los softwares de Big Data se desarrollan en Java. Digo que la mayoría, las excepciones son Spark se ha desarrollado en Scala, Impala se ha desarrollado en C / C ++ y así sucesivamente.
Para ampliar el software de Big Data, el conocimiento de Java es imprescindible. Además, a veces la documentación puede no estar a la altura y, por lo tanto, puede ser necesario pasar por el código subyacente del software Big Data para ver cómo funciona algo o no funciona como se espera.
Por las razones mencionadas anteriormente, el conocimiento de Java es imprescindible. Los conceptos básicos de Java central son suficientes, no se requiere conocimiento de Java empresarial.
Los programas Java se pueden desarrollar con tan simple como el bloc de notas. Pero, desarrollar en un IDE como Eclipse lo convierte en pan comido.
SQL : no todos se sienten cómodos con la programación en Java y otros lenguajes. Esa es la razón por la cual se han introducido abstracciones SQL en la parte superior de los diferentes marcos de Big Data. Aquellos que son de un fondo de base de datos pueden comenzar fácilmente con Big Data debido a la abstracción de SQL. Hive, Impala, Phoenix son algunos de estos softwares.
Otros: las habilidades mencionadas anteriormente son lo suficientemente buenas como para comenzar con Big Data. A medida que uno entra más y más en Big Data, también recomendaría mirar R, Python y Scala. Cada uno de estos idiomas tiene su fuerza y debilidad y, según el requisito, se puede elegir la opción adecuada para escribir programas de Big Data.
Para ser bueno en Big Data Hadoop Developer Certification Training en Lvc-Global Big se requiere que un aspirante tenga una buena visión general de las diferentes tecnologías y la guía anterior menciona lo que se requiere y dónde comenzar a leer sobre ellas.