Hoy en día, “Big Data” tuvo un gran auge en los sectores de TI de todo el mundo. Como todos sabemos, los trabajos analíticos pagan mucho. Enorme cantidad de datos que generamos día a día para ser administrados para este propósito BIG DATA entra en escena.
Consideremos esta ecuación, Big Data = Habilidades de programación + Estructura de datos y algoritmos + Habilidades analíticas + Habilidades de base de datos + Matemáticas + Aprendizaje automático + PNL + OS + Criptografía + Programación paralela.
1] Antes de comenzar: si eres un novato en el campo de la informática, completa el curso CS101. Aquí está el enlace para registrarte en CS101: informática 101
- ¿Cuáles son algunos cursos de análisis de datos?
- ¿Cuáles son algunos buenos currículums de Data Science?
- ¿Dónde puedo obtener un conjunto de datos de muestra de la competencia de Deloitte, Kaggle, para predecir la pérdida de clientes en los dominios de seguros de vida?
- ¿Dónde puedo aprender la ciencia de datos y el LD necesarios para las competiciones?
- ¿Cuáles son algunas buenas hojas de trucos de ciencia de datos?
2] Habilidades de programación: debe aprender los siguientes lenguajes de programación.
- Aprenda Python: Python se considera el lenguaje de programación más fácil del mundo debido a su sintaxis simple. Puedes aprender Python rápidamente. Aprenda Python aquí: Tutoriales de Python: Temporada 1 (No necesita ser Python Ninja, solo se necesita información básica).
- Aprenda Java: si está buscando un “trabajo de desarrollador de Big Data”, le sugiero que aprenda Java. Hadoop está escrito en Java, por lo tanto, el conocimiento de los conceptos básicos de Java es esencial para aprender Hadoop. Aquí hay los mejores recursos disponibles en Internet para preparar JAVA: Tutoriales para desarrolladores de Java y Capacitación en línea MIT también ofrece un curso de código abierto sobre Java, aquí está el enlace: Introducción a la programación en Java [Nota: cualquier lenguaje OOP es obligatorio para aprender Big Data]
3] Estructura de datos y algoritmos: ¡Sí! Debes tener las habilidades de DS y Algoritmo. Puede tomar el curso MIT para dominarlos: Introducción a los algoritmos Aprenda sobre los tipos de datos fundamentales (pila, colas y bolsas), algoritmos de clasificación (ordenación rápida, combinación, ordenación) y estructuras de datos (árboles de búsqueda binaria, árboles rojo-negros, hash tablas), Big O.
4] Habilidades analíticas: el pensamiento analítico te hará PRO en Big Data. Te sugiero que trates de resolver acertijos de internet o comiences a jugar al ajedrez. Hacer estas cosas ampliará su pensamiento analítico.
5] Habilidades de base de datos: como vas a jugar con muchos datos, mi recomendación es aprender SQL. Puede aprender SQL aquí: SQLZOO o del canal de youtube “Manish Sharma”: tutoriales de SQL para principiantes / tutoriales de Oracle Database.
6] Matemáticas: si su formación matemática depende del cálculo multivariable y el álgebra lineal, tendrá suficientes conocimientos para comprender casi toda la probabilidad / estadística / aprendizaje automático para el trabajo. Cálculo multivariable: aquí puede aprender cálculo multivariable. Visite este enlace: Cálculo multivariable Álgebra lineal numérica / Álgebra lineal computacional / Álgebra matricial: Álgebra lineal Aprendamos Estadística y probabilidad: La probabilidad también se llama ciencia de la incertidumbre y ese concepto es el más importante en el campo de la DS. Puedes aprenderlo de los cursos del MIT. Aquí está el enlace de youtube: youtube.com Probabilidad y estadísticas MITere otra serie importante del MIT: Matemáticas para la informática
7] Aprendizaje automático: Otro tema importante que todos deberían aprender es el “Aprendizaje automático”. Necesitas tener conocimientos de matemáticas para aprender ML. Aquí está el mejor tutorial del mundo sobre ML: Lecture Collection | Aprendizaje automático
8] PNL: Aquí hay algunos recursos que lo ayudarán en PNL: Libro: Procesamiento del habla y el lenguaje (2da edición): Daniel Jurafsky, James H. Martin: 9780131873216: Amazon.com: Tutoriales de BooksWeb: Procesamiento del lenguaje natural de inteligencia artificial aquí es la mejor referencia, procesamiento de lenguaje natural con Python
9] Sistema operativo: Desarrolle un sólido conocimiento del sistema operativo a partir de los siguientes recursos. Recursos en línea: UC Berkeley Computer Science 162
10] Criptografía: Aquí está el enlace a los maestros en criptografía: Tutorial de criptografía
11] Programación paralela: programación paralela y concurrente en Haskell: Técnicas para programación multinúcleo y multiproceso por Simon Marlow es un libro fantástico.
El último paso: el procedimiento de más de 11 pasos es realmente importante si desea hacer una gran carrera en tecnologías de Big Data. Después de completar el paso anterior, me gustaría insistir en que visite el siguiente enlace y comience a aprender sobre Big Data: Big Data University | Cursos de ciencia de datos
**** Proyecto de trabajo ****
Aquí hay otra forma de capturar lo que un proyecto de Big Data podría significar para su empresa o proyecto: estudie cómo otros han aplicado la idea. Aquí hay algunos ejemplos reales de Big Data en acción:
- Las compañías de productos de consumo y las organizaciones minoristas están monitoreando las redes sociales como Facebook y Twitter para obtener una visión sin precedentes del comportamiento del cliente, las preferencias y la percepción del producto.
- El gobierno está haciendo públicos los datos a nivel nacional, estatal y de la ciudad para que los usuarios desarrollen nuevas aplicaciones que puedan generar bienes públicos. Conozca cómo las agencias gubernamentales reducen significativamente la barrera para implementar datos abiertos con NuCivic Data
- Las organizaciones de servicios financieros están utilizando datos extraídos de las interacciones con los clientes para dividir y dividir a sus usuarios en segmentos finamente ajustados. Esto permite a estas instituciones financieras crear ofertas cada vez más relevantes y sofisticadas.
- Las agencias de publicidad y marketing están rastreando las redes sociales para comprender la capacidad de respuesta a campañas, promociones y otros medios publicitarios.
- Las compañías de seguros están utilizando el análisis de Big Data para ver qué solicitudes de seguro de hogar pueden procesarse de inmediato y cuáles necesitan una visita en persona validada por un agente.
- Al adoptar las redes sociales, las organizaciones minoristas involucran a defensores de la marca, cambian la percepción de los antagonistas de la marca e incluso permiten que los clientes entusiastas vendan sus productos.
- Los hospitales están analizando datos médicos y registros de pacientes para predecir aquellos pacientes que probablemente busquen readmisión dentro de unos meses después del alta. El hospital puede intervenir con la esperanza de evitar otra costosa estadía en el hospital.
- Las empresas basadas en la web están desarrollando productos de información que combinan datos recopilados de los clientes para ofrecer recomendaciones más atractivas y programas de cupones más exitosos.
- Los equipos deportivos están utilizando datos para rastrear la venta de boletos e incluso para rastrear estrategias de equipo.
Consejo: Seguir los 11 pasos e implementar uno de los proyectos mencionados y poner su currículum significa mucho para el reclutador.
Gran gran suerte para su carrera de Big Data.