Gracias por A2A ..
Hoy en día, “Big Data” tuvo un gran auge en los sectores de TI de todo el mundo. Como todos sabemos, los trabajos analíticos pagan mucho. Enorme cantidad de datos que generamos día a día para ser administrados para este propósito BIG DATA entra en escena.
- ¿Qué impide que Node supere a Python para la ciencia de datos?
- ¿Qué tan bien se está utilizando la ciencia de datos en Quora?
- Entre la criptografía y la seguridad de la red, el procesamiento de imágenes y la minería de datos, ¿qué 2 asignaturas son mejores como asignatura optativa?
- ¿Cuáles son algunos de los métodos que hacen los científicos para analizar datos?
- Matemáticamente hablando, ¿cuándo los números de lotería ganadores del pasado afectan los sorteos futuros?
Como hay una descripción adjunta a esta pregunta, ¿no podría obtener más detalles sobre su conocimiento o de qué campo es? que trabajo haces Estas preguntas son muy importantes. Te consideraré más fresco e intentaré responder a tu pregunta.
Big data no es una asignatura o idioma, por lo que puede aprender estudiándolo. En realidad es una combinación de un montón de temas, tecnologías, etc.
Consideremos esta ecuación,
Big Data = Habilidades de programación + Estructura de datos y algoritmos + Habilidades analíticas + Habilidades de base de datos + Matemáticas + Aprendizaje automático + PNL + OS + Criptografía + Programación paralela.
¡Sí! No estoy bromeando aquí, realmente necesitas tener conocimiento de estos temas.
Pero no te preocupes, puedes prepararlo desde cero. Hay enormes recursos disponibles en Internet que lo ayudarán a dominar todas las habilidades.
1] Antes de comenzar:
Me he encontrado con el hermoso curso introductorio de la universidad de Stanford. Si eres un novato en el campo de la informática, completa el curso CS101.
Aquí está el enlace para registrarse en CS101:
Informática 101
2] Habilidades de programación:
Como mencioné anteriormente, las habilidades de programación son obligatorias para comenzar con Big Data. Necesita aprender los siguientes lenguajes de programación.
- Aprende Python:
Python se considera el lenguaje de programación más fácil del mundo debido a su sintaxis simple. Puedes aprender Python rápidamente.
Aprenda Python aquí: Tutoriales de Python: Temporada 1 (No necesita ser Python Ninja, solo se necesita información básica).
- Aprende Java:
Si está buscando “Trabajo de desarrollador de Big Data”, le sugiero que aprenda Java. Hadoop está escrito en Java, por lo que el conocimiento de los conceptos básicos de Java es esencial para aprender Hadoop.
Aquí están los mejores recursos disponibles en Internet para preparar JAVA: Tutoriales para desarrolladores de Java y capacitación en línea
El MIT también ofrece un curso de código abierto sobre Java. Aquí está el enlace: Introducción a la programación en Java
[Nota: cualquier lenguaje OOP es obligatorio para aprender Big Data]
3] Estructura de datos y algoritmos:
¡Sí! Debes tener las habilidades de DS y Algoritmo. Puede tomar el curso MIT para dominarlos: Introducción a los algoritmos
Aprenda sobre los tipos de datos fundamentales (pila, colas y bolsas), algoritmos de clasificación (clasificación rápida, combinación combinada, clasificación múltiple) y estructuras de datos (árboles de búsqueda binarios, árboles rojo-negros, tablas hash), Big O.
4] Habilidades analíticas:
El pensamiento analítico te hará PRO en Big Data. Te sugiero que trates de resolver acertijos de internet o comiences a jugar al ajedrez. Hacer estas cosas ampliará su pensamiento analítico.
5] Habilidades de base de datos:
Como vas a jugar con muchos datos, mi recomendación es aprender SQL. Puede aprender SQL aquí: SQLZOO o del canal de youtube “Manish Sharma”: tutoriales de SQL para principiantes / tutoriales de Oracle Database.
6] Matemáticas:
Si su experiencia matemática depende del cálculo multivariable y el álgebra lineal, tendrá suficiente experiencia para comprender casi toda la probabilidad / estadística / aprendizaje automático para el trabajo.
- Cálculo multivariable: aquí puedes aprender cálculo multivariable. Por favor visite este enlace: Cálculo multivariable
- Álgebra lineal numérica / Álgebra lineal computacional / Álgebra matricial: Álgebra lineal
- Aprendamos Estadística y Probabilidad: La probabilidad también se llama la ciencia de la incertidumbre y ese concepto es más importante en el campo de la DS. Puedes aprenderlo de los cursos del MIT. Aquí está el enlace de youtube: youtube.comProbability and Statistics MIT
- Aquí hay otra serie importante del MIT: Matemáticas para la informática
7] Aprendizaje automático:
Otro tema importante que todos deberían aprender es el “Aprendizaje automático”. Necesitas tener conocimientos de matemáticas para aprender ML. Aquí está el mejor tutorial del mundo sobre ML: Lecture Collection | Aprendizaje automático
8] PNL:
Aquí hay algunos recursos que lo ayudarán en PNL:
Libro:
Procesamiento del habla y el lenguaje (2a edición): Daniel Jurafsky, James H. Martin: 9780131873216: Amazon.com: Libros
Tutoriales web:
Inteligencia artificial Procesamiento del lenguaje natural
Aquí está la mejor referencia, Procesamiento de lenguaje natural con Python
9] Sistema operativo:
Desarrolle un sólido conocimiento del sistema operativo a partir de los siguientes recursos.
Recursos en línea: UC Berkeley Computer Science 162
10] Criptografía:
Aquí está el enlace a los maestros en criptografía: Tutorial de criptografía
11] Programación paralela:
Programación paralela y concurrente en Haskell: Técnicas para programación multinúcleo y multiproceso por Simon Marlow es un libro fantástico.
El último paso:
El procedimiento de más de 11 pasos es realmente importante si desea hacer una gran carrera en tecnologías de Big Data. Después de completar el paso anterior, me gustaría insistir en que visite el siguiente enlace y comience a aprender sobre Big Data:
Universidad de Big Data | Cursos de ciencia de datos
**** Proyecto de trabajo ****
Aquí hay otra forma de capturar lo que un proyecto de Big Data podría significar para su empresa o proyecto: estudie cómo otros han aplicado la idea.
Estos son algunos ejemplos del mundo real de Big Data en acción:
- Las compañías de productos de consumo y las organizaciones minoristas están monitoreando las redes sociales como Facebook y Twitter para obtener una visión sin precedentes del comportamiento del cliente, las preferencias y la percepción del producto.
- Los fabricantes están monitoreando los datos de vibraciones diminutas de sus equipos, que cambian ligeramente a medida que se desgastan, para predecir el momento óptimo para reemplazar o mantener. Reemplazarlo demasiado pronto desperdicia dinero; reemplazarlo demasiado tarde desencadena un costoso paro laboral
- Los fabricantes también están monitoreando las redes sociales, pero con un objetivo diferente al de los vendedores: lo están utilizando para detectar problemas de soporte del mercado de accesorios antes de que una falla de la garantía se vuelva públicamente perjudicial.
- El gobierno está haciendo públicos los datos a nivel nacional, estatal y de la ciudad para que los usuarios desarrollen nuevas aplicaciones que puedan generar bienes públicos. Conozca cómo las agencias gubernamentales reducen significativamente la barrera para implementar datos abiertos con NuCivic Data
- Las organizaciones de servicios financieros están utilizando datos extraídos de las interacciones con los clientes para dividir y dividir a sus usuarios en segmentos finamente ajustados. Esto permite a estas instituciones financieras crear ofertas cada vez más relevantes y sofisticadas.
- Las agencias de publicidad y marketing están rastreando las redes sociales para comprender la capacidad de respuesta a campañas, promociones y otros medios publicitarios.
- Las compañías de seguros están utilizando el análisis de Big Data para ver qué solicitudes de seguro de hogar pueden procesarse de inmediato y cuáles necesitan una visita en persona validada por un agente.
- Al adoptar las redes sociales, las organizaciones minoristas involucran a defensores de la marca, cambian la percepción de los antagonistas de la marca e incluso permiten que los clientes entusiastas vendan sus productos.
- Los hospitales están analizando datos médicos y registros de pacientes para predecir aquellos pacientes que probablemente busquen readmisión dentro de unos meses después del alta. El hospital puede intervenir con la esperanza de evitar otra costosa estadía en el hospital.
- Las empresas basadas en la web están desarrollando productos de información que combinan datos recopilados de los clientes para ofrecer recomendaciones más atractivas y programas de cupones más exitosos.
- Los equipos deportivos están utilizando datos para rastrear la venta de boletos e incluso para rastrear estrategias de equipo.
Consejo: Seguir los 11 pasos e implementar uno de los proyectos mencionados y poner su currículum significa mucho para el reclutador.
Gran gran suerte para su carrera de Big Data.
[Nota: si necesita ayuda, no dude en enviarme un mensaje.]