Suponiendo que se refiere al análisis de big data, el objetivo es representar elementos del mundo real en forma digital para que las máquinas puedan ayudarnos a comprender y administrar a escala.
Bueno, comienzas de esta manera:
Matemáticas y estadísticas
- ¿Qué es Big Data y cómo se relaciona con las bases de datos?
- ¿Debo pasar a la ciencia de datos desde la ingeniería de big data?
- ¿Cuáles son algunos buenos paquetes de R para el análisis de datos cualitativos?
- ¿Qué habilidades necesito para ser un científico de datos en Quora?
- ¿De dónde obtienen sus datos plataformas como CrunchBase, Dealflow, Exitround y PitchBook?
La matemática que incluye cálculo, álgebra lineal, probabilidad y métodos estadísticos, la programación en Python o R y la tecnología de bases de datos relacionales es fundamental. Consulte ¿Cómo puedo convertirme en un científico de datos? por @wzchen La respuesta de William Chen a ¿Cómo puedo convertirme en un científico de datos?
Luego, debe aprender lo suficiente sobre sistemas distribuidos como Hadoop o equivalentes (realmente solo la parte de almacenamiento distribuido, como HDFS o algo así como Amazon S3), las bibliotecas Apache Spark y Spark, y las bases de datos distribuidas, particularmente las no relacionales o Bases de datos NoSQL.
Sistemas distribuidos y bases de datos
Vea ¿Cómo aprendo Apache Spark? por Mahanthesh Hv La respuesta de Mahanthesh Hv a ¿Cómo aprendo Apache Spark?
Consulte ¿Cuáles son las diferentes fuentes para aprender NoSQL? por Anónimo Respuesta de Anónimo a ¿Cuáles son las diferentes fuentes para aprender NoSQL?
Entonces puede comenzar con el aprendizaje automático, la PNL y el aprendizaje profundo.
Aprendizaje automático, PNL y aprendizaje profundo.
Un objetivo final digno sería, en última instancia, ganar competencia en técnicas de aprendizaje profundo, los enfoques de modelado generados por máquina más sofisticados, que también se basan en la misma pirámide a la que alude Chen.
El conjunto de conocimientos y habilidades necesarios para el aprendizaje profundo
Al avanzar por esta pila, te habrás familiarizado con varios aspectos del aprendizaje automático como se describe a continuación. ¿Por qué aprender machine learning? Bueno, ¿cuál es el punto de Big Data si no puedes usar máquinas de la manera más efectiva?
En última instancia, querrá contribuir al desarrollo de sistemas y aplicaciones inteligentes para permitir que las máquinas hagan más por su cuenta y liberen el tiempo de los humanos en el proceso para que puedan hacer menos trabajo de memoria.
Espero que disfrutes aprendiendo, porque lo harás mucho.
Para obtener información sobre este y otros cebadores relacionados con el aprendizaje automático, consulte Aprendizaje automático 101 (infografía)