La respuesta simple a su pregunta es que no puede convertirse en un científico de datos sin las habilidades necesarias. Sin embargo, siempre puedes mejorar tu habilidad para convertirte en un científico de datos. Para admitir, aprender ciencia de datos no es fácil dada su inmensidad.
Puede convertirse en un científico de datos, pero exigirá un aprendizaje disciplinado y una gran dedicación de su parte. Enumeraré algunos temas imprescindibles para aprender y cómo abordarlos, pero antes de eso es de suma importancia saber algunas cosas sobre la ciencia de datos.
Últimamente he estado interactuando con algunos aspirantes, y la mayoría de ellos tienen mucha importancia para las matemáticas. La ciencia de datos forma su base no solo en matemáticas sino también en Estadística y Programación. La gente generalmente pasa por alto la parte de programación que es un gran error.
- ¿Cuál es el papel de un científico de datos en Quora?
- ¿En qué área de las matemáticas debo mejorar para entrar en una carrera de ciencias de datos, cálculo o matemáticas discretas?
- ¿Cuáles son los buenos libros que proporcionan casos de estudio en ciencia de datos?
- ¿Qué sigue después de la regresión múltiple para la ciencia de datos?
- ¿Qué habilidades de análisis de datos requieren las grandes consultoras?
Entonces, volviendo a la lista de temas para aprender: –
Estadística
- Variables aleatorias
- Distribuciones estadísticas
- Teoría de probabilidad (Cálculo de MGF, CGF, media, mediana, modo, varianza Máxima probabilidad de expectativa, teoremas de límite central, ANOVA)
- Montaje de una distribución.
- Muestreo
- Prueba de una hipótesis.
- Modelado Bayesiano
- Regresión y series de tiempo
Programación
Ahora aquí, hay mucho debate sobre Python vs R. Ambos idiomas tienen sus propios pros y contras. Personalmente, recomendaría Python, ya que es un lenguaje multiusos general y tiene muchas bibliotecas de visualización como Bokeh, Seaborn y Pygal.
- Python intermedio para ciencia de datos
- Importar datos en Python
- Fundación Pandas
- Caja de herramientas de ciencia de datos de Python
- Bases de datos en Python
- Manipulación de marcos de datos con pandas
- Visualización de datos con Python
- Visualización interactiva de datos con Bokeh
- Análisis de red en Python
- Fusionar marcos de datos con pandas
Ahora que ha construido una base sólida, puede comenzar a profundizar fácilmente en la ciencia de datos.
Avanzado
- Árboles de decisión, árboles condicionales
- Técnicas de conjunto
- Big Data y Hadoop Ecosystem y Spark
- Arquitectura HDFS
- Colmena QL
- Cerdo
- Cuentacuentos con datos
- Codificación Visual
- Cuadro
- Bayes ingenuos
- PNL / Agrupación de texto / NLTK
- PCA y reducción de dimensiones
- Implementación de productos de Data Science
El objetivo principal de la ciencia de datos es ayudar a resolver problemas comerciales complejos con la ayuda de datos. Para ser precisos, si no trabaja en problemas reales de la industria, no podrá prepararse como un científico de datos exitoso.
Siempre recomendaría a los aspirantes de ciencia de datos que asistan a un programa basado en el aula, dirigido por un instructor y orientado a la práctica.
Te encontrarás con muchas instituciones, cursos y programas que te ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es saber su valor en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted mismo.
Algunos puntos a considerar al elegir una institución / curso
- El énfasis está más en la práctica y no solo en la teoría.
- El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
- Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
- Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas
Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.
El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.
Algunos enlaces rápidos
- Programa – http://www.greyatom.com/full-sta…
- Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…
- Panel de discusión en GreyAtom – https://www.youtube.com/watch?v=… https://www.youtube.com/watch?v=…