Cómo aprender ciencia de datos sin conocimientos de matemáticas

Debo decir que revise los conjuntos de blogs que están disponibles gratuitamente en Internet y con los mejores libros. Y luego aprenda las habilidades de un Científico de Datos e intente agregar esas habilidades en usted mismo.

Primero veamos los mejores libros para aprender Data Science

Este libro está escrito por Jared P. Lander. Es un libro decente que cubre todos los aspectos de la ciencia de datos, como la visualización de datos, la manipulación de datos, el modelado predictivo, pero no con tanta profundidad. Puedes entenderlo, ya que cubre una gran cantidad de temas y se pierde detalles de cada uno.

Este libro está escrito por Trevor Hastie, Robert Tibshirani y Jerome Friedman. Esta es la siguiente parte de ‘Introducción al aprendizaje estadístico’. Se compone de temas más avanzados. Este libro es el más adecuado para personas familiarizadas con los conceptos básicos del aprendizaje automático.

Puede comenzar con estos libros. Ahora, veamos algunas habilidades de un Data Scientist exitoso:

Buena habilidad de aprendizaje

Data Scientist es el trabajo más sexy del siglo XXI. Como Data Scientist, siempre debes aprender algo nuevo. Todos los días tienes que trabajar en algo muy nuevo. Este es un campo tan nuevo que cubre tantas habilidades y tantos dominios. Entonces has tenido una buena habilidad de aprendizaje.

Paciencia

Un científico de datos obtiene muchas ideas que a veces están ligeramente fuera del alcance. Al resolver esa idea, puede sentirse frustrado, pero debe mantener su paciencia y debe tratar de encontrar esas gemas en bruto.

Confirmación

Como Data Scientist, obtendrá muchos errores mientras codifica. A veces sentirá que el código es correcto, pero tal vez habrá algunos errores, por lo que antes de confirmar su código, debe realizar una verificación cruzada.

Ahora veamos a continuación la infografía de un científico de datos moderno:

Veamos algunas habilidades según la industria: Data Scientist necesita tener habilidades técnicas y no técnicas para realizar su trabajo de manera efectiva.

Las habilidades técnicas están involucradas en 3 etapas en Data Science.

Incluyen:

  • Captura de datos y preprocesamiento
  • Análisis de datos y reconocimiento de patrones
  • Presentación y visualización

Habilidades necesarias para convertirse en Data Scientist

Aproximadamente más del 40% de los puestos de científicos de datos necesitan un título avanzado. Tal como un MBA o Ph.D. Más del 80% de los científicos de datos tienen títulos de maestría. Más del 45% tienen doctorados. Las siguientes son las habilidades requeridas de los científicos de datos.

  • Conocimiento profundo de la codificación Python. Es el lenguaje más común, incluido Perl, Ruby, etc.
  • Conocimiento sólido de SAS / R
  • Es necesario que el científico de datos pueda trabajar con datos no estructurados. Ya sea que provenga de videos, redes sociales, etc.
  • Habilidad de sonido en la codificación de bases de datos SQL.
  • Data Scientist debería tener una buena comprensión de varias funciones analíticas. Por ejemplo rango, mediana, etc.
  • Se requiere un conocimiento profundo del aprendizaje automático.
  • Un científico de datos debe estar familiarizado con Hive , mahout, redes bayesianas , etc. En ciencia de datos, el conocimiento de MySQL es como una ventaja adicional.

Para saber más, consulte el siguiente enlace:

Habilidades necesarias para convertirse en Data Scientist

Suponiendo que no está dispuesto a obtener primero las habilidades matemáticas necesarias para ciertos aspectos de la ciencia de datos, simplemente no hay forma de que aprenda temas como aprendizaje automático, procesamiento del lenguaje natural, etc. Puede aprender cómo implementarlos, pero eso solo llevarte tan lejos

Dicho esto, no todo en ciencia de datos requiere matemáticas. Debería poder aprender el preprocesamiento de datos, la visualización de datos y las porciones de arquitectura de datos de la ciencia de datos, por lo que probablemente comenzaría allí. Puede consultar algunos tutoriales relevantes aquí, aquí y aquí. Cubro mucho de este material en los mini-cursos que enseño en Byte Academy.

Puede comenzar tomando un curso sobre estadísticas. Echa un vistazo a este curso: Taller de probabilidad y estadística – Udemy

Más tarde, aplique métodos estadísticos utilizando paquetes de Python. Esto te daría un buen comienzo.

Comience aprendiendo las matemáticas. Es necesario comprender, aplicar y resolver problemas adecuadamente en el aprendizaje automático y la ciencia de datos. Necesitarás cálculo, álgebra lineal, estadística y teoría de la probabilidad.