Quiero aprender Python para el análisis de datos y el aprendizaje automático. ¿De dónde debería comenzar?

Gracias por A2A,

Bueno, no hay ciencia espacial en el aprendizaje de Python para la ciencia de datos y el aprendizaje automático, pero es difícil guiarlo aquí, ya que no proporcionó su información educativa. Así que tengo que asumir que es algo, digamos, no sabes nada sobre análisis y python.

Aquí está la ecuación simple para convertirse en científico de datos usando Python.

Ciencia de datos = Matemáticas + Estadísticas + SQL + Python + ML con Python.

La gente a menudo confunde con la ciencia de datos como tema. Pero no es el caso. La ciencia de datos es un término mucho más amplio que cualquier materia. Si está más fresco y busca su primer trabajo, entonces necesita repasar sus habilidades básicas que requieren más en ciencia de datos.

Las matemáticas y las estadísticas se consideran el alma de la ciencia de datos. Todos los días se ocupará de estadísticas y matemáticas.

1. Puede repasar su concepto matemático como Álgebra lineal y cálculo aquí: https://www.khanacademy.org/math

2. Después de las matemáticas, te sugiero que aprendas algunos conceptos de estadística aquí: Khan Academy

Antes de ir y comenzar a jugar con datos, te sugiero que aprendas a jugar primero con SQL. Hoy en día, muchos gigantes de TI buscan personas que tengan conocimiento de SQL. Puede aprender SQL fácilmente si recibe ayuda de Internet.

1. SQLZOO: SQLZOO

2. Canal de YouTube: Tutoriales de SQL para principiantes / Tutoriales de Oracle Database.

Bueno, después de todo, debes tener conocimiento de un lenguaje de programación. Tenemos ‘Python’ y ‘R’, pero como mencionó sobre python, intentaré proporcionar información aquí. Python es bueno para comenzar. Te sugiero que sigas este enlace: http://qr.ae/8Dnrog

Después de leer el artículo anterior, recomendaría a las personas que aprendan las bibliotecas de ciencia de datos de Python desde aquí: Python

Si está interesado en R, aquí está el enlace que debe seguir: http://qr.ae/1U3nls

Lo último es pasar al vasto concepto de Machine Learning. Sigue este enlace https://www.datacamp.com/communi…

Esto no es suficiente, pero es bueno para los principiantes. Necesitaba más ayuda? Siéntase libre de enviarme un mensaje.

Para comenzar con cualquier aspecto del aprendizaje automático, primero debe tener una base sólida en Matemáticas. Las matemáticas básicas del nivel XII deberían ser suficientes para comenzar su viaje en Machine Learning y Data Science.

Para las matemáticas, necesita repasar los siguientes temas:

1. Álgebra lineal y cálculo : puede estudiar en Khan Academy , MIT Open Courseware (MIT OCW) , Udacity (curso de actualización de álgebra lineal) o utilizar libros de referencia como Advanced Engineering Mathematics de Kreyszig . Pulir sus conceptos sobre álgebra lineal será útil para comprender muchos aspectos del aprendizaje automático, como la optimización de hiperparámetros, las funciones de regularización y el análisis de conglomerados; nombrar algunos entre muchos.

2. Cálculo vectorial : para el cálculo vectorial nuevamente, puede seguir los recursos mencionados anteriormente. Y brillante | La matemática y la ciencia bien hechas también es una aplicación muy interactiva para ayudarte a aclarar los conceptos de la misma.

3. Estadísticas : junto con los recursos mencionados anteriormente, puede completar el curso “Introducción a las estadísticas” sobre Udacity para proporcionar sus habilidades de análisis estadístico.

Una vez que tenga bastante confianza en su destreza matemática, puede embarcarse en su viaje de ciencia de datos y aprendizaje automático. Para aprender Python para Data Science y Machine Learning, debe aprovechar los siguientes recursos:

1. Curso completo de Python Bootcamp en Udemy por Jose Portilla:

Un curso brillantemente diseñado, con todo el paradigma esencial de Python en el orden cronológico correcto para convertirte en un maestro del lenguaje de programación Python. Después del final del curso, tendrá bastante confianza en sus habilidades de Python y será eficiente en la codificación con Python.

2. Python para ciencia de datos y aprendizaje automático de Vidya digital

  • Especialícese en análisis de datos y aprendizaje automático utilizando la programación Python.
  • Obtenga una comprensión profunda de los diferentes paquetes en Python, como NumPy, SciPy, Pandas y Scikit-Learn.
  • Ser capaz de implementar modelos de aprendizaje automático y PNL.
  • Aprenda con la ayuda de estudios de casos, proyectos y muchas tareas prácticas.

3. IBM Cognitive Classes – Python para la especialización de ciencia de datos:

Curso certificado gratuito para que obtenga conocimiento y aprenda Data Science y Machine Learning de la manera correcta, la clase cognitiva de IBM seguramente no lo decepcionará. Al finalizar, también tiene la oportunidad de recibir una insignia de seguimiento de IBM.

4. Python Foundations Nanodegree y Data Analytics Nanodegree- Udacity:

Un poco caro como una opción, pero con el apoyo continuo de los mentores, el foro activo de la comunidad, los proyectos interactivos y el programa de estudios artesanales de última generación, estos nanogrados ofrecidos por el gigante de E-learning son obvios.

5. KDNuggets y AnalyticsVidya: estos sitios web ofrecen una gran carga de información, recursos y publicaciones de blog sobre ciencia de datos y aprendizaje automático. Asegúrese de seguirlos activamente y nunca se pierda el ritmo de los últimos desarrollos en el dominio de Machine Learning y Data Science.

6. O’Reilly Python Cookbook e Introducción al aprendizaje automático usando Python: estos libros de la famosa publicación O’reilly son seguramente imprescindibles. Con contenido detallado y teorías para aclarar sus conceptos, O’Reilly ofrece todo lo que exigimos saber en Machine Learning y Data Science.

Después de completar estos cursos, siempre puede probar sus habilidades y avanzar con su propio proyecto en Machine Learning o Data Science. Todo lo mejor.

¿Tiene usted alguna pregunta?

Espero que esto ayude. Si aún quieres orientación, puedes enviarme un mensaje. Te ayudaré con tus dudas.

Python es un popular lenguaje de programación de código abierto y es uno de los lenguajes más utilizados en inteligencia artificial y otros campos científicos relacionados. El aprendizaje automático (ML), por otro lado, es el campo de la inteligencia artificial que utiliza algoritmos para aprender de los datos y hacer predicciones. El aprendizaje automático ayuda a predecir el mundo que nos rodea.

Desde automóviles autónomos hasta predicciones del mercado de valores y aprendizaje en línea, el aprendizaje automático se utiliza en casi todos los campos que utilizan la predicción como una forma de mejorarse. Debido a su uso práctico, es una de las habilidades más demandadas en este momento en el mercado laboral. No tiene que ser un científico de datos para estar fascinado con el mundo del aprendizaje automático, pero algunas guías de viaje pueden ayudarlo a navegar por el vasto universo que también incluye grandes datos, inteligencia artificial y aprendizaje profundo, junto con una gran dosis de estadísticas y análisis.

Además, comenzar con Python y el aprendizaje automático es fácil, ya que hay muchos recursos en línea y muchas bibliotecas de aprendizaje automático de Python disponibles. Por ejemplo:

  • Theano : lanzado hace casi una década y desarrollado principalmente por un grupo de aprendizaje automático en la Universidad de Montreal, es uno de los compiladores matemáticos de CPU y GPU más utilizados en la comunidad de aprendizaje automático.
  • TensorFlow : es una biblioteca de código abierto para computación numérica que utiliza gráficos de flujo de datos, es un recién llegado al mundo del código abierto, pero este proyecto liderado por Google ya tiene casi 15,000 confirmaciones y más de 600 contribuyentes en GitHub, y casi 12,000 estrellas en su repositorio de modelos.
  • scikit-learn : una biblioteca de software de aprendizaje automático para el lenguaje de programación Python. Cuenta con varios algoritmos de clasificación, regresión y agrupamiento que incluyen máquinas de vectores de soporte, bosques aleatorios, aumento de gradiente, k- medias y DBSCAN, y está diseñado para interactuar con las bibliotecas numéricas y científicas de Python NumPy y SciPy.

Actualmente hay muchos sitios web de código abierto disponibles para aprender Python

  1. Code Academy Este portal es el más adecuado para codificadores principiantes e intermedios. Puedes practicar directamente en tu navegador y ver los resultados en vivo. Esto es útil para los principiantes, ya que elimina la necesidad de configurar un entorno de desarrollo para ejercicios de práctica.
  2. Aprende Python el duro Ofrecen libros electrónicos gratuitos de Python y también ofrecen una versión en línea a la que se puede acceder desde cualquier dispositivo, incluido el móvil, y siempre es gratis.
  3. Python para el aprendizaje automático y la ciencia de datos: curso gratuito completo: gran aprendizaje para la vida Cuando termine este tutorial, comprenderá bien la programación de Python, especialmente cómo trabajar con las bibliotecas Numpy y Pandas y cómo almacenar y manipular datos utilizando matrices y marcos de datos. Podrá usar Python para resolver problemas de ciencia de datos, visualización de datos y análisis de datos.
  4. Python Class de Google Debido a la naturaleza del material, este es el más adecuado para codificadores intermedios a experimentados. Los documentos explican claramente varios conceptos relacionados con Python, pero se trata más de teoría que de aplicación práctica.
  5. Python Tutor es un portal para aprender los conceptos básicos de programación y familiarizarse con un montón de lenguajes, incluidos Python, Java, JavaScript, C ++, Ruby y más.

Yo personalmente recomendaría Python para el aprendizaje automático y la ciencia de datos: curso gratuito completo: gran aprendizaje para la vida porque el tutorial es absolutamente gratuito y muy fácil de entender para un principiante. Las cosas se enseñan paso a paso, todo es práctico y no teórico, y no supone conocimientos previos de programación o estadísticas. Se enseñan todos los temas y aspectos de Python que necesita saber desde una perspectiva de ciencia de datos o aprendizaje automático. Es fácil perderse y perder tiempo aprendiendo muchos aspectos diferentes, paquetes menos utilizados o casos de uso. Me gusta este curso porque cubre solo lo que se necesita y no más y está bien explicado.

Al igual que con el aprendizaje de nuevas habilidades, cuanto más practiques, mejor serás. Practique diferentes algoritmos y trabaje con diferentes conjuntos de datos para comprender mejor el aprendizaje automático y para mejorar sus habilidades generales de resolución de problemas.

Espero que esta respuesta haya sido útil. ¡Disfruta codificando!

Python es la elección de los científicos de datos en estos días para realizar sus actividades diarias, ya que tiene una amplia gama de bibliotecas de código abierto, y todo es gratis .

Python es sin duda el lenguaje más adecuado para un científico de datos . Pero, ¿alguna vez has imaginado por qué Python se usa para el análisis de datos y el aprendizaje automático?

Permítanme enumerar algunos puntos que lo ayudarán a comprender por qué las personas usan Python para Data Science:

  • Python es un lenguaje de código abierto gratuito, flexible y potente
  • Python reduce el tiempo de desarrollo a la mitad con su sintaxis simple y fácil de leer
  • Con Python, puede realizar manipulación, análisis y visualización de datos.
  • Python proporciona bibliotecas potentes para aplicaciones de aprendizaje automático y otros cálculos científicos.

¿Y conoces la mejor parte? Data Scientist es uno de los trabajos mejor pagados que gana alrededor de $ 130,621 por año según Indeed.com.

Ahora, volviendo a su pregunta, debe comenzar con los fundamentos de la programación de Python y luego explorar varias bibliotecas utilizadas para el aprendizaje automático.

Fundamentos de la programación de Python:

Variables : Variables se refiere a las ubicaciones de memoria reservadas para almacenar los valores. En Python, no necesita declarar variables antes de usarlas o incluso declarar su tipo.

Tipos de datos : Python admite numerosos tipos de datos, lo que define las operaciones posibles en las variables y el método de almacenamiento. La lista de tipos de datos incluye: numérico, listas, cadenas, tuplas, conjuntos y diccionario.

Operadores : los operadores ayudan a manipular el valor de los operandos. La lista de operadores en Python incluye: aritmética, comparación, asignación, lógica, bit a bit, membresía e identidad.

Declaraciones condicionales : las declaraciones condicionales ayudan a ejecutar un conjunto de declaraciones basadas en una condición. Hay tres declaraciones condicionales: If, Elif y Else.

Bucles : los bucles se utilizan para iterar a través de pequeños fragmentos de código. Hay tres tipos de bucles, a saber: Bucles while, for y anidados.

Funciones : las funciones se utilizan para dividir su código en bloques útiles, lo que le permite ordenar el código, hacerlo más legible, reutilizarlo y ahorrar algo de tiempo.

También puede pasar por esta grabación:

Bibliotecas utilizadas para el análisis de datos y el aprendizaje automático:

Esta es la parte donde el poder real de Python con la ciencia de datos entra en escena. Python viene con numerosas bibliotecas para computación científica, análisis, visualización, etc. Algunas de ellas se enumeran a continuación:

  • Numpy : NumPy es una biblioteca central de Python para Data Science que significa ‘Python numérico’. Se utiliza para la informática científica, que contiene un poderoso objeto de matriz n-dimensional y proporciona herramientas para integrar C, C ++, etc. También se puede utilizar como contenedor multidimensional para datos genéricos donde puede realizar varias operaciones NumpyOperations y funciones especiales.
  • Matplotlib : Matplotlib es una biblioteca poderosa para la visualización en Python. Se puede usar en scripts Python, shell, servidores de aplicaciones web y otros kits de herramientas de GUI. Puede usar diferentes tipos de gráficos y cómo funcionan varios gráficos con Matplotlib.
  • Pandas : Pandas es una biblioteca importante en Python para la ciencia de datos. Se utiliza para la manipulación y análisis de datos. Es adecuado para diferentes datos, como series de tiempo tabulares, ordenadas y no ordenadas, datos de matriz, etc.
  • Scikit-learn : Scikit learn es una de las principales atracciones, donde puedes implementar el aprendizaje automático con Python. Es una biblioteca gratuita que contiene herramientas simples y eficientes para análisis de datos y minería. Puede implementar varios algoritmos, como la regresión logística utilizando scikit-learn.
  • Seaborn – Seaborn es una biblioteca de trazado estadístico en Python. Entonces, cada vez que use Python para la ciencia de datos, usará matplotlib (para visualizaciones 2D) y Seaborn, que tiene sus hermosos estilos predeterminados y una interfaz de alto nivel para dibujar gráficos estadísticos.

Además, puede ver el video a continuación que explica los conceptos fundamentales de la ciencia de datos utilizando python. También lo ayudará a analizar, manipular e implementar el aprendizaje automático utilizando varias bibliotecas de Python como NumPy, Pandas y Scikit-learn.

¡Espero que esto ayude! 🙂

Aquí están mis dos centavos para comenzar con Python en la realización de análisis de datos. En primer lugar, si planea usar Python para análisis de datos, desarrollo web o aeroespacial, siempre necesita conocer los componentes básicos del lenguaje, como variables, tipos de datos, funciones, condicionales y bucles.

Una vez que los conozca, puede continuar y explorar bibliotecas especializadas de Python que se adapten a sus necesidades. Para el análisis de datos, la mejor biblioteca, y sin duda la mejor, son los pandas.

Desafortunadamente, los datos no siempre vienen como un archivo CSV agradable y limpio. Puedo decir por experiencia que a veces la limpieza de datos lleva mucho más tiempo del esperado. Afortunadamente, Python proporciona algunas técnicas extremadamente versátiles para limpiar incluso los datos más sucios. Para realizar tales acciones, deberá abrir los archivos de datos utilizando técnicas y métodos de bucle proporcionados por la biblioteca de pandas .

Pandas proporciona métodos fáciles de usar que pueden concatenar muchos archivos CSV, unir tablas basadas en columnas coincidentes, calcular nuevas columnas, agrupar y pivotar datos, y exportar tablas a diferentes formatos de archivo.

Estos datos se pueden visualizar utilizando bibliotecas de Python como matplotlib y seaborn produciendo varios gráficos de archivos de imagen. Y todas estas operaciones se pueden realizar en muy pocas líneas de código. Como ya sabrás, Python es el número uno en eficiencia y legibilidad de código.

Puede aprender todo esto utilizando diferentes recursos como videos de YouTube, documentación específica de la biblioteca, ver ejemplos, etc.

Si está en una fecha límite, entonces podría buscar un curso completo de Python que enseñe tanto los fundamentos de Python como las técnicas avanzadas de análisis de datos.

Yo propondría el siguiente curso. Es un curso completo ya que lo lleva desde lo básico hasta la construcción de un programa de análisis de datos. Trabajará con datos del mundo real y producirá algunos resultados interesantes al final.

Aquí está el enlace al mejor Instituto de Python en Delhi Capacitación de analistas de datos

Es realmente fácil aprender Python para la ciencia de datos y el aprendizaje automático. Te diré algunos pasos que debes seguir para aprender Python para Data Science.

Paso 1 – Aprenda los conceptos básicos de Python

Le sugiero que lea este Tutorial de Python para aprender los conceptos básicos de Python y que se prepare con los siguientes temas:

Funciones de Python

Operadores de Python

Listas de Python

Comprensiones de Python

Tuplas de pitón

Diccionario de Python y comprensión del directorio

Toma de decisiones en Python

Bucles en Python

Paso 2 – Configura tu máquina

Sugiero que Anaconda se prepare para Data Science. Es una distribución de código abierto para Python y R para procesamiento de datos a gran escala, análisis predictivo y computación científica. También puede descargarlo desde Inicio . Tiene todo lo que necesita para que Python aprenda ciencia de datos y aprendizaje automático.

Paso 3 – Aprende expresiones regulares

Si está trabajando con datos de texto, la expresión regular será útil con la limpieza de datos. Es un proceso de detección y corrección de registros corruptos de un conjunto de registros, tabla o base de datos. Identifica partes de datos incompletas, inexactas, incorrectas e irrelevantes y las reemplaza, modifica o elimina.

Paso 4 – Bibliotecas esenciales para la ciencia de datos

Una biblioteca es un conjunto de objetos y funciones preexistentes que se pueden importar a su script para ahorrar tiempo y esfuerzos.

a. NumPy

si. Pandas

do. Ciencia

re. Matplotlib

mi. scikit-learn

F. Seaborn

Paso 5 – Hacer proyectos y aprender más

Construyó algo real en Python. Te quedarás atascado y gradualmente encontrarás nuevas formas de salir de tu problema. Comience con el problema disponible en la web y luego tome los suyos.

y

Practica Practica Practica y eso es todo

Si le gusta la respuesta, UPVOTE y siga mi cuenta para obtener más respuestas sobre Data Science.

Si quieres aprender Python para ML y análisis de datos correctamente.

Te sugeriré el mejor curso de Python para ti.

  • Python for Data Science y Machine Learning Bootcamp

¡Aprenda a usar NumPy, Pandas, Seaborn, Matplotlib, Plotly, Scikit-Learn, Machine Learning, Tensorflow y más!

Este curso está diseñado para principiantes con cierta experiencia en programación o desarrolladores experimentados que buscan dar el salto a la ciencia de datos y el aprendizaje automático.

Aquí algunos de los temas que aprenderemos :

  • Programando con Python
  • NumPy con Python
  • Uso de marcos de datos de pandas para resolver tareas complejas
  • Use pandas para manejar archivos de Excel
  • Raspado web con python
  • Conecte Python a SQL
  • Use matplotlib y seaborn para visualizaciones de datos
  • Use plotly para visualizaciones interactivas
  • Aprendizaje automático con SciKit Learn, que incluye:
  • Regresión lineal
  • K vecinos más cercanos
  • K significa agrupamiento
  • Árboles de decisión
  • Bosques al azar
  • Procesamiento natural del lenguaje
  • Redes neuronales y aprendizaje profundo
  • Máquinas de vectores de soporte
  • ¡y mucho, mucho más!

Recursos adicionales: – Mejora tus habilidades

  • Bootcamp de ciencia de datos y aprendizaje automático con R
  • Ciencia de datos y aprendizaje automático con Python: ¡manos a la obra!

Todo lo mejor .

Si quieres aprender Python para el análisis de datos y el aprendizaje automático. Únase al mejor instituto de capacitación de TI en Ghaziabad conocido como SoftCrayons Tech Solutions.

Aquí está el contenido de la tabla para hacerle saber los temas que debe estudiar para aprender Python para el análisis de datos.

  1. Conceptos básicos de Python para el análisis de datos
  2. ¿Por qué aprender Python para el análisis de datos?
  3. Python 2.7 v / s 3.4 ¿Cómo instalar Python?
  4. Ejecutar algunos programas simples en Python
  5. Python bibliotecas y estructuras de datos
  6. Estructuras de datos de Python
  7. Iteración de Python y construcciones condicionales
  8. Bibliotecas Python
  9. Análisis exploratorio en Python usando pandas
  10. Introducción a series y marcos de datos
  11. Conjunto de datos de Analytics Vidhya: problema de predicción de préstamos
  12. Munging de datos en Python usando pandas
  13. Construyendo un modelo predictivo en Python
  14. Regresión logística
  15. Árbol de decisión
  16. Bosque al azar

Aprenderá todos estos temas bajo la guía de instructores expertos de SoftCrayons Tech Solutions. Puede solicitar cualquier consulta desde nuestro sitio web http://www.softcrayons.com .

Nuestro llámenos al (+91) 8545012345

Visite nuestra oficina: 693 SECTOR-14A, Vasundhara Ghaziabad- 201012

Programación con Python : Python es uno de los lenguajes de programación más populares y utilizados para Data Analytics porque es más bien un lenguaje dinámico en comparación con otros lenguajes de “scripting”.

Las bibliotecas en Python, que incluyen pandas, cython, matplotlib, numpy, scipy, etc., junto con su curva de aprendizaje fácil, lo hacen favorable para que los analistas trabajen en conjuntos de datos extensos. Con la presencia de paquetes interactivos de terceros como BeautifulSoup (Análisis de datos), OpenCV (Análisis de imagen y video) y Psyplot (Visualización interactiva) le da al usuario más poder para analizar y visualizar conjuntos de datos.

Camino de aprendizaje

Comience con academia de códigos y complete todos los ejercicios que están presentes. Tomará un máximo de 10 días completarlos todos, si puede dedicar al menos tres horas todos los días. Cubre todos los conceptos básicos en Python.

Una vez que haya completado los ejercicios, tome este cuaderno I python: Tutoriales de Python Essentials.

Esto cubrirá todos los conceptos que no estaban presentes en la academia de códigos. Puede tomar el curso y completarlo dentro de una o dos horas.

Ahora comience con los conceptos básicos de las bibliotecas de Python:

Numpy

El paquete fundamental para el cálculo científico con python es aprender NumPy. Te ayudará más en Pandas.

Puedes echar un vistazo a este cuaderno de notas de I Python, que cubre operaciones frecuentes con Numpy – Tutorial básico de Numpy

Pandas

Los pandas contienen estructuras de datos de alto nivel y herramientas de manipulación para que el análisis de datos sea más rápido y fácil en Python.

Este tutorial incluye trabajar con marcos de datos, trabajar con valores perdidos, etc. – Pandas Basics Tutorial

Matplotlib

Este es un tutorial de cuatro partes de Matplotlib.

  • 1ra parte:

La primera parte presenta las funcionalidades básicas de Matplotlib, los tipos básicos de figuras.

MatplotLib Parte 1

  • 2da parte:

Cubre cómo controlar el estilo y el color de una figura, como marcadores, grosor de línea, patrones de línea y el uso de mapas de color.

MatplotLib Part2

  • 3ra parte:

Anotación de una figura: composición de varias figuras, control del rango del eje, relación de aspecto y sistema de coordenadas.

MatplotLib Part3

  • 4ta parte:

Cubiertas que trabajan con figuras complejas.

MatplotLib Part4

Cursos

  • Udacity – Programa de nanogrado
  • Edx – Python
  • Programación de Python Coursera
  • Imarticus

Conferencias de video

  • Google Python Class – TODOS – YouTube
  • thenewboston
  • MIT OpenCourseWare
  • Serie de tutoriales básicos de Python 3 – YouTube (Sentdex)

Recursos para aprender análisis de datos con Python

  • Coursera – Ciencia de datos a escala | Coursera y ciencia de datos aplicados con Python | Coursera
  • Aprenda ciencia de datos con Python: especialícese en análisis de datos y aprendizaje automático con la programación de Python.
  • Edx – Introducción a Python para Data Science
  • Lynda – Introducción al análisis de datos con Python
  • DataCamp – Aprenda Python para Data Science – Curso en línea
  • Udemy – Aprendizaje de Python para análisis y visualización de datos
  • Intellipaat – Aprenda ciencia de datos, curso de Python de la capacitación en línea y tutorial | Intellipaat.com
  • Dataquest: aprenda ciencia de datos con Python y R. Comience de forma gratuita.
  • Dezyre – Curso de formación en ciencias de datos

Blogs

  • Aprendizaje automático de ML rápido hecho fácil.
  • Ingeniería de Airbnb La página de ingeniería de Airbnb tiene un excelente contenido para charlas tecnológicas, códigos de fuente abierta, noticias, datos y vale la pena echarle un vistazo.
  • DataCamp Este blog tiene una ruta detallada para mostrarle cómo puede abordar el análisis de datos con Python. Tiene una serie de cursos gratuitos para comenzar.
  • Google Research Google está impulsando en gran medida el aprendizaje automático con códigos de fuente abierta y acceso a varios videos, documentos y tutoriales.
  • Cursos basados ​​en el proyecto Dataquest.
  • Yhat Blog Este es uno de los famosos blogs de ciencia de datos y aprendizaje automático. Yhat está detrás de Python IDE Rodeo y ggplot (un paquete para trazar en Python).

Después de haber adquirido todos los conocimientos necesarios para Analytics, comience a solicitar algunas pasantías. Hay muchas compañías que pagan generosamente a Data Analyst Intern. En última instancia, todo se reduce a su determinación y pasión por el análisis de datos.

¡Todo lo mejor!

Hace apenas un año, estaba enfrentando un problema similar. Esto es lo que me funcionó:

Creo que hacer estos dos pasos simultáneamente te llevará por buen camino.

1) Si conoce algún otro lenguaje de programación, intente retomar la sintaxis de Python lo más rápido posible y también acostúmbrese a la abstracción con paquetes que creo que son el verdadero sabor de Python.

Pero si este va a ser su primer idioma, le recomiendo que lea un libro que explique los conceptos básicos de programación y la sintaxis. Estos son algunos buenos libros para python-

Piense Python – Prensa de té verde

Aprende Python de la manera difícil

O también puedes hacer un MOOC en python.

2) ANÁLISIS DE DATOS : la mejor manera de comenzar esto es ensuciarse las manos.

Descargue un conjunto de datos del repositorio de UCI ML y comience a limpiarlo y verifique algunas visualizaciones y obtenga un análisis estadístico simple de los datos.Además, lea la documentación de los siguientes paquetes de Python: numpy, scipy, pandas, sklearn (ML) .

( El nivel básico de estadística es esencial ).

Estadísticas : Udacity te ofrece tres cursos: estadística básica, estadística inferencial, estadística descriptiva. Hacer esto te ayudará mucho y estos no son los cursos tradicionales de estadística aburrida que encuentras en tu plan de estudios universitario.

3) APRENDIZAJE DE LA MÁQUINA : hay un curso de ML en curso por un profesor de la Universidad de Stanford- Andrew NG (este es el mejor curso de ML para principiantes y completarlo se considera un requisito fundamental)

Andrew explica varios algoritmos de ML y también entra en las matemáticas necesarias para comprenderlos y expresarlos.

Una cosa que puedes alterar es que, en el curso, dice que es mejor crear un prototipo en Octave o Matlab (la razón que da para esto es válida). Pero no es necesario que aprendas desde cero (aunque no es necesario mucho tiempo).

Lo que puede hacer es después de comprender las matemáticas y trabajar un algoritmo del curso, intente codificarlo en python usted mismo. Esto le dará una visión más profunda del algoritmo y también le proporcionará la práctica de codificación necesaria. Si puede No lo haga funcionar que intente buscar en Google y aprender dónde no se equivoca.

Este es un enlace a mi repositorio en Github donde subiré las implementaciones de ML (en PYTHON) –

yagamiash / ML-Algos

Espero que esto te ayude….

Espero que esto te ayude….

Data Science es un vasto dominio. Requiere una mezcla de habilidades multidisciplinarias que van desde una intersección de matemáticas, estadística, informática, comunicación y negocios.

Siendo un profesional de Data Science, puedo recomendar algunos de los mejores cursos disponibles:

Aquí hay una lista que puede seguir para alcanzar su objetivo:

  1. Aprenda la programación Python Python : lo ayudará a adquirir experiencia en análisis cuantitativo, minería de datos y presentación de datos para ver más allá de los números al transformar su carrera en el rol de Científico de Datos. Aprenderá a usar bibliotecas como Pandas, Numpy, Matplotlib, Scipy, Scikit, Pyspark y dominará conceptos como aprendizaje automático de Python, scripts, secuencia, raspado web y análisis de grandes datos aprovechando Apache Spark. A continuación se muestra el curso, puede ir para dominar Python: Curso de certificación de Python | Entrenamiento Python | Edureka
  2. Ciencia de datos con Python: este curso de ciencia de datos en Python lo ayuda a adquirir experiencia en varios algoritmos de aprendizaje automático, como regresión, agrupación, árboles de decisión, bosque aleatorio, Naïve Bayes y Q-Learning. Lo expone a conceptos de estadísticas, series temporales y diferentes clases de algoritmos de aprendizaje automático, como algoritmos supervisados, no supervisados ​​y de refuerzo. A lo largo del curso de certificación de ciencia de datos, resolverá casos de estudio de la vida real en medios, atención médica, redes sociales, aviación, recursos humanos: capacitación en certificación de ciencia de datos | Curso de Python para la ciencia de datos | Edureka

Espero que esto ayude. Feliz aprendizaje..!!

Python de la manera difícil

Un libro imprescindible para principiantes en python, este libro proporciona una visión clara de la programación que te instruye en Python al desarrollar y establecer habilidades lentamente a través de técnicas como la práctica y la memorización, y luego aplicarlas a problemas cada vez más difíciles.

Una vez que haya terminado con este libro, intente comprender los ejemplos y el código de Python en git-hub (analice todos y cada uno de los pasos e intente descubrir la lógica detrás de esos ejemplos). También eche un vistazo a los ejercicios de Google en Python e intente depurar los errores. por su cuenta

Como paso final, aprenda tantos algoritmos relacionados con el aprendizaje automático como árbol de decisión, k significa, bosque aleatorio, vecino más cercano, etc. (también puede encontrar el código de Python para estos algoritmos en git-hub).

Necesita aprender las siguientes bibliotecas.

  1. Pandas: para manipular y almacenar datos en tablas o marcos de datos.
  2. Matplotlib: para visualización de datos.
  3. Sklearn: biblioteca de aprendizaje automático, esta biblioteca lo ayudará a aplicar algoritmos de aprendizaje automático a los datos muy rápidamente.

Dicho esto, necesita poca intuición de aprendizaje automático, manipulación básica de cadenas de Python, listas, diccionario, matrices numpy.

Para aplicar algoritmos de aprendizaje profundo, necesitaría Theano o Tensorflow. Se podría hacer más fácil usando keras.

Estos tutoriales deberían ayudarlo a comenzar, los códigos utilizados también están disponibles en GitHub.

Análisis de datos con Python: Análisis de datos con Python – YouTube

Estos tutoriales lo ayudarán a comenzar, pero eventualmente necesitará aprender a leer la documentación oficial de las bibliotecas y usar el desbordamiento de la pila para cualquier pregunta.

Además de esto, también le recomiendo que lea las discusiones en los conjuntos de datos de kaggle, que le darán una gran intuición, que es muy importante en el análisis de datos.

Todo lo mejor.

El paquete Python no es difícil de aprender:

Numpy, scipy, pandas y scikit- learn y matplotlib para visualización.

Pero el requisito real de este paquete es construir EDA en los datos.

Comprender los datos y hacerlos limpios y reducirlos con el propósito de

El aprendizaje automático es la tarea más importante.

Aunque pocos algoritmos requieren un vasto estudio como el sistema de recomendación, el algoritmo de refuerzo y la red neuronal.

Comience desde la regresión lineal, KNN, K significa agrupación, Naive Bayes, etc.

Aprender el descenso de gradiente, encontrar la raíz, etc., como parte de los fundamentos del aprendizaje automático.

Nota: Soy el fundador de la consultora de análisis de datos y capacitación avanzada y

curso sobre ciencia de datos completa de IA, ML y python que cubrí en

Inteligencia artificial y aprendizaje automático + aprendizaje profundo

si tiene alguna consulta: llame al +919008231835 / mail a [correo electrónico protegido]

Hay algunas bibliotecas que desearía haber conocido:
subproceso : una biblioteca estándar que permite operaciones similares a cmd (o envío de comandos directamente a la línea de comandos. Me encontré usándolo mucho.
pandas – ¿Urgiendo alejarse de Excel? ¡Prueba esta biblioteca de marcos de datos! También lo familiarizará con las técnicas de importación de Python, como la comprensión y todo lo que es un objeto.
matraz : herramienta simple de desarrollo web. Enseña sobre desarrollo web, decoradores (un montón) y paradigma MVC.
Yo también prefiero Unittest cuando se trata de pruebas porque es simplista. Árboles de decisión y bosques aleatorios: una introducción visual para principiantes: una guía simple para el aprendizaje automático con árboles de decisión, Chris Smith – Amazon.com

Ciencia de los datos

Saludos,

Gracias por mostrar su interés en el curso de Data Science .

Collabera – una compañía de servicios de personal global de $ 600 millones.

TACT : el galardonado brazo de capacitación de Collabera sobre tecnologías emergentes.

Collabera TACT ha sido galardonado con el título de “Mejor proveedor de capacitación en línea” en tecnologías emergentes por la revista Silicon India. Nuestro curso de capacitación abarca todo el espectro de conocimiento, desde los conceptos básicos hasta la comprensión profunda de las ideas centrales a través del curso y su ejecución en casos de uso de la industria de gran alcance, al tiempo que presenta ideas clave y mejora la competencia.

Descripción del curso

Este curso potenciará tus habilidades en lo siguiente:

·

Implemente Data Analytics Lifecycle para proyectos de big data.

·

Cambiar el marco de un desafío desde la perspectiva del negocio a la analítica.

·

Comprenda qué técnicas y herramientas analíticas funcionarán en un análisis específico de big data. Creación de modelos estadísticos y también comprender qué ideas pueden conducir a resultados procesables.

·

Utilice varias herramientas de big data como Hadoop, MapR, R, In-Database Analytics y MADLib.

·

Comprenda cómo el análisis avanzado aprovecha para crear una ventaja competitiva. También cómo las funciones de los científicos de datos y analistas de BI son diferentes entre sí.

Para obtener más información sobre el curso, adjunte el contenido del curso.

Metodología de entrenamiento

·

LMS le permite tener acceso a todos los materiales del curso, módulos y grabaciones audiovisuales de cada sesión que se cargarán en LMS y serán accesibles para toda la vida.

·

Se proporcionará la aplicación para realizar tareas prácticas y está disponible para toda la vida.

·

Al completar con éxito la capacitación, Collabera TACT proporcionará un certificado para el reconocimiento global.

Si está interesado, ayúdeme con su información de contacto o comuníquese conmigo en [correo electrónico protegido] .

Actividades de aprendizaje muy detalladas realizadas en ad2brand.

Resuelve consultas de inmediato. Cubre todos los temas especificados en el plan de estudios y proporciona orientación adecuada sobre lo que debe hacer un estudiante individual.

La facultad se asegura de que todos los estudiantes completen las actividades prácticas dentro de la clase misma.

caracteristicas:

  1. Sesiones de entrenamiento práctico con ejemplos prácticos.
  2. Proyectos en vivo con asistencia de laboratorio
  3. Oportunidades de colocación y programas de mejora profesional

Haga clic aquí: https://www.ad2brand.com/digital

Antes de saltar directamente al aprendizaje automático y al análisis de datos, debe tener un sólido conocimiento de estadísticas y luego solo usted puede proceder a codificar su algoritmo.

Pruebe Coursera – Cursos gratuitos en línea de las mejores universidades | Coursera o Learn to code, sin embargo, revise las estadísticas básicas con Excel y lea algunos libros para obtener estadísticas avanzadas, ya que necesita estar familiarizado con todas las herramientas estadísticas.

Consulte nuestro blog para obtener más información: software BISON POS con visualización y análisis de datos

Si desea explorar de cerca los cursos de análisis de big data o Python y el aprendizaje automático, definitivamente debe examinar su propia aptitud desde el principio. Debes ser muy hábil y apasionado por las matemáticas y las estadísticas junto con los lenguajes de programación. Inicialmente, puede ordenar los conceptos matemáticos como cálculo y álgebra lineal y también debe aprender estadísticas. También debe aprender SQL y un lenguaje de programación al menos. A partir de entonces, puede tomar el curso de ciencia de datos adecuado para progresar más. Acadgild, por ejemplo, tiene un curso de maestría en ciencia de datos donde cubre Python y Machine Learning junto con otros aspectos de la ciencia de datos. También hay muchos otros proveedores de cursos.

Te sugiero que tomes el Curso Básico de Python disponible en Udemy por Jose Portilla (Complete Python Boot Camp Zero to Hero in Python). Simultáneamente, puede instalar Anaconda y usar Spyder en su computadora portátil y practicar su aprendizaje de manera práctica.

Una vez hecho esto, puede comenzar a aprender bibliotecas de Python. Los más importantes son Numpy, Pandas, Matplotlib y Sci kitlearn.

Esto debería hacer para comenzar a aplicar modelos a conjuntos de datos usando Python.

¡Feliz aprendizaje!

More Interesting

¿Cuál es la mejor manera de encontrar el conjunto de patrones similares en datos de series de tiempo?

Como científico de datos, ¿qué te inspiró a seguir una carrera en ciencia de datos?

¿Qué tan pronto la automatización afectará el futuro del arte conceptual?

¿Cuándo debo usar la agrupación antes de ejecutar un modelo de regresión logística?

¿Cuáles son las formas en que puede aplicar la máquina o el aprendizaje profundo al pirateo?

¿Cuánto importa el aprendizaje automático en ciencia de datos?

¿Cuáles son algunas aplicaciones de muestreo de importancia en Deep Learning?

Cómo encontrar qué variable de característica es más predictiva en un problema de clasificación binaria

Cómo calcular la probabilidad de que una oración aparezca en algún lugar del texto usando Word2Vec

¿Es posible que una aplicación de aprendizaje automático que ejecute el mismo algoritmo y se alimente con los mismos datos para aprender cosas diferentes en pruebas de entrenamiento separadas?

¿Cuáles son los modelos de redes neuronales más básicos que un principiante debe aprender?

¿Cuáles son las propiedades utilizadas para agrupar partículas en tipos?

Estamos viendo el comienzo de las máquinas que pueden codificar. ¿Aprender un lenguaje de programación aún sería útil en la carrera de ML?

¿Puedo ser un ingeniero de aprendizaje automático con habilidades en desarrollo web y móvil?

¿Qué intentos hay para crear redes neuronales más similares al cerebro biológico?