Cómo aprender el aprendizaje automático en Python (con ejemplos)

Primero aprende Python . Luego, entrar en el aprendizaje automático.

Tome el mejor curso en línea de Machine Learning y luego aprenda.

Mejor curso en línea de Python.

La Biblia de Python ™ | Todo lo que necesitas programar en Python

Variables : ¡aprenda a almacenar convenientemente datos en sus programas!
Números : ¡aprenda cómo funcionan los números detrás de escena en sus programas!
Cadenas – ¡Domina el texto de Python y automatiza los mensajes usando cadenas!
Lógica y estructuras de datos : ¡ enseñe a su programa a pensar y decidir!
Bucles : ahorre tiempo y esfuerzo , haciendo que las computadoras hagan el trabajo duro por usted.
Funciones – ¡ Automatice tareas creando sus propias funciones de Python que puede usar una y otra vez!
OOP : agregue Python a su currículum al dominar la programación orientada a objetos, ¡ el estándar de programación de la industria!

El mejor curso en línea de aprendizaje automático

Machine Learning AZ ™: Python práctico y R en ciencia de datos

Aprenda a crear algoritmos de aprendizaje automático en Python y R con dos expertos en ciencia de datos. Plantillas de código incluidas.

Este curso ha sido diseñado por dos científicos de datos profesionales para que podamos compartir nuestro conocimiento y ayudarlo a aprender teoría compleja, algoritmos y bibliotecas de codificación de una manera simple.

  • Parte 1: preprocesamiento de datos
  • Parte 2: Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinómica, SVR, Regresión de árbol de decisión, Regresión forestal aleatoria
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación del árbol de decisión, Clasificación aleatoria del bosque
  • Parte 4 – Agrupación: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento del lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de dimensionalidad: PCA, LDA, Kernel PCA
  • Parte 10 – Selección y refuerzo del modelo: validación cruzada k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está repleto de ejercicios prácticos basados ​​en ejemplos en vivo. Entonces, no solo aprenderá la teoría, sino que también obtendrá práctica práctica para construir sus propios modelos.

Todo lo mejor .

Recursos adicionales :-

  • Bootcamp de ciencia de datos y aprendizaje automático con R
  • Aprendizaje automático para ciencia de datos

El aprendizaje automático es un campo que utiliza algoritmos para aprender de los datos y hacer predicciones. Prácticamente, esto significa que podemos introducir datos en un algoritmo y usarlos para hacer predicciones sobre lo que podría suceder en el futuro. Esto tiene una amplia gama de aplicaciones, desde automóviles autónomos hasta predicción de precios de acciones.

Python tiene un sorprendente ecosistema de bibliotecas que hacen que el aprendizaje automático sea fácil de comenzar. Utilizaremos las excelentes bibliotecas Scikit-learn, Pandas y Matplotlib .

Primero, necesitas Python instalado. Como utilizaremos paquetes de computación científica y aprendizaje automático en algún momento, le sugiero que instale Anaconda. Es una implementación de Python de potencia industrial para Linux, OSX y Windows, completa con los paquetes necesarios para el aprendizaje automático, incluidos numpy, scikit-learn y matplotlib.

El conjunto de datos

Antes de sumergirnos en el aprendizaje automático, exploraremos un conjunto de datos y descubriremos qué podría ser interesante de predecir. El conjunto de datos es de BoardGameGeek y contiene datos sobre 80000 juegos de mesa. Esta información fue raspada amablemente en formato csv .

El conjunto de datos contiene varios puntos de datos sobre cada juego de mesa. Aquí hay una lista de los interesantes:

  • name : nombre del juego de mesa.
  • playingtime : el tiempo de juego (dado por el fabricante).
  • minplaytime : el tiempo mínimo de reproducción (dado por el fabricante).
  • maxplaytime : el tiempo máximo de reproducción (dado por el fabricante).
  • minage : la edad mínima recomendada para jugar.
  • users_rated : la cantidad de usuarios que calificaron el juego.
  • average_rating : la calificación promedio otorgada al juego por los usuarios. (0-10)
  • total_weights : número de pesos dados por los usuarios. Weight es una medida subjetiva compuesta por BoardGameGeek. Es lo “profundo” o complicado que es un juego.
  • promedio_peso: el promedio de todos los pesos subjetivos (0-5).

Introducción a los pandas

El primer paso en nuestra exploración es leer los datos e imprimir algunas estadísticas de resumen rápido. Para hacer esto, usaremos la biblioteca Pandas. Pandas proporciona estructuras de datos y herramientas de análisis de datos que hacen que la manipulación de datos en Python sea mucho más rápida y efectiva. La estructura de datos más común se denomina trama de datos . Un marco de datos es una extensión de una matriz, por lo que hablaremos sobre qué es una matriz antes de volver a los marcos de datos.

Nuestro archivo de datos tiene este aspecto (eliminamos algunas columnas para que sea más fácil de ver):

id, tipo, nombre, año publicado, minplayers, maxplayers, tiempo de juego
12333, juego de mesa, Twilight Struggle, 2005,2,2,180
120677, juego de mesa, Terra Mystica, 2012,2,5,150

Esto está en un formato llamado csv , o valores separados por comas, sobre los cuales puede leer más aquí. Cada fila de datos es un juego de mesa diferente, y los diferentes puntos de datos sobre cada juego de mesa están separados por comas dentro de la fila. La primera fila es la fila del encabezado y describe qué es cada punto de datos. El conjunto completo de un punto de datos, que desciende, es una columna.

Podemos conceptualizar fácilmente un archivo csv como una matriz:

1 2 3 4
1 nombre de tipo de identificación publicado por año
2 12333 juego de mesa Twilight Struggle 2005
3 120677 juego de mesa Terra Mystica 2012

Si desea aprender profundamente o está dispuesto a trabajar con la mejor compañía de aprendizaje automático en India, haga clic aquí.

He respondido la misma pregunta antes. Dando la misma respuesta con pocas modificaciones.

En primer lugar, aprenda primero las siguientes bibliotecas de Python:

  • NumPy
  • Pandas
  • Matplotlib

En segundo lugar, aprenda los siguientes temas antes de sumergirse en el aprendizaje automático:

  • Álgebra lineal (espacios vectoriales, sistemas lineales, descomposición de matrices, etc.)
  • Cálculo (derivadas parciales, gradientes de función, etc.)

Eche un vistazo al siguiente curso introductorio sobre probabilidad y estadística: estadística y probabilidad en ciencia de datos usando Python

Tome estos cursos gratuitos de edX para obtener una educación real (los cursos tienen una buena cantidad de ejemplos):

  1. Aprendizaje automático para la ciencia de datos: aprenderá una variedad de algoritmos de aprendizaje supervisados ​​y no supervisados, y la teoría detrás de esos algoritmos.
  2. Inteligencia Artificial (IA): “Aquí viene el rey del poder, y lo llamo AI: D” . Puedes aprender Introducción a la IA, Historia de la IA, Crear agentes inteligentes (búsqueda, juegos, etc.), algoritmos de aprendizaje automático, Aplicaciones de IA (procesamiento del lenguaje natural, robótica / visión)
  3. Aprendizaje automático: verá pocos temas repetitivos que haya visto en los dos cursos anteriores. Si no está aburrido, intente verlos nuevamente.

Intenta hacer algunos proyectos en tiempo real. Participa en competiciones de Kaggle.

¡Espero que esto ayude!

Siéntase libre de comentar aquí, si tiene alguna pregunta.

¡Feliz aprendizaje!

ML con python es un poco difícil de estudiar en línea, ya que no obtienes todo en un solo lugar. Si está dispuesto a tomar un curso pago, le sugiero que lo haga en Statinfer – Aprenda de los datos. Lo lanzarán en unos días muy probablemente. Como hice una pasantía allí, solo estoy compartiendo mi experiencia aquí. Statinfer tiene un equipo de datos muy fuerte y sus conferencias, laboratorios, proyectos, etc. son muy precisos y directos. El proyecto que se le dará en ese curso le dará una idea completa de ML en python, análisis de datos, etc. ¡Todo lo mejor!

PD: No hay negocios de marketing. Genuinamente compartiendo mi experiencia !!

Es mejor tomar cualquier curso en línea. En el mundo hay varios cursos de aprendizaje automático disponibles, te sugiero

Los mejores cursos en línea de aprendizaje automático

Machine Learning AZ ™: Python práctico y R en ciencia de datos

Este curso ha sido diseñado por dos científicos de datos profesionales para que podamos compartir nuestro conocimiento y ayudarlo a aprender teoría compleja, algoritmos y bibliotecas de codificación de una manera simple.

Aquí puedes aprender

  • Parte 1: preprocesamiento de datos
  • Parte 2: Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinómica, SVR, Regresión de árbol de decisión, Regresión forestal aleatoria
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación del árbol de decisión, Clasificación aleatoria del bosque
  • Parte 4 – Agrupación: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento del lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de dimensionalidad: PCA, LDA, Kernel PCA
  • Parte 10 – Selección y refuerzo del modelo: validación cruzada k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está repleto de ejercicios prácticos basados ​​en ejemplos en vivo. Entonces, no solo aprenderá la teoría, sino que también obtendrá práctica práctica para construir sus propios modelos.

Recursos adicionales :-

  • Python for Data Science y Machine Learning Bootcamp
  • principiante a avanzado: aprendizaje automático y redes neuronales

La mejor de las suertes.

Puede comenzar desde aquí: su primer proyecto de aprendizaje automático en Python paso a paso: dominio del aprendizaje automático. Hay muchos otros tutoriales de programación en Python Programming Tutorials

Otro buen enlace de referencia http://www.kdnuggets.com/2015/11

Personalmente, quiero sugerirle que si es muy nuevo en el aprendizaje automático, primero debe tener conocimientos básicos sobre los conceptos básicos de Python, especialmente el uso de pandas y paquetes numpy.

Y después de eso puedes tomar los cursos de ML en Coursera: –

  1. Para una comprensión profunda, puede tomar el curso Andrew NG.
  2. Luego hay muchos recursos sobre cómo aplicar los algoritmos de ML usando Python. Puedes ver los videos de Siraj Raval en youtube, también es un gran maestro.

Gracias…

Probablemente, una buena manera de hacerlo sería comenzar aprendiendo diferentes bibliotecas como scikit, numpy, mat plotlib. Una vez que obtenga la esencia básica, el mejor lugar al que puede ir es Coursera y aprender el aprendizaje automático del curso Andrew Ng. El chico es prácticamente un dios en el aprendizaje automático. La otra cosa que es realmente importante es aprender cálculo y obtener algunos conocimientos sobre conjuntos de datos y diferentes modelos utilizados para analizarlos.

Puede comenzar a aprender y practicar Python utilizando el siguiente sitio web, tiene IDE en línea, declaraciones de problemas junto con la solución.

Ejercicios de Python, práctica, solución – w3resource

Espero que te ayude !!!

Puede comenzar con Udacity machine learning nanodegree:

Ingeniero de Aprendizaje Automático Nanodegree | Udacity

Consulte Cómo iniciar AI / ML / DL desde cero. ¡¡Buena suerte!!

Hay muchos cursos GRATIS en Coursera, Kaggle, Udacity. son buenos puntos de partida para el aprendizaje automático

Podrías leer el libro

“Ciencia de datos desde cero”

¡Feliz aprendizaje!

More Interesting

¿Cómo se convierten los físicos en ingenieros de aprendizaje automático?

¿Cuál es el mejor algoritmo para descubrir características bien correlacionadas?

¿Debo aprender primero el aprendizaje profundo o de refuerzo? ¿Hay un orden natural? ¿Debería hacerse al mismo tiempo?

¿Qué es el aprendizaje automático en la predicción de emociones basada en texto?

¿Cómo nos beneficia exactamente el entrenamiento previo en los métodos de aprendizaje profundo?

¿Cuál es la diferencia entre la clasificación de vectores de soporte y la regresión? ¿Un regresor de vectores de soporte se comporta como una red neuronal por casualidad?

Redes neuronales artificiales: ¿Qué determina si un problema de clasificación no trivial para el aprendizaje profundo se puede dividir en capas convolucionales en lugar de capas completamente conectadas?

¿Cuáles son las ventajas y desventajas de utilizar PMML como formato de intercambio para modelos de análisis predictivo?

¿Cómo debería abordar el problema de segmentar el césped de una imagen?

Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

¿Por qué utilizamos la política codiciosa de epsilon para la evaluación en el aprendizaje por refuerzo?

¿Se puede utilizar el aprendizaje automático para generar mapas de forma orgánica con solo usar datos de satélite de Google?

¿Qué es lo que más te gusta del aprendizaje automático?

¿Qué es más poderoso, la red neuronal convolucional o la red artificial? ¿Cuál es más conveniente de usar?

¿Cuáles son las principales diferencias entre la regresión logística, la red neuronal y las SVM?