Para comenzar una carrera en aprendizaje automático, debe tener la experiencia de desarrollo con cualquier lenguaje de programación (ya sea Python, R, SAS, etc.) Ahora, permítame presentarle el concepto de aprendizaje automático y luego entraremos en el meollo del asunto. arenosos de cómo puede perseguir esto como una carrera.
Descripción general del aprendizaje automático
El aprendizaje automático es un tipo de inteligencia artificial que permite que las aplicaciones de software aprendan de los datos y se vuelvan más precisos para predecir resultados sin intervención humana.
¿Pero cómo sucede eso?
Para eso, la máquina necesita capacitación sobre algunos datos y, basándose en eso, detectará un patrón para crear un modelo. Este proceso de obtener conocimiento de los datos y proporcionar información de gran alcance tiene que ver con el aprendizaje automático. Consulte la imagen a continuación para comprender mejor su funcionamiento:
Ahora, para entrar en detalles sobre el aprendizaje automático, tenemos tres tipos principales:
- Aprendizaje supervisado
- Aprendizaje sin supervisión
- Aprendizaje reforzado
Como ya mencioné al principio, debes estar bien versado en el lenguaje de programación. En mi experiencia, de hecho, me he enamorado de Python, que no me deja ir a ningún otro lado ni elegir ningún otro lenguaje de programación. ¡Es así de buenos chicos!
Incluso puede leer este blog que lo ayudará a comprender cuán poderoso es Python: las 10 razones principales para aprender Python
Hablando de python y machine learning, tenemos una biblioteca de código abierto scikit-learn, que se utiliza para realizar el aprendizaje automático.
Descripción general de Scikit-learning (Biblioteca de aprendizaje automático)
Scikit learn es una biblioteca de Python que está licenciada bajo BSD y es reutilizable en varios contextos, fomentando el uso académico y comercial. Proporciona una variedad de algoritmos de aprendizaje supervisados y no supervisados en Python. Scikit learn consta de algoritmos y bibliotecas populares. Además de eso, también contiene los siguientes paquetes:
- NumPy
- Matplotlib
- Ciencia (Python Científico)
Para implementar Scikit learn, primero debemos importar los paquetes anteriores. Si no está familiarizado con estas bibliotecas, puede echar un vistazo a mis blogs en Numpy y Matplotlib. Puede descargar estos dos paquetes usando la línea de comando o si está usando PyCharm, puede instalarlo directamente yendo a su configuración de la misma manera que lo hace para otros paquetes.
Tomemos un ejemplo donde tomaremos un conjunto de datos de dígitos y categorizará los números para nosotros, por ejemplo: 0 1 2 3 4 5 6 7 8 9. Consulte el código a continuación:
import
matplotlib.pyplot as plt
from
sklearn import
datasets
from
sklearn import
svm
digits=
datasets.load_digits()
print(digits.data)
Salida –
[[0. 0. 5.…, 0. 0. 0.]
[0. 0. 0.…, 10. 0. 0.]
[0. 0. 0.…, 16. 9. 0.]
…
[0. 0. 1.…, 6. 0. 0.]
[0. 0. 2.…, 12. 0. 0.]
[0. 0. 10.…, 12. 1. 0.]]
Aquí acabamos de importar las bibliotecas, SVM, conjuntos de datos e imprimimos los datos. Es una gran variedad de datos de dígitos donde se almacenan los datos. Da acceso a las funciones que se pueden usar para clasificar las muestras de dígitos .
Aprendizaje y predicción
Luego, en Scikit learn, hemos utilizado un conjunto de datos (muestra de 10 clases posibles, dígitos de cero a nueve) y necesitamos predecir los dígitos cuando se da una imagen. Para predecir la clase, necesitamos un estimador que ayude a predecir las clases a las que pertenecen las muestras no vistas. En Scikit learn, tenemos un estimador de clasificación que es un objeto de Python que implementa los métodos de ajuste (x, y) y predicción (T). Consideremos el siguiente ejemplo:
import
matplotlib.pyplot as plt
from
sklearn import
datasets
from
sklearn import
svm
digits=
datasets.load_digits() //
dataset
clf =
svm.SVC(gamma=0.001, C=100)
print(len(digits.data))
x,y=digits.data[:-1],digits.target[:-1] //
train the data
clf.fit(x,y)
print('Prediction:', clf.predict(digits.data[-1])) //predict the data
plt.imshow(digits.images[-1],cmap=plt.cm.gray_r, interpolation="nearest")
plt.show()
Salida –
1796
Predicción: [8]
En el ejemplo anterior, primero encontramos la longitud y cargamos 1796 ejemplos. A continuación, hemos utilizado estos datos como datos de aprendizaje, donde necesitamos probar el último elemento y el primer elemento negativo. Además, debemos verificar si la máquina ha predicho los datos correctos o no. Para eso, usamos Matplotlib donde mostramos la imagen de los dígitos. Para concluir, tiene datos de dígitos, obtuvo el objetivo, lo ajusta y lo predice y, por lo tanto, ¡está listo para comenzar! Es realmente rápido y fácil, ¿no?
También puede visualizar las etiquetas de destino con una imagen, solo consulte el siguiente código:
import
matplotlib.pyplot as plt
from
sklearn import
datasets
from
sklearn import
svm
digits=
datasets.load_digits()
# Join the images and target labels in a list
images_and_labels =
list(zip(digits.images, digits.target))
# for every element in the list
for
index, (image, label) in
enumerate(images_and_labels[:8]):
# initialize a subplot of 2X4 at the i+1-th position
plt.subplot(2, 4, index +
1)
# Display images in all subplots
plt.imshow(image, cmap=plt.cm.gray_r,interpolation='nearest')
# Add a title to each subplot
plt.title('Training: '
+
str(label))
# Show the plot
plt.show()
Como puede ver en el código anterior, hemos utilizado la función ‘zip’ para unir las imágenes y las etiquetas de destino en una lista y luego guardarla en una variable, digamos images_and_labels. Después de eso, hemos indexado los primeros ocho elementos en una cuadrícula de 2 por 4 en cada posición. Después de eso, acabamos de mostrar las imágenes con la ayuda de Matplotlib y agregamos el título como ‘entrenamiento’.
Puede leer más aquí: Scikit Learn – Machine Learning usando Python
Mientras tanto, también grabé un video para YouTube donde comencé con el aprendizaje automático y luego cómo implementarlo usando Scikit learn en Python. También lo llevará a través de varios algoritmos. Eche un vistazo y hágame saber sus pensamientos al respecto. ¡Feliz aprendizaje! 🙂
Ahora, hablando de ello desde la perspectiva de la carrera, puede continuar con el análisis de datos, lo que lleva a un rol de científico de datos . Una cosa es segura, no puede convertirse en un científico de datos de la noche a la mañana. ¡Es un viaje seguro y desafiante!
Supongo que está más fresco, por lo que si planea comenzar su carrera en Data Science, hay una estadía prolongada. Debes estar bien versado en todas las habilidades necesarias para convertirte en un Científico de Datos.
¿Quieres conocer la hoja de ruta completa para convertirte en un científico de datos?
Revise el siguiente video que incluye todas las habilidades necesarias para convertirse en un Data Scientist moderno. Este video responderá la mayoría de sus preguntas.
¡Espero que mi respuesta haya hecho justicia a tu pregunta!