¿Cuáles son los diferentes tipos de algoritmos de aprendizaje automático?

En un nivel amplio, uno puede categorizar algoritmos basados ​​en la forma en que se proporcionan los datos para aprender. Las siguientes son las principales categorías de algoritmos de aprendizaje:

  1. Aprendizaje supervisado: en esta configuración, proporcionamos a un modelo un conjunto de datos de capacitación, que consta de los datos y las etiquetas verdaderas. Con estos datos, se aprende un modelo. Obviamente aquí, cuantos más datos, mejor será el rendimiento del modelo en ejemplos desconocidos. Los factores clave aquí son que el modelo debería generalizarse a ejemplos invisibles. La clasificación, la regresión y la clasificación caen dentro de este paradigma de aprendizaje.
  2. Aprendizaje no supervisado: en esta configuración, el modelo organiza automáticamente los datos sin ningún ejemplo etiquetado. Ejemplos de esto incluyen Agrupación de datos, resumen, etc. Los datos se organizan en función de la similitud de los elementos de datos.
  3. Aprendizaje semi supervisado: este es un híbrido entre no supervisado y supervisado, donde algunos de los datos están etiquetados, mientras que un gran conjunto de datos en realidad no está etiquetado. Los algoritmos aquí toman todos los datos etiquetados y usan de manera inteligente los datos no etiquetados para mejorar el rendimiento del modelo.
  4. Aprendizaje en línea / Aprendizaje activo: en este paradigma, los algoritmos siguen mejorando a sí mismos mediante el uso de la retroalimentación de un humano en el bucle.

Dentro de cada uno de estos paradigmas de aprendizaje, hay varias técnicas de modelado diferentes. Por supuesto, incluso antes de llegar al aspecto de modelado (es decir, qué modelo de aprendizaje automático usar, uno debe elegir el conjunto correcto de características. Esto se llama ingeniería de características, y esto a menudo juega un papel importante para obtener buenos resultados. Esto a menudo también requiere experiencia en el campo.

Dado el conjunto de características y el entorno de aprendizaje (ya sea supervisado, aprendizaje en línea, etc.), la siguiente pregunta es qué modelo de aprendizaje automático utilizar. La elección de esto depende del problema en cuestión. Lo segrego en tres tipos de modelos.

  1. Aprendizaje profundo o redes neuronales multicapa: las redes neuronales profundas han encontrado una tremenda aplicabilidad, particularmente dada la gran cantidad de cómputo y los grandes conjuntos de datos que tenemos en estos días. Esto es útil en varios dominios problemáticos donde es muy difícil crear características, por ejemplo, clasificación de imágenes, reconocimiento de voz, reconocimiento facial, etc. Los modelos de aprendizaje profundo aprenden automáticamente la representación, o en otras palabras, realizan tanto la ingeniería de características como el modelado . Para ambos problemas, hay varias recetas muy comunes y plataformas de código abierto disponibles.
  2. Conjuntos y modelos basados ​​en árboles de decisión: Esto incluye árboles de decisión, bosques aleatorios y árboles impulsados ​​por gradientes. Estos modelos son útiles en varias tareas de predicción donde las características son más o menos evidentes (por ejemplo, predicción de la casa, predicción del comportamiento del cliente, predicción de abandono, etc.). Los árboles impulsados ​​por gradientes, en particular, han encontrado mucho éxito en estos problemas.
  3. Modelos lineales: Estos incluyen modelos como regresión lineal, regresión logística, SVM, etc. Debido a su simplicidad, estos deberían ser los primeros en intentar un problema. Además, funcionan mejor en problemas en los que uno tiene grandes características categóricas (en la escala de varios millones o miles de millones de características de identificación). Estos modelos lineales no solo se adaptan muy bien a este tamaño de problemas, sino que también funcionan bien para incluir la dispersión, etc., es decir, seleccionar automáticamente solo un pequeño subconjunto de características para que no sea cero y establecer el resto en cero.

En general, existen varios paradigmas muy interesantes en el aprendizaje automático y tener una visión completa de 360 ​​grados de las técnicas ayuda a comprender el conjunto de técnicas a utilizar para resolverlas de manera eficiente.

El objetivo principal de los algoritmos de aprendizaje automático es resolver ciertos problemas. Estos “problemas” se encuentran en los diferentes tipos de aprendizaje automático.

El aprendizaje automático se divide en tres categorías principales.

  • Aprendizaje supervisado : aquí, el sistema se entrena utilizando datos pasados ​​(que incluyen entradas y salidas), y es capaz de tomar decisiones o hacer predicciones cuando se encuentran nuevos datos.
  • Aprendizaje no supervisado: el sistema puede reconocer patrones, similitudes y anomalías, teniendo en cuenta solo los datos de entrada.
  • Aprendizaje de refuerzo : el sistema toma las decisiones sobre la base de la recompensa / castigo que recibió por la última acción que realizó.

Ahora, cada uno de estos tipos de aprendizaje automático tiene los “problemas” que mencioné antes.

Los cuatro problemas principales son:

1. Clasificación:

Aquí los datos deben dividirse en una serie de categorías diferentes basadas en la capacitación con datos pasados. Un ejemplo de un problema de clasificación sería cómo podemos clasificar los correos electrónicos como correo no deseado o de otra manera utilizando correos electrónicos recibidos previamente que ya se han identificado. Un famoso algoritmo que puede usarse para resolver problemas de clasificación es el teorema de Naive Bayes.

2. Regresión:

Predecimos un valor para una entrada en función de la información recibida previamente. Aunque esto suena similar a la clasificación, considerando que ambos usan datos pasados ​​para hacer predicciones, su similitud termina allí. En el caso de la regresión, estás tratando de estimar un valor y no solo una clase de observación.

Ahora consideremos la predicción del clima. La probabilidad de que llueva hoy se puede calcular midiendo otros factores climáticos como la temperatura, la humedad, la presión, la velocidad del viento, la dirección del viento y luego viendo cómo se correlacionan con las lluvias en el pasado. Si las mediciones tomadas hoy están fuertemente correlacionadas con los días en que llovió, entonces la probabilidad de que llueva es alta hoy. El algoritmo de regresión lineal es uno que se usa comúnmente para resolver este problema.

3. Agrupación:

Esto usa un método donde asignamos un conjunto de observaciones en subconjuntos. Estos subconjuntos se conocen como grupos. Y las observaciones dentro de estos grupos son similares entre sí, según un parámetro u otro. Por lo tanto, todos los datos se dividen en grupos.

Un ejemplo de cuándo se utiliza la agrupación en clúster, cuando un proveedor de telecomunicaciones desea establecer una red en una región mediante la instalación de torres allí, utiliza el algoritmo de agrupación en clúster, teniendo en cuenta las áreas que proporcionarían una conectividad óptima a todos los usuarios y el rango máximo a torre celular tendría, para dividir toda la región en grupos. K-Means es un método utilizado de manera prominente para agrupar datos en k-grupos basados ​​en algunas medidas de similitud.

4. Asociación:

En un problema de asociación, identificamos patrones de asociaciones entre diferentes variables o elementos.

Sus conceptos se aplican a los sitios web de comercio electrónico, donde pueden sugerirle otros artículos para que compre, en función de las compras anteriores que haya realizado.

Espero que esto te ayude a comprender mejor estos conceptos. Para más información sobre este tema, le sugiero que mire:

¡Espero que esto te ayude a entender! Si está interesado en obtener más información sobre el aprendizaje automático y obtener un conocimiento profundo, consulte nuestra Capacitación de certificación de aprendizaje automático de Simplilearn.

Los siguientes son los principales tipos de aprendizaje automático y algoritmos (ML):

  1. ML sin supervisión: cuando el conjunto de datos no está etiquetado (no se deben predecir etiquetas de características o clases / categorías). Los algoritmos utilizados son algoritmos de agrupación, como KMEAN, Hierarchical, DBSCAN, etc. Estos algoritmos dividen el conjunto de datos en grupos / agrupaciones similares, como los segmentos de mercado.
  2. ML supervisado: cuando el conjunto de datos está etiquetado (tiene una función de etiqueta para predecir). Hay dos tipos de algoritmos:
  1. Algoritmos de regresión para la predicción de características numéricas no enteras (p. Ej. Temperatura, ventas, etc.), utilizando algoritmos de regresión
  2. Clasificación para la predicción de una etiqueta / clase (pruebas médicas: p. Ej. Malignas, no malignas; pronóstico del tiempo: soleado, nublado, lluvioso, caliente, frío, etc.). Los principales algoritmos de clasificación son: Vecinos K-Nearest: KNN, Regresión logística, Support Vector Machine (SVM), Descion Trees, Bayesian Algorithm, Artificial Neural Networks (ANN) y otros algoritmos basados ​​en ANN como Deep Learning.
  • Sistemas de recomendación: algoritmos especiales utilizados para recomendar a los clientes (por ejemplo, películas, ropa, comida, libros, etc.)
  • Algoritmos de detección de fraude: algoritmos especiales para la detección de fraude, como fraude con tarjetas de crédito, fraude de seguros, etc.
  • Un buen curso introductorio es el curso de aprendizaje automático de Andrew Ng impartido por Coursera.

    Existen varias técnicas de aprendizaje automático:

    Aprendiendo sobre ejemplos

    Este método significa que un sistema de aprendizaje automático utiliza ejemplos. Google aplicó este tipo de aprendizaje en su servicio de Gmail, mientras implementaba la clasificación automática de spam.

    Aprendiendo sobre la experiencia

    El sistema aprende de acuerdo con su experiencia previa basada en respuestas positivas o negativas.

    Auto aprendizaje

    Aquí, los algoritmos avanzados de aprendizaje automático analizan diferentes estructuras de datos por su cuenta, extrayendo algunos patrones generales de ellos.

    Aprendizaje profundo

    Este método requiere modelos matemáticos más complicados que podrían usarse para definir el contenido de las imágenes o reconocer el habla, etc.

    Tipos de aprendizaje automático

    Todos estos métodos se aplican generalmente dentro del análisis de contenido de medios y el análisis de aprendizaje automático de Big Data .

    Más información en el artículo Importancia de las aplicaciones de aprendizaje automático en diversas esferas

    Estos son algunos algoritmos de aprendizaje automático utilizados para diversas funciones de ejecución de negociación de acciones:

    https://www.quantinsti.com/blog/

    https://www.quantinsti.com/blog/

    https://www.quantinsti.com/blog/

    https://www.quantinsti.com/blog/

    https://www.quantinsti.com/blog/

    Aprendizaje automático: una introducción a los árboles de decisión

    Espero que esto ayude 🙂

    Hola,

    Los algoritmos de aprendizaje automático son categorías en tres categorías:

    • Aprendizaje supervisado
    • Aprendizaje no supervisado y
    • Aprendizaje reforzado

    Estos se clasifican en función de la forma en que se realiza el aprendizaje.

    Puede encontrar detalles completos en ¿Qué es el aprendizaje automático? .

    Gracias