¿Cuáles son los diferentes tipos de algoritmos de aprendizaje automático?

En un nivel amplio, uno puede categorizar algoritmos basados en la forma en que se proporcionan los datos para aprender. Las siguientes son las principales categorías de algoritmos de aprendizaje:

Aprendizaje supervisado: en esta configuración, proporcionamos a un modelo un conjunto de datos de capacitación, que consta de los datos y las etiquetas verdaderas. Con estos datos, se aprende un modelo. Obviamente aquí, cuantos más datos, mejor será el rendimiento del modelo en ejemplos desconocidos. Los factores clave aquí son que el modelo debería generalizarse a ejemplos invisibles. La clasificación, la regresión y la clasificación caen dentro de este paradigma de aprendizaje.
Aprendizaje no supervisado: en esta configuración, el modelo organiza automáticamente los datos sin ningún ejemplo etiquetado. Ejemplos de esto incluyen Agrupación de datos, resumen, etc. Los datos se organizan en función de la similitud de los elementos de datos.
Aprendizaje semi supervisado: este es un híbrido entre no supervisado y supervisado, donde algunos de los datos están etiquetados, mientras que un gran conjunto de datos en realidad no está etiquetado. Los algoritmos aquí toman todos los datos etiquetados y usan de manera inteligente los datos no etiquetados para mejorar el rendimiento del modelo.
Aprendizaje en línea / Aprendizaje activo: en este paradigma, los algoritmos siguen mejorando a sí mismos mediante el uso de la retroalimentación de un humano en el bucle.

Dentro de cada uno de estos paradigmas de aprendizaje, hay varias técnicas de modelado diferentes. Por supuesto, incluso antes de llegar al aspecto de modelado (es decir, qué modelo de aprendizaje automático usar, uno debe elegir el conjunto correcto de características. Esto se llama ingeniería de características, y esto a menudo juega un papel importante para obtener buenos resultados. Esto a menudo también requiere experiencia en el campo.

Dado el conjunto de características y el entorno de aprendizaje (ya sea supervisado, aprendizaje en línea, etc.), la siguiente pregunta es qué modelo de aprendizaje automático utilizar. La elección de esto depende del problema en cuestión. Lo segrego en tres tipos de modelos.

Aprendizaje profundo o redes neuronales multicapa: las redes neuronales profundas han encontrado una tremenda aplicabilidad, particularmente dada la gran cantidad de cómputo y los grandes conjuntos de datos que tenemos en estos días. Esto es útil en varios dominios problemáticos donde es muy difícil crear características, por ejemplo, clasificación de imágenes, reconocimiento de voz, reconocimiento facial, etc. Los modelos de aprendizaje profundo aprenden automáticamente la representación, o en otras palabras, realizan tanto la ingeniería de características como el modelado . Para ambos problemas, hay varias recetas muy comunes y plataformas de código abierto disponibles.
Conjuntos y modelos basados en árboles de decisión: Esto incluye árboles de decisión, bosques aleatorios y árboles impulsados por gradientes. Estos modelos son útiles en varias tareas de predicción donde las características son más o menos evidentes (por ejemplo, predicción de la casa, predicción del comportamiento del cliente, predicción de abandono, etc.). Los árboles impulsados por gradientes, en particular, han encontrado mucho éxito en estos problemas.
Modelos lineales: Estos incluyen modelos como regresión lineal, regresión logística, SVM, etc. Debido a su simplicidad, estos deberían ser los primeros en intentar un problema. Además, funcionan mejor en problemas en los que uno tiene grandes características categóricas (en la escala de varios millones o miles de millones de características de identificación). Estos modelos lineales no solo se adaptan muy bien a este tamaño de problemas, sino que también funcionan bien para incluir la dispersión, etc., es decir, seleccionar automáticamente solo un pequeño subconjunto de características para que no sea cero y establecer el resto en cero.

En general, existen varios paradigmas muy interesantes en el aprendizaje automático y tener una visión completa de 360 grados de las técnicas ayuda a comprender el conjunto de técnicas a utilizar para resolverlas de manera eficiente.

AlgoritmosAprendizaje automáticoClasificacióninformática

Related Content

¿Qué es un sistema ciberfísico?

¿Cómo resumiría las ideas centrales del aprendizaje automático y el aprendizaje profundo?

¿Qué base de datos usa SQL ANSI puro? ¿Es MySQL, Oracle, PostgreSQL o SQL Server?

¿Cómo crear documentación para un proyecto de software? ¿Qué debo escribir en la documentación?

Cómo comenzar un trabajo de investigación en Machine Learning si soy un novato

¿Por qué los megabytes no son exactamente 1 millón de bytes?

Cómo asegurarme de que mi red de computadoras esté segura

El objetivo principal de los algoritmos de aprendizaje automático es resolver ciertos problemas. Estos “problemas” se encuentran en los diferentes tipos de aprendizaje automático.

El aprendizaje automático se divide en tres categorías principales.

Aprendizaje supervisado : aquí, el sistema se entrena utilizando datos pasados (que incluyen entradas y salidas), y es capaz de tomar decisiones o hacer predicciones cuando se encuentran nuevos datos.
Aprendizaje no supervisado: el sistema puede reconocer patrones, similitudes y anomalías, teniendo en cuenta solo los datos de entrada.
Aprendizaje de refuerzo : el sistema toma las decisiones sobre la base de la recompensa / castigo que recibió por la última acción que realizó.

Ahora, cada uno de estos tipos de aprendizaje automático tiene los “problemas” que mencioné antes.

Los cuatro problemas principales son:

1. Clasificación:

Aquí los datos deben dividirse en una serie de categorías diferentes basadas en la capacitación con datos pasados. Un ejemplo de un problema de clasificación sería cómo podemos clasificar los correos electrónicos como correo no deseado o de otra manera utilizando correos electrónicos recibidos previamente que ya se han identificado. Un famoso algoritmo que puede usarse para resolver problemas de clasificación es el teorema de Naive Bayes.

2. Regresión:

Predecimos un valor para una entrada en función de la información recibida previamente. Aunque esto suena similar a la clasificación, considerando que ambos usan datos pasados para hacer predicciones, su similitud termina allí. En el caso de la regresión, estás tratando de estimar un valor y no solo una clase de observación.

Ahora consideremos la predicción del clima. La probabilidad de que llueva hoy se puede calcular midiendo otros factores climáticos como la temperatura, la humedad, la presión, la velocidad del viento, la dirección del viento y luego viendo cómo se correlacionan con las lluvias en el pasado. Si las mediciones tomadas hoy están fuertemente correlacionadas con los días en que llovió, entonces la probabilidad de que llueva es alta hoy. El algoritmo de regresión lineal es uno que se usa comúnmente para resolver este problema.

3. Agrupación:

Esto usa un método donde asignamos un conjunto de observaciones en subconjuntos. Estos subconjuntos se conocen como grupos. Y las observaciones dentro de estos grupos son similares entre sí, según un parámetro u otro. Por lo tanto, todos los datos se dividen en grupos.

Un ejemplo de cuándo se utiliza la agrupación en clúster, cuando un proveedor de telecomunicaciones desea establecer una red en una región mediante la instalación de torres allí, utiliza el algoritmo de agrupación en clúster, teniendo en cuenta las áreas que proporcionarían una conectividad óptima a todos los usuarios y el rango máximo a torre celular tendría, para dividir toda la región en grupos. K-Means es un método utilizado de manera prominente para agrupar datos en k-grupos basados en algunas medidas de similitud.

4. Asociación:

En un problema de asociación, identificamos patrones de asociaciones entre diferentes variables o elementos.

Sus conceptos se aplican a los sitios web de comercio electrónico, donde pueden sugerirle otros artículos para que compre, en función de las compras anteriores que haya realizado.

Espero que esto te ayude a comprender mejor estos conceptos. Para más información sobre este tema, le sugiero que mire:

¡Espero que esto te ayude a entender! Si está interesado en obtener más información sobre el aprendizaje automático y obtener un conocimiento profundo, consulte nuestra Capacitación de certificación de aprendizaje automático de Simplilearn.

Nitin Thappar

Los siguientes son los principales tipos de aprendizaje automático y algoritmos (ML):

ML sin supervisión: cuando el conjunto de datos no está etiquetado (no se deben predecir etiquetas de características o clases / categorías). Los algoritmos utilizados son algoritmos de agrupación, como KMEAN, Hierarchical, DBSCAN, etc. Estos algoritmos dividen el conjunto de datos en grupos / agrupaciones similares, como los segmentos de mercado.
ML supervisado: cuando el conjunto de datos está etiquetado (tiene una función de etiqueta para predecir). Hay dos tipos de algoritmos:

Algoritmos de regresión para la predicción de características numéricas no enteras (p. Ej. Temperatura, ventas, etc.), utilizando algoritmos de regresión
Clasificación para la predicción de una etiqueta / clase (pruebas médicas: p. Ej. Malignas, no malignas; pronóstico del tiempo: soleado, nublado, lluvioso, caliente, frío, etc.). Los principales algoritmos de clasificación son: Vecinos K-Nearest: KNN, Regresión logística, Support Vector Machine (SVM), Descion Trees, Bayesian Algorithm, Artificial Neural Networks (ANN) y otros algoritmos basados en ANN como Deep Learning.

Sistemas de recomendación: algoritmos especiales utilizados para recomendar a los clientes (por ejemplo, películas, ropa, comida, libros, etc.)

Algoritmos de detección de fraude: algoritmos especiales para la detección de fraude, como fraude con tarjetas de crédito, fraude de seguros, etc.

Un buen curso introductorio es el curso de aprendizaje automático de Andrew Ng impartido por Coursera.

Rishabh Iyer

Existen varias técnicas de aprendizaje automático:

Aprendiendo sobre ejemplos

Este método significa que un sistema de aprendizaje automático utiliza ejemplos. Google aplicó este tipo de aprendizaje en su servicio de Gmail, mientras implementaba la clasificación automática de spam.

Aprendiendo sobre la experiencia

El sistema aprende de acuerdo con su experiencia previa basada en respuestas positivas o negativas.

Auto aprendizaje

Aquí, los algoritmos avanzados de aprendizaje automático analizan diferentes estructuras de datos por su cuenta, extrayendo algunos patrones generales de ellos.

Aprendizaje profundo

Este método requiere modelos matemáticos más complicados que podrían usarse para definir el contenido de las imágenes o reconocer el habla, etc.

Tipos de aprendizaje automático

Todos estos métodos se aplican generalmente dentro del análisis de contenido de medios y el análisis de aprendizaje automático de Big Data .