¿Qué tipos de algoritmos de aprendizaje automático se utilizan para resolver algunos problemas populares del mundo real?

Los algoritmos de aprendizaje automático se pueden dividir en 3 grandes categorías: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje de refuerzo. El aprendizaje supervisado es útil en los casos en que una propiedad ( etiqueta ) está disponible para un determinado conjunto de datos (conjunto de capacitación ), pero falta y debe predecirse para otras instancias. El aprendizaje no supervisado es útil en los casos en que el desafío es descubrir relaciones implícitas en un conjunto de datos sin etiquetar (los elementos no se asignan previamente). El aprendizaje de refuerzo se encuentra entre estos dos extremos: hay alguna forma de retroalimentación disponible para cada paso o acción predictiva, pero no hay una etiqueta precisa o mensaje de error.

Aprendizaje supervisado

1. Árboles de decisión : un árbol de decisión es una herramienta de apoyo a la decisión que utiliza un gráfico o modelo de decisiones en forma de árbol y sus posibles consecuencias, incluidos los resultados de eventos fortuitos, los costos de recursos y la utilidad.

Un árbol de decisión es el número mínimo de preguntas de sí / no que uno tiene que hacer, para evaluar la probabilidad de tomar una decisión correcta, la mayoría de las veces. Como método, le permite abordar el problema de una manera estructurada y sistemática para llegar a una conclusión lógica.

2. Clasificación Naïve Bayes : Los clasificadores Naïve Bayes son una familia de clasificadores probabilísticos simples basados ​​en la aplicación del teorema de Bayes con fuertes supuestos de independencia (ingenuos) entre las características. La imagen presentada es la ecuación: con P (A | B) es la probabilidad posterior, P (B | A) es la probabilidad, P (A) es la probabilidad previa de clase y P (B) es la probabilidad previa del predictor.

Algunos ejemplos del mundo real son:

  • Para marcar un correo electrónico como spam o no spam
  • Clasificar un artículo de noticias sobre tecnología, política o deportes.
  • ¿Verifica un texto que expresa emociones positivas o negativas?
  • Utilizado para el software de reconocimiento facial.

3. Regresión de mínimos cuadrados ordinarios : si conoce estadísticas, probablemente haya oído hablar de regresión lineal antes. Mínimos cuadrados es un método para realizar regresión lineal. Puede pensar en la regresión lineal como la tarea de ajustar una línea recta a través de un conjunto de puntos. Hay varias estrategias posibles para hacer esto, y la estrategia de “mínimos cuadrados ordinarios” es así: puede dibujar una línea y luego, para cada uno de los puntos de datos, medir la distancia vertical entre el punto y la línea, y sumarlos. ; la línea ajustada sería aquella donde esta suma de distancias es lo más pequeña posible.

Lineal se refiere al tipo de modelo que está utilizando para ajustar los datos, mientras que los mínimos cuadrados se refieren al tipo de métrica de error que está minimizando.

4. Regresión logística : la regresión logística es una forma estadística poderosa de modelar un resultado binomial con una o más variables explicativas. Mide la relación entre la variable dependiente categórica y una o más variables independientes mediante la estimación de probabilidades utilizando una función logística, que es la distribución logística acumulativa.

En general, las regresiones se pueden usar en aplicaciones del mundo real como:

  • Puntuacion de credito
  • Medir las tasas de éxito de las campañas de marketing.
  • Predecir los ingresos de un determinado producto.

5. Máquinas de vectores de soporte : SVM es un algoritmo de clasificación binario. Dado un conjunto de puntos de 2 tipos en lugar de N dimensiones, SVM genera un hiperlano (N – 1) dimensional para separar esos puntos en 2 grupos. Digamos que tiene algunos puntos de 2 tipos en un documento que son linealmente separables. SVM encontrará una línea recta que separa esos puntos en 2 tipos y está situada lo más lejos posible de todos esos puntos.

Aprendizaje sin supervisión

6. Algoritmos de agrupación : la agrupación es la tarea de agrupar un conjunto de objetos de modo que los objetos en el mismo grupo ( agrupación ) sean más similares entre sí que con los de otros grupos.

Cada algoritmo de agrupación es diferente, y aquí hay un par de ellos:

  • Algoritmos basados ​​en centroides
  • Algoritmos basados ​​en conectividad
  • Algoritmos basados ​​en densidad
  • Probabilístico
  • Reducción de dimensionalidad
  • Redes neuronales / aprendizaje profundo

7. Análisis de componentes principales : PCA es un procedimiento estadístico que utiliza una transformación ortogonal para convertir un conjunto de observaciones de variables posiblemente correlacionadas en un conjunto de valores de variables no correlacionadas linealmente llamadas componentes principales.

Algunas de las aplicaciones de PCA incluyen compresión, simplificación de datos para facilitar el aprendizaje, la visualización. Tenga en cuenta que el conocimiento del dominio es muy importante al elegir si desea continuar con PCA o no. No es adecuado en casos donde los datos son ruidosos (todos los componentes de PCA tienen una variación bastante alta).

8. Descomposición de valores singulares : en álgebra lineal, SVD es una factorización de una matriz compleja real. Para una matriz m * n M dada, existe una descomposición tal que M = UΣV, donde U y V son matrices unitarias y Σ es una matriz diagonal.

PCA es en realidad una aplicación simple de SVD. En la visión por computadora, los algoritmos de reconocimiento de la primera cara utilizaron PCA y SVD para representar caras como una combinación lineal de “caras propias”, hacer reducción de dimensionalidad y luego unir caras con identidades mediante métodos simples; Aunque los métodos modernos son mucho más sofisticados, muchos aún dependen de técnicas similares.

9)

9. Análisis de componentes independientes : ICA es una técnica estadística para revelar factores ocultos que subyacen a conjuntos de variables aleatorias, medidas o señales. ICA define un modelo generativo para los datos multivariados observados, que generalmente se proporciona como una gran base de datos de muestras. En el modelo, se supone que las variables de datos son mezclas lineales de algunas variables latentes desconocidas, y el sistema de mezcla también es desconocido. Se supone que las variables latentes no son gaussianas y son mutuamente independientes, y se denominan componentes independientes de los datos observados.

ICA está relacionado con PCA, pero es una técnica mucho más poderosa que es capaz de encontrar los factores subyacentes de las fuentes cuando estos métodos clásicos fallan por completo. Sus aplicaciones incluyen imágenes digitales, bases de datos de documentos, indicadores económicos y mediciones psicométricas.

Espero que ayude 🙂

  • Filtros de Snapchat : Redes neuronales convolucionales (supuestamente)
  • Sistema de recomendación de Netflix : máquinas de Boltzmann restringidas
  • Traductor de Google ( traducción automática): redes neuronales recurrentes
  • Siri (Asistentes personales): modelos ocultos de Markov (2011-2014), redes de memoria a corto y largo plazo (2014+), que es un tipo de redes neuronales recurrentes.
  • Autos sin conductor (reconocimiento de imagen, reconocimiento de video): redes neuronales convolucionales (entre otras cosas)
  • Reconocimiento de voz , reconocimiento de escritura a mano: redes neuronales recurrentes
  • Segmentación del mercado : k-means clustering
  • Google AlphaGo : redes neuronales convolucionales
  • Generación de imágenes : redes adversas generativas (GAN)
    Este es realmente genial. Se merece una foto para sí mismo. Las GAN pueden hacer esto, por ejemplo (Créditos de imagen: Newmu / dcgan_code):

Sí, mira de nuevo al hombre sonriente que se generó. Y no olvides saludarlo en tu pesadilla esta noche 😛

¿Querías decir (función de Google): palabra difusa K – índice de gramo para similitud de palabras clave usando el coeficiente Jaccard

Reconocimiento de voz (Cortana, Siri, Alexa) : multivariante Modelos de mezcla gaussiana (GMM) reemplazados por modelos ocultos de Markov (HMM) últimamente .

Sugerencia de amigo de etiqueta (Facebook, iPhoto): (reconocimiento facial) Las sugerencias de etiqueta de Redes neuronales convolucionales (CNN) pueden usar K- vecino más cercano con asignación de Dirichlet latente.

Diagnóstico médico : utiliza principalmente redes neuronales artificiales (multicapa) para extraer reglas de modelos previamente entrenados.

Búsqueda de imágenes de Google : la ayuda de redes neuronales convolucionales (CNN) en modelos reconoce patrones.

Haga clic en Análisis de flujo (utilizado por los sitios web de comercio electrónico): clasificadores forestales aleatorios.

Resumen de texto : redes neuronales recurrentes

Ranking (Quora, Facebook, Google ..): LambdaMART

Voy a hablar de una sola aplicación: – sistemas de recomendación.

Gigantes tecnológicos que lo usan

  • Netflix
  • Facebook
  • Quora
  • Gorjeo
  • Olx
  • Instagram
  • Google
  • Amazonas
  • Flipkart
  • Y casi todos los demás que no recuerdo en este momento.

Voy a simplificarlo enormemente.

Hay dos métodos PRINCIPALES para hacer estos sistemas.

  • Filtrado colaborativo basado en el usuario.
  • Filtrado colaborativo basado en elementos.
  1. Basado en el usuario: Intentamos encontrar la distancia del coseno entre dos vectores (usuarios) e intentamos encontrar el “usuario” más cercano a un “usuario” … supongamos que los usuarios más cercanos son, usuario1 y usuario2. Recomendamos el interés del usuario más cercano (por ejemplo, el usuario2 vigilado-superman, spiderman, batman) y el usuario1 ya han visto (superman, spiderman, ironman) se recomendará al usuario1 batman
  2. Basado en elementos: en este método intentamos encontrar la relación entre los intereses o decir productos en lugar de usuarios o personas. Simplemente transponemos la matriz y encontramos la distancia del coseno. Funciona mejor que el primer método. No me estoy centrando en ningún tipo de explicación porque la pregunta no se trata de la comprensión profunda de algo, solo de dar una visión general.
  • El primer método no se usa con mucha frecuencia porque, a medida que aumenta la base de usuarios, es casi imposible encontrar una relación. Los vectores apuntan en una dirección diferente
  • Antes de que todos comiencen a saltar sobre mí en los comentarios, permítanme decirles que ninguno de los algoritmos anteriores se usa en estos días. Están bastante desactualizados, débiles cuando la base de usuarios es grande y compleja, métodos bastante avanzados como aprendizaje no supervisado, RBM y métodos de refuerzo son usados.

En caso de que desee conocer los aspectos básicos de estos algoritmos, no dude en enviar un mensaje. Puedo proporcionarle buenas fuentes para aprender.

  • RankBrain de Google Search

RankBrain es uno de los algoritmos de colocación de motores de búsqueda de Google que ayuda a Google a determinar qué páginas mostrar en la parte superior de las búsquedas. Si bien los detalles se mantienen en secreto (para que las personas no puedan mejorar artificialmente su rango), “aprende” qué tipos de páginas son “valiosas” para Internet, y toma en cuenta esa información al ordenar las páginas.

  • Autocompletar (prácticamente en cualquier lugar)

Los programas de autocompletar generalmente observan con qué frecuencia las personas escriben ___ y ​​luego escriben ____, con el tiempo gradualmente pueden predecir lo que las personas están tratando de escribir con anticipación. Una capa adicional de personalización tendría en cuenta los intereses, hábitos, etc. de la tipificación específica del usuario. A veces esto funciona, a veces falla espectacularmente, pero en ambos casos hay un algoritmo de aprendizaje automático.

  • Siri y Cortana

Hay tres ejemplos, pero el campo es mucho más amplio que solo cosas relacionadas con la búsqueda. Casi todas las empresas de tecnología utilizan programas de aprendizaje automático en algún aspecto de sus productos o en un negocio más amplio.

Snapchat, Facebook, Netflix, Twitter, Instagram; Todos utilizan el aprendizaje automático. Con tareas que van desde el reconocimiento de imágenes hasta el marketing, el aprendizaje automático está profundamente integrado en toda la tecnología actual.


¿Me gusto esto? Lea sobre cómo conseguir un trabajo en Google sin título, aquí.

Las aplicaciones del aprendizaje automático difieren. Por ejemplo, al hablar de una aplicación educativa, para predecir el rendimiento futuro de los alumnos, se deben analizar muchos datos. Incluyendo su desempeño de años anteriores, el tiempo que necesitan para prepararse para un examen, el tiempo que necesitan para aprender algo, etc.

Existen varias técnicas de aprendizaje automático:

  • Aprendiendo sobre ejemplos

Este método significa que un sistema de aprendizaje automático utiliza ejemplos. Google aplicó este tipo de aprendizaje en su servicio de Gmail, mientras implementaba la clasificación automática de spam.

  • Aprendiendo sobre la experiencia

El sistema aprende de acuerdo con su experiencia previa basada en respuestas positivas o negativas.

  • Auto aprendizaje

Aquí, los algoritmos avanzados de aprendizaje automático analizan diferentes estructuras de datos por su cuenta, extrayendo algunos patrones generales de ellos.

  • Aprendizaje profundo

Este método requiere modelos matemáticos más complicados que podrían usarse para definir el contenido de las imágenes o reconocer el habla, etc.

Tipos de aprendizaje automático

Todos estos métodos se aplican generalmente dentro del análisis de contenido de medios y el análisis de aprendizaje automático de Big Data .

Importancia de las aplicaciones de aprendizaje automático en diversas esferas

Para obtener más información sobre casos de uso de negocios de AI / ML y Predictive Analytics en la vida real y cómo Valiance ha proporcionado la solución adecuada, puede consultar nuestro Blog. Además, lea nuestra sección de Documentos de investigación para conocer las diferentes soluciones en detalle.

More Interesting

¿Cuál es la mejor introducción al aprendizaje profundo para un estudiante graduado con experiencia en matemáticas y CS?

¿Cuál es un buen tutorial breve para usar el aprendizaje profundo para tareas de reconocimiento de imágenes?

¿Cuáles son los beneficios de usar ReLU sobre softplus como funciones de activación?

Cómo construir una aplicación de predicción de flujo de efectivo personal con extractos bancarios utilizando el aprendizaje automático

¿Qué implica el e-Discovery?

¿Qué tipo de antecedentes estadísticos debo tener para tomar el curso de Reconocimiento de patrones? Cual estadística Qué libro es útil para mi preparación?

¿Cuáles son los beneficios de usar el Descenso de gradiente de mini lotes?

¿Por qué no hay bloqueadores de anuncios impulsados ​​por el aprendizaje automático?

¿Por qué es mejor usar la función Softmax que la función sigmoidea?

¿ISRO utiliza una inteligencia artificial?

¿Cómo funciona el refuerzo con los algoritmos de clasificación del árbol de decisión?

¿Por qué alguien debería aplicar métodos de aprendizaje automático en su investigación?

Necesito analizar resúmenes de texto en lenguaje humano e identificar los temas mencionados en ellos. ¿Esto cae bajo el reconocimiento de la entidad nombrada?

Cómo construir un proyecto de aprendizaje profundo en dos meses

¿Cuál es la mejor manera de administrar indicadores de función o alternar características para equipos de desarrollo más grandes?