¿Cómo se relacionan el aprendizaje automático y el aprendizaje profundo?

Sí, los dos están muy relacionados. El aprendizaje profundo es un subcampo del aprendizaje automático.

(Aproximadamente) El aprendizaje automático es el estudio de algoritmos y modelos que pueden aprender a realizar tareas a partir de datos. Los componentes clave de ML son un modelo, una medida de rendimiento con alguna tarea y un algoritmo de entrenamiento. Los modelos, medidas y procedimientos de entrenamiento vienen en una amplia variedad de sabores y estilos. Un sabor particularmente útil es el aprendizaje profundo.

El aprendizaje profundo se refiere a modelos que pueden aprender características de los datos, así como funciones / estimadores. La mayoría de los métodos de aprendizaje automático requieren que un usuario especifique las características utilizadas para que el modelo realice la tarea. En el aprendizaje profundo, la suposición típica es que existe una representación densa de los objetos sobre los que se razona, y el modelo está construido de tal manera que puede aprender de forma autónoma características importantes de los datos.

La capacidad de aprender estas características es increíblemente poderosa. Tanto (en cierta medida) ha aliviado uno de los aspectos más largos de ML (ingeniería y diseño de características) y ha mejorado drásticamente el rendimiento en una serie de tareas de IA que a mucha gente le importa mucho (procesamiento de imágenes, discurso reconocimiento, aprendizaje de refuerzo, etc. ‘).

Los modelos típicos en el aprendizaje profundo están compuestos por redes neuronales. Hay muchas variantes de estas (y nuevas que se desarrollan cada mes), y son genéricas en el sentido de que se trasladan bien a través de dominios (por ejemplo, una red convolucional funciona bien tanto en aplicaciones de habla como de visión).

Los algoritmos de entrenamiento típicos son variantes del descenso de gradiente estocástico. Se pone mucho énfasis en el diseño de optimizadores inteligentes que pueden hacer uso de la curvatura, el impulso y otras características de las superficies de error. Esto se debe al hecho de que el entrenamiento requiere la optimización de superficies no convexas que a menudo tienen muchos puntos de silla de montar y óptimos locales.

Las medidas de rendimiento son las mismas funciones típicas de error de ML: típicamente cosas como la máxima probabilidad (entropía cruzada, error al cuadrado, etc.), límites inferiores variacionales, divergencias estadísticas y últimamente algo de entusiasmo (bien merecido) sobre los procedimientos de entrenamiento adversos.

Aprendizaje automáticoAprendizaje profundoinformáticaInteligencia Artificial

Si existiera inteligencia extraterrestre, ¿cómo piratearías su tecnología avanzada?

¿Cuáles son sus experiencias como consultor en ciencia de datos?

¿Qué tipo de sistema operativo se instalará en una computadora biológica usando orgánulos celulares para computación paralela?

¿Cómo es hacer un largo viaje en un súper yate? ¿Cómo se compararía con tomar un crucero?

¿Podrán las computadoras multiplicarse 99,999,999,999 veces 999,999,999,999?

¿Cómo funciona la tecnología CEREC?

El aprendizaje automático (ML) es el campo principal del aprendizaje profundo (DL), si los visualiza como una estructura en forma de árbol. ML es un campo sobre algoritmos de aprendizaje, abarca muchos otros algoritmos como máquinas de vectores de soporte (SVM), árboles de decisión, bosques de decisión, máquinas de Boltzmann restringidas, estrategias de evolución y muchos más. Esto hace que el campo ML sea algo amplio, DL por otro lado se basa en redes neuronales (NN) con muchas capas una encima de la otra.

Los NN son un conjunto de nodos de procesamiento simples dispuestos capa por capa por lo que cada capa se alimenta de la capa inmediatamente debajo de ella y luego envía la salida a la capa justo encima de ella. De esta manera, el NN aprende una representación jerárquica de las características mediante las cuales el sistema aprende las características de nivel bajo, medio y alto que se vuelven algo más abstractas en los niveles superiores.

DL se basa en NN a gran escala con muchas capas más profundas que el NN menos profundo típico. No existe un recuento de capas acordado que haga que un NN típico sea profundo o poco profundo, por lo tanto, la mayoría de los sistemas NN que se usan en la mayoría de los casos se llaman arquitecturas DL, incluso cuando ellos mismos no son tan profundos.

Espero que esto ayude.

Jonathan Gordon

El aprendizaje profundo es un tipo de algoritmos de aprendizaje automático. El aprendizaje automático consta de tres grupos:

Aprendizaje supervisado, que tiene variables objetivo y datos de entrenamiento para generar un modelo. El objetivo del modelo es inferir datos objetivo a partir de datos de entrenamiento. El aprendizaje supervisado incluye clasificación y regresión. Existen muchos algoritmos, que incluyen regresión lineal, regresión logística, máquina de vectores de soporte, árbol de decisión, bosque aleatorio, refuerzo y red neuronal. El aprendizaje profundo es un tipo de red neuronal, con largas capas ocultas, que hacen que una red sea tan profunda.
Aprendizaje no supervisado, que no utiliza la variable objetivo. Solo usa datos de entrenamiento para descubrir algún factor o regla debajo de los datos. El aprendizaje no supervisado incluye clustering, svm de una clase y análisis de componentes principales.
Aprendizaje de refuerzo, que obtiene datos de su entorno, acción y recompensa. Su objetivo es generar un modelo para obtener la mejor recompensa de la acción del agente en un entorno determinado. Se puede usar para jugar videojuegos y robótica.

Jonathan Gordon

More Interesting

¿Cuáles son los impactos inminentes (buenos y malos) de la inteligencia artificial en el próximo siglo?

¿Qué se puede hacer en una computadora sin conexión a Internet?

¿Cómo es tomar COS 487 (Teoría de la Computación) en Princeton?

¿Cuáles son algunas señales de que uno es un prodigio de la informática?

¿Es posible encontrar la precisión de Disparos de un bateador en particular usando el aprendizaje automático?

¿Puedo trabajar con computadoras cuánticas con un título de CS?

¿Qué cosas geniales hiciste como geek?

¿Crees que la ciencia (por ejemplo, la física teórica) será asumida por la inteligencia de la computadora, dado el creciente poder de cálculo y búsqueda de patrones?

¿Cuál es la necesidad de la computación paralela?

¿Qué significa exactamente la degradación de Eclipse ADT?