En el aprendizaje profundo, ¿son el “aprendizaje incremental” y el “aprendizaje de transferencia” el mismo enfoque?

Cuando aprende a conducir un automóvil, aprende una habilidad genérica y utilizará estas habilidades similares si desea conducir un camión. Esta transferencia de su conocimiento se llama transferencia de aprendizaje.

Si ha aprendido nuevas habilidades mientras conduce un camión, actualizará continuamente sus conocimientos y los usará para mejorar sus habilidades de conducción. Esto se llama aprendizaje incremental (o) aprendizaje continuo (o) aprendizaje en línea.

Diseñemos un sistema que pueda operar en imágenes médicas (digamos imágenes de tomografía computarizada) y reconozca el órgano presente en la imagen. Los componentes importantes en el diseño de una red neuronal profunda para realizar dicha función son: datos, datos y datos. Pero no es sencillo realizar una tomografía computarizada en millones de personas y poblar una base de datos. ¿Qué hacer ahora?

Oye, el reconocimiento de imágenes es una habilidad genérica. ¿Qué pasaría si entrenamos nuestro sistema en algunos otros datos donde podría ser más fácil adquirir millones de imágenes con relativa facilidad? Aprendamos la habilidad con estos datos y luego transfiéralos para trabajar en imágenes médicas. Puede transferir directamente el aprendizaje y probar su sistema en imágenes médicas (o) puede transferir la habilidad y ajustarla para que funcione mejor en imágenes médicas. Esta transferencia de aprendizaje se conoce como transferencia de aprendizaje .

Ahora que ha entrenado un sistema mediante el aprendizaje de transferencia (o) mediante el uso de una gran base de datos de imágenes médicas, su sistema puede reconocer los órganos en las imágenes de tomografía computarizada. Pero si ha dejado de entrenar su sistema, no aprenderá nada nuevo. Es como decirle a los humanos que aprenden durante los primeros 10 años de su vida y luego usan esas habilidades para el resto de su vida. No es posible, ¿verdad? Continuamente nos encontraremos con nuevas situaciones, aprenderemos de ellas y seguiremos actualizando nuestros conocimientos. Esto se conoce como aprendizaje incremental.

El aprendizaje incremental es aprender de un ejemplo o un mini lote de ejemplos a la vez. Un modelo entrenable de forma incremental no necesita usar todos los datos de entrenamiento en cada iteración para actualizarse. Esto es crucial cuando tiene muchos datos que no caben en la memoria de una vez.

El aprendizaje de transferencia significa reutilizar el conocimiento adquirido en el pasado resolviendo algunas tareas, cuando se trabaja en una tarea nueva (relacionada). Esto es muy común en el aprendizaje profundo, porque el modelo generalmente necesita muchos datos para ser efectivo, mientras que solo tiene pocos datos para su problema específico. Por ejemplo, cuando trabaje con convNets, normalmente primero elige de la web un modelo previamente entrenado para la clasificación de imágenes (generalmente en el conjunto de datos de ImageNet) y afina su problema de interés, por ejemplo, reconocer alimentos o especies de aves o lo que sea .

More Interesting

¿Cómo manejo tanto la programación como la investigación en el área de redes neuronales y redes neuronales profundas?

¿Cuáles son algunos algoritmos que un científico de datos debe saber y comprender?

¿Qué hay de nuevo con Wasserstein GAN?

¿Cuál es la importancia de las redes residuales profundas?

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

¿Las GPU seguirán dominando la inteligencia artificial y el aprendizaje automático, aumentando el valor de compañías como Nvidia y AMD, o los chips especializados como los de Graphcore se harán cargo?

¿Cuáles son los cursos necesarios para aprender la recuperación de información y el aprendizaje automático?

¿Cuál es la relación entre el análisis semántico latente / indexación, SVD y TF-IDF en la minería de texto?

¿Por qué los modelos basados ​​en árboles son robustos para los valores atípicos?

¿Cómo se aplica el aprendizaje automático en genética o biología molecular?

¿Qué tipo de estructuras de datos podrían usarse en un proyecto de procesamiento de lenguaje natural?

¿Por qué el aprendizaje automático, las redes neuronales y otros enfoques de IA, por ejemplo, no se usan más ampliamente en las predicciones del mercado de valores?

¿El filtrado colaborativo se considera aprendizaje automático?

¿Cuál sería la mejor manera de encontrar estudiantes universitarios interesados ​​en un proyecto de investigación sobre la interfaz entre bioinformática y aprendizaje automático, en Johns Hopkins?

¿Existe algún proyecto de código abierto que implemente algoritmos de aprendizaje profundo que aproveche la enorme potencia informática paralela de la GPU?