¿Cómo puedo explicar el hecho de que el aprendizaje por transferencia ofrece un mejor rendimiento que el entrenamiento estándar?

Si está buscando una analogía que explique el concepto a un usuario no técnico (no está claro de la pregunta), estas son mis dos analogías favoritas:

Imagen que intentabas aprender análisis de sentimientos en mandarín. Eventualmente, podría descubrirlo si le mostramos suficientes ejemplos, pero tomaría mucho tiempo porque no tiene un nivel base de información útil para la tarea (en este caso, hablar mandarín). El aprendizaje por transferencia funciona bajo los mismos principios. Brindar a sus modelos un nivel básico de información, no específicamente relacionado con la tarea en cuestión, que aún mejora su capacidad para realizar la nueva tarea.

En el lado de la imagen trato de explicar cómo enseñarle a un bebé qué es un tigre. Dado que un bebé no sabe nada sobre el mundo, eventualmente lo descubrirán, pero llevará mucho tiempo y requerirá más ejemplos. Compare esto con enseñarle a un niño lo que es un tigre. Es posible que no sepan qué es un tigre, pero puede decirles que un tigre es un gran gato naranja con rayas, y porque entienden esos conceptos básicos (grande, naranja, gato, rayas), pueden aprender el nuevo objeto (un tigre) más rápido.

Se deriva del hecho de que el aprendizaje es aleatorio y mejora gradualmente.

Piensa en ello como ir de un punto a otro. Si comienza a una distancia mayor, tomará más tiempo pero menos si comienza a acercarse.

En el aprendizaje por transferencia, los pesos están más cerca de sus valores deseados por un margen similar al que desea aprender. Por ejemplo, si desea clasificar las plantas, los pesos entrenados en imagenet ya tienen una representación de las plantas y todo lo que necesita ser entrenado es tomar esa representación y ajustarla a sus categorías de plantas.

More Interesting

En general, ¿necesita tener un doctorado para obtener un trabajo de Machine Learning / Data Mining en una startup o en una gran empresa?

¿Qué carrera es mejor, Machine Learning o DevOps?

¿Cuáles son algunas de las ventajas de usar modelos de proceso gaussianos frente a SVM?

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?

¿Cuán extendido es el aprendizaje profundo en finanzas?

¿Qué te sorprendió después de ver algo relacionado con el aprendizaje automático, la IA, la PNL o la visión por computadora?

¿Hay alguna universidad en la India que ofrezca cursos a corto plazo sobre aprendizaje automático / ciencia de datos?

¿Qué puedo hacer con un conjunto de datos de temperatura?

¿Qué sucede si hacemos que cada unidad de filtro o núcleo en una capa CNN dentro de una red neuronal profunda tenga diferentes tamaños de ventana pero el mismo número de parámetros de peso (lo que resulta en granulado grueso)? ¿Podría conducir a un efecto contextual?

Cómo ingresar a un laboratorio superior de aprendizaje automático o de visión por computadora como erudito visitante

Dada una lista de codificadores y sus respectivos conjuntos de fragmentos de código, ¿es posible inferir a partir de un fragmento de código nuevo dado el codificador original?

¿Cuáles son todas las diferencias entre el aprendizaje en línea y el aprendizaje fuera de línea con backpropagation?

¿Qué quieres decir con optimización?

¿Cuáles son algunos de los beneficios del análisis de regresión múltiple?

¿Es realmente posible comenzar una carrera seria de IA / ML con el objetivo final de trabajar en un lugar como OpenAI, Google o DeepMind a través del autoestudio?