¿Se puede utilizar el aprendizaje no supervisado en el reconocimiento de imágenes?

Por supuesto, normalmente se utilizan algoritmos de agrupamiento para construir un diccionario / libro de códigos de características. La codificación dispersa, los codificadores automáticos y las redes de confrontación generativa (GAN) también se pueden utilizar para el aprendizaje de funciones sin supervisión.

Es posible utilizar el libro de códigos de características para hacer coincidir imágenes alimentando las características a un clasificador entrenable como máquinas de vectores de soporte (SVM) o incluso redes neuronales profundas. También puede ser posible utilizar el aprendizaje diferido, simplemente almacene las representaciones de vectores de características de cada instancia de clase en una estructura de datos de búsqueda como un árbol Kd (para vectores de características de baja dimensión) y realice la búsqueda de vecinos más cercanos a K.

Antes de las unidades lineales rectificadoras (ReLU) era difícil entrenar redes neuronales profundas desde cero, a veces todavía lo es, por lo que el pre-entrenamiento no supervisado se usó principalmente para iniciar las redes neuronales profundas y luego se realizó una fase supervisada de ajuste fino donde la neural profunda net fue optimizado conjuntamente para la tarea en cuestión.

El problema con los modelos de aprendizaje no supervisados ​​actuales es que el objetivo es normalmente “global”, el libro de códigos de características debe ser un buen representante de todos los datos de capacitación. Por lo tanto, si las características relevantes son solo un pequeño subconjunto de ejemplos de capacitación, el sistema no funcionará muy bien en la tarea de reconocimiento. Por otro lado, el aprendizaje supervisado adapta muy bien las características a la tarea en cuestión, ya que la señal de error guía la formación de esas características. Esto es en parte por qué las redes neuronales convolucionales (convNet) funcionan excepcionalmente bien.

Entonces, sí, es posible hacer un reconocimiento de imágenes utilizando un aprendizaje no supervisado. Esto normalmente es importante si el sistema tiene que descubrir objetos distintos por sí mismo, pero actualmente los modelos de aprendizaje no supervisados ​​están rezagados con respecto a sus contrapartes supervisadas en términos de rendimiento.

Espero que esto ayude.

More Interesting

La IA ha existido por décadas. ¿Qué condujo a toda la publicidad reciente de AI / Deep Learning?

¿Cómo funciona la función "Tiempos populares" de Google Maps?

¿Cómo se compara XGBoost (aumento de gradiente) con Random Forest?

¿Es factible hacer una regresión logística en conjuntos de datos con miles de características sin usar una computadora de clúster? ¿Qué tal decenas de miles?

¿Cuál es un buen conjunto de datos para probar mi clasificador vecino más cercano K?

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

¿Cómo funciona el soporte de regresión vectorial?

¿Cuál es la explicación intuitiva y práctica del algoritmo AdaBoost utilizado en el artículo de Viola-Jones sobre detección de rostros, en lenguaje moderadamente técnico?

¿Es una exageración aplicar un conjunto de redes neuronales?

¿Cuáles son los conceptos básicos de los campos aleatorios condicionales?

¿Cuáles son algunos buenos cursos y certificaciones en línea en aprendizaje automático e inteligencia artificial para un estudiante universitario de CS actual?

¿Cuáles son las aplicaciones del tensor en estadística y aprendizaje automático?

¿Cuáles son los principales puntos de regresión?

¿Qué es el condicionamiento en el aprendizaje seq2seq?

¿Qué ha causado la gran mejora en los algoritmos de reconocimiento de voz en los últimos años: mejores algoritmos (si es así, ¿cuál?) O la mayor potencia informática?