¿Será el futuro cercano de la visión por computadora el aprendizaje profundo pesado?

El aprendizaje profundo (DL) ya se ha hecho cargo de una gran parte de la investigación y las aplicaciones de visión por computadora (CV). Los sistemas DL, particularmente la red neuronal convolucional (convNet) que está biológicamente motivada (por la corteza visual primaria) han demostrado ser lo último en aplicaciones CV como la segmentación semántica, la detección de objetos y el reconocimiento de imágenes.

Por lo tanto, el futuro cercano definitivamente verá un mayor uso de los sistemas DL a medida que más áreas de visión por computadora, como la visión 3D y estéreo, se muevan más hacia el uso de técnicas de aprendizaje automático (ML).

Pero me encantaría señalar tres cosas;

  1. Las arquitecturas DL no son aprendices graduales, por lo general, en visión por computadora, desearía un sistema que aprenda continuamente nuevas clases de objetos en línea en lugar de una fase de capacitación fuera de línea. Al igual que los humanos aprendemos nuevos objetos visuales todos los días.
  2. Ejemplos adversarios [1]: las arquitecturas DL basadas en visión se pueden engañar fácilmente utilizando lo que se denomina imágenes adversarias. Esto puede ser una amenaza para la seguridad en la robótica, especialmente en los autos sin conductor.
  3. Grandes requisitos de datos: los sistemas DL no son aprendices de una sola vez, no están utilizando una forma sólida de aprendizaje de transferencia para lograr el aprendizaje de una sola vez. Los sistemas DL tienen mucha hambre de datos.

Dicho esto, espero y creo que habrá avances importantes en DL para abordar las preocupaciones mencionadas anteriormente.

Por lo tanto, creo que en el futuro lejano los algoritmos probablemente intentarán imitar la forma en que los humanos perciben los objetos en lugar de tratar de simular las neuronas cerebrales reales en la corteza visual primaria.

Espero que esto ayude.

Notas al pie

[1] Atacar el aprendizaje automático con ejemplos adversos

More Interesting

¿El sobreajuste es un problema en el aprendizaje de refuerzo profundo?

Cómo obtener una posición de RA en el Grupo de Aprendizaje Automático de Microsoft Research India

¿Qué significa decir que dos clasificadores son independientes?

Cómo entrenar una red neuronal para detectar un objeto en un video que no estaba presente en el cuadro anterior

¿Cómo puedo explicar que las unidades tradicionales de red neuronal recurrente (RNN) sufren el problema del gradiente de fuga?

¿Qué sucede si hacemos que la forma de una función de activación sea diferente en cada capa, permitiendo que también se aprenda su forma, si las capas superiores tienen menos unidades, haciéndolas más no lineales?

¿Cuáles son los últimos algoritmos y técnicas para la corrección ortográfica?

¿Cómo se ajustan los pesos en una red neuronal mientras estoy entrenando la red?

¿Los bosques aleatorios son solo un tipo de Monte Carlo?

¿Cómo una red neuronal artificial calcula su salida?

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2013?

¿Es posible cambiar a un doctorado en aprendizaje automático después de un MPhil en econometría?

Para un maestro en aprendizaje automático, ¿cuál sería una mejor opción, KTH (MS en aprendizaje automático) o Chalmers (MS en sistemas adaptativos complejos)?

¿Cuáles serían los proyectos / servicios más interesantes en el cuidado de la salud que involucren alta tecnología como dispositivos móviles, big data y data science? Por ejemplo, Ginger.io.

¿Dónde puedo encontrar modelos de temas previamente capacitados para MALLET?