¿Es el hecho de que los algoritmos de aprendizaje profundo requieren grandes extensiones de datos como una limitación final de su potencial en IA?

Depende del tipo de problema que intente resolver. Por ejemplo, si desea trabajar con datos genéticos, los datos que puede tener son prácticamente infinitos. Si está trabajando en el aprendizaje profundo para aplicaciones de voz o PNL, las compañías como Google tienen muchos datos provenientes de todos nuestros dispositivos (cuando usamos la búsqueda por voz). Si está buscando aplicar el aprendizaje profundo para imágenes, empresas como Facebook y Google no tienen escasez de dichos datos.

La limitación en el uso de IA para resolver problemas de la vida real no se deriva del hecho de que requiere una gran cantidad de datos, está limitada por su acceso a grandes cantidades de datos y tecnología para manejar el flujo de datos para tales grandes cantidades de datos (usted necesitará un procesamiento de datos distribuido para aplicaciones a gran escala, por lo que probablemente necesitará un grupo de GPU y habilidades para manejarlas, como Spark o Hadoop). Con el aumento de las herramientas para manejar el procesamiento paralelo y con el aumento de la tecnología GPU, el uso de una gran cantidad de datos para lograr un aprendizaje automatizado definitivamente se está volviendo más fácil día a día.

Por lo tanto, no creo que el requisito de grandes cantidades de datos sea una gran limitación para la IA.

Aunque entrenar una red de aprendizaje profundo desde cero requiere grandes extensiones de datos, la mayoría de las redes profundas no se entrenan desde cero. Parte del éxito del aprendizaje profundo proviene del uso de redes pre-entrenadas para clasificar un conjunto de datos diferente, generalmente pequeño, ajustando pesos de capa de red más altos. La implicación es que si alguna compañía con grandes cantidades de datos entrena una red en datos de Imagenet o un gran conjunto de datos de reconocimiento de voz y libera su punto de control, entonces podría ajustar la red con muchos menos datos. Por ejemplo, podría ajustar un clasificador de Imagenet para clasificar diferentes tipos de automóviles con un conjunto de datos relativamente pequeño.

Aquí hay un enlace para obtener más información sobre el aprendizaje de transferencia:

CS231n Redes neuronales convolucionales para reconocimiento visual