¿Es el hecho de que los algoritmos de aprendizaje profundo requieren grandes extensiones de datos como una limitación final de su potencial en IA?

Depende del tipo de problema que intente resolver. Por ejemplo, si desea trabajar con datos genéticos, los datos que puede tener son prácticamente infinitos. Si está trabajando en el aprendizaje profundo para aplicaciones de voz o PNL, las compañías como Google tienen muchos datos provenientes de todos nuestros dispositivos (cuando usamos la búsqueda por voz). Si está buscando aplicar el aprendizaje profundo para imágenes, empresas como Facebook y Google no tienen escasez de dichos datos.

La limitación en el uso de IA para resolver problemas de la vida real no se deriva del hecho de que requiere una gran cantidad de datos, está limitada por su acceso a grandes cantidades de datos y tecnología para manejar el flujo de datos para tales grandes cantidades de datos (usted necesitará un procesamiento de datos distribuido para aplicaciones a gran escala, por lo que probablemente necesitará un grupo de GPU y habilidades para manejarlas, como Spark o Hadoop). Con el aumento de las herramientas para manejar el procesamiento paralelo y con el aumento de la tecnología GPU, el uso de una gran cantidad de datos para lograr un aprendizaje automatizado definitivamente se está volviendo más fácil día a día.

Por lo tanto, no creo que el requisito de grandes cantidades de datos sea una gran limitación para la IA.

¿Cuál es el peor caso de sobreajuste que hayas visto en entornos sociales o psicológicos?

¿Es una buena idea dejar el aprendizaje automático después de 2 años y estudiar desarrollo web, si me di cuenta de que no soy tan inteligente para todas esas matemáticas de ML?

¿Cuáles son los algoritmos estándar para la inferencia en redes bayesianas?

¿Es el análisis de sentimientos todo sobre lingüística?

¿Qué significa para una red neuronal ser entrenada de extremo a extremo?

¿Por qué los NN recurrentes son tan susceptibles al problema del gradiente de fuga?

Aunque entrenar una red de aprendizaje profundo desde cero requiere grandes extensiones de datos, la mayoría de las redes profundas no se entrenan desde cero. Parte del éxito del aprendizaje profundo proviene del uso de redes pre-entrenadas para clasificar un conjunto de datos diferente, generalmente pequeño, ajustando pesos de capa de red más altos. La implicación es que si alguna compañía con grandes cantidades de datos entrena una red en datos de Imagenet o un gran conjunto de datos de reconocimiento de voz y libera su punto de control, entonces podría ajustar la red con muchos menos datos. Por ejemplo, podría ajustar un clasificador de Imagenet para clasificar diferentes tipos de automóviles con un conjunto de datos relativamente pequeño.

Aquí hay un enlace para obtener más información sobre el aprendizaje de transferencia:

CS231n Redes neuronales convolucionales para reconocimiento visual

Ryley Higa

More Interesting

¿Qué piensa la gente del siguiente documento que señala los límites del aprendizaje de extremo a extremo?

¿Cuál es la diferencia entre el aprendizaje automático en Python y R?

¿Son las redes neuronales modelos paramétricos o no paramétricos?

¿Cómo se usa el análisis de componentes principales en el procesamiento del lenguaje natural?

Andrew Ng: ¿Qué opinas de AlphaGo?

¿Cuáles son los pros y los contras de aprender ExpressJS?

¿Cuáles son algunas aplicaciones del aprendizaje por refuerzo (o aprendizaje por refuerzo profundo) en finanzas y economía?

¿Dónde aprendo Machine Learning?