¿Puede el preprocesamiento de datos en redes neuronales de IA (aprendizaje profundo) ser dinámico y automatizado (en lugar de estático y manual)?

Realmente no se puede responder esta pregunta genéricamente. La razón por la que el preprocesamiento es manual (en general) es porque los diferentes problemas tienen diferentes tipos de datos, y los datos generalmente están incompletos, muy probablemente contengan errores y ruido, y probablemente no estén en un formato que sea fácil de usar con red neuronal convolucional. No estoy seguro de lo que quiere decir con “estático” en esta pregunta, pero me imagino que por dinámico puede querer decir que los datos ingresan continuamente, pero también se distorsionan (y no se agregan ninguno y errores) de forma dinámica cambiando de manera.

Por lo tanto, necesita un sistema que pueda hacer frente a tipos de datos muy diferentes, donde los datos son incompletos, ruidosos y, posiblemente, francamente incorrectos en algunos lugares. ¿Es eso posible? Conceptualmente, sí: algún tipo de sistema hiperheurístico que intenta muchos modos diferentes de limpieza de datos y evalúa los resultados de este preprocesamiento (y la interpretación basada en la red neuronal) para seleccionar el preprocesamiento adecuado. Y lógicamente, al menos, esta solución también podría ser dinámica.

¿Es realista este tipo de problema? Considere la interpretación del habla, donde el hablante se está moviendo (supongamos que el micrófono está fijo), alterando el sonido en el micrófono, y hay un montón de ruido externo que cambia dinámicamente (a veces haciendo que la señal: la figura del ruido sea bastante negativa). Esta es la situación normal para escuchar a otros altavoces en entornos reales (como un restaurante ruidoso). ¿Existen soluciones para este problema? Dentro de los límites, sí (pero no actualmente en tiempo real) ver Separación eficiente del habla de los ruidos de fondo

Pero entonces, sabemos mucho sobre el habla: estadísticamente, en términos de su posible distribución de energía espectro-temporal. En el caso general, no sabe lo que está buscando en una red neuronal, no conoce las estadísticas de los datos que le interesan, lo que hace que el problema sea más interesante. Y más difícil también.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales