¿Puede el preprocesamiento de datos en redes neuronales de IA (aprendizaje profundo) ser dinámico y automatizado (en lugar de estático y manual)?

Realmente no se puede responder esta pregunta genéricamente. La razón por la que el preprocesamiento es manual (en general) es porque los diferentes problemas tienen diferentes tipos de datos, y los datos generalmente están incompletos, muy probablemente contengan errores y ruido, y probablemente no estén en un formato que sea fácil de usar con red neuronal convolucional. No estoy seguro de lo que quiere decir con “estático” en esta pregunta, pero me imagino que por dinámico puede querer decir que los datos ingresan continuamente, pero también se distorsionan (y no se agregan ninguno y errores) de forma dinámica cambiando de manera.

Por lo tanto, necesita un sistema que pueda hacer frente a tipos de datos muy diferentes, donde los datos son incompletos, ruidosos y, posiblemente, francamente incorrectos en algunos lugares. ¿Es eso posible? Conceptualmente, sí: algún tipo de sistema hiperheurístico que intenta muchos modos diferentes de limpieza de datos y evalúa los resultados de este preprocesamiento (y la interpretación basada en la red neuronal) para seleccionar el preprocesamiento adecuado. Y lógicamente, al menos, esta solución también podría ser dinámica.

¿Es realista este tipo de problema? Considere la interpretación del habla, donde el hablante se está moviendo (supongamos que el micrófono está fijo), alterando el sonido en el micrófono, y hay un montón de ruido externo que cambia dinámicamente (a veces haciendo que la señal: la figura del ruido sea bastante negativa). Esta es la situación normal para escuchar a otros altavoces en entornos reales (como un restaurante ruidoso). ¿Existen soluciones para este problema? Dentro de los límites, sí (pero no actualmente en tiempo real) ver Separación eficiente del habla de los ruidos de fondo

Pero entonces, sabemos mucho sobre el habla: estadísticamente, en términos de su posible distribución de energía espectro-temporal. En el caso general, no sabe lo que está buscando en una red neuronal, no conoce las estadísticas de los datos que le interesan, lo que hace que el problema sea más interesante. Y más difícil también.

Sí, se puede hacer.

Sin embargo, llevar a cabo el preprocesamiento de datos como un ejercicio de Data Science será mejor y más gratificante que llevarlo a cabo como un ejercicio de Machine Learning. Será más controlable. Hacer todo en dos pasos hace que el proceso sea modular.

Lea sobre el concepto de tuberías para ML. Hacer esto para DL es ciertamente más desafiante, pero siempre que el caso de uso esté bien limitado, se pueden construir tuberías DL.

More Interesting

¿Cómo funcionan las capas de incrustación en TensorFlow?

¿Qué método de reducción de dimensionalidad puede mantener las relaciones de traslación entre puntos?

¿Recomendaría un MBA de una escuela superior o un doctorado en Aprendizaje automático de una escuela superior?

¿Cuál es el enfoque más eficiente para los sistemas de recomendación?

¿Debería aprender aprendizaje automático, desarrollo en la nube o desarrollo de juegos en Unity como estudiante universitario de primer año?

¿Cuáles son algunos consejos generales sobre selección de características e ingeniería que todo científico de datos debe saber?

Puede aprendizaje no supervisado puede utilizar para determinar si alguien de la escritura / arte es más creativo que la escritura / arte de la mayoría de la gente?

¿Cómo aplicamos el algoritmo de agrupamiento k-means para datos mixtos numéricos y categóricos?

¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?

¿Dónde puedo encontrar corpus de texto médico en inglés para entrenar mis datos?

¿Cómo trata Google Translate u otra traducción en línea con palabras que no existen en el otro idioma?

¿Cuáles son los mejores recursos en línea para mejorar los algoritmos de aprendizaje automático?

¿Puedo aprender ML por mi cuenta?

¿Cuál es la diferencia entre la función de pérdida y la función de activación?

¿Cuáles son algunos buenos libros para principiantes y avanzados sobre redes neuronales e inteligencia artificial?