Explicaré el uso de la visión por computadora como ejemplo.
Digamos que tienes una foto y estás tratando de darle sentido.
Puede mirarlo con ojos de perro, verlo en escala de grises y probablemente un poco borroso / distorsionado. Eso no ayuda mucho, pero ves algunas características útiles. Esos son los métodos de CV de la vieja escuela y las redes neuronales poco profundas.
- ¿Cuál es la diferencia entre el procesamiento del lenguaje natural y la IA?
- ¿Pueden las computadoras reemplazar a los abogados?
- ¿Cómo podrían las redes neuronales ser un ejemplo de IA simbólica?
- En una red neuronal (sin saber si es específica para keras), ¿cuál es la diferencia entre el tamaño del lote y el entrenamiento del lote? ¿Cuándo necesitaría ambos?
- ¿Puedes nombrar algunas de las mejores aplicaciones de inteligencia artificial para Android e iOS?
Puedes mirarlo con ojos humanos. Líneas continuas, colores, alta resolución, mucho mejor que la vieja escuela. Esto es lo que obtienes cuando juntas varias capas de conv con agrupación y otras cosas elegantes. Las enormes ganancias inmediatas proporcionadas por esto hicieron que esas redes fueran tan populares y crearon la esperanza de obtener resultados aún mejores … si apila más capas.
Y luego tienes los ojos de un camarón Mantis, el instrumento óptico más sorprendente del reino animal. No puedo describir exactamente lo que verías, pero la ciencia dice que los colores serían salvajes. En términos de complejidad, esa es su típica red neuronal súper profunda. Las líneas son aún más sólidas y los detalles son aún más precisos.
¿Eso ayuda? No, no lo hace, porque para dar sentido a la imagen, debe inferir el contexto, realizar una segmentación mental de la imagen y aplicar su conocimiento externo sobre los objetos que ha reconocido. Más capas = mejores ojos, pero no piensas con los ojos, después de que se vuelven lo suficientemente buenos, depende de tu cerebro tomar decisiones.
En principio, ayudarán “más capas”. Pero no solo haciendo que una arquitectura existente sea más gorda. La intercambiabilidad y la redundancia en el cerebro humano funcionan bien solo para el cerebro humano, las computadoras sobresalen en modularidad y funciones claramente definidas. Por lo tanto, combinar diferentes arquitecturas bien diseñadas para sus tareas específicas de manera adecuada es el camino correcto, al menos para los sistemas de aprendizaje estadístico tal como los conocemos hoy.
La complejidad, especialmente la computacional, es una especia costosa y deberíamos ser frugales con ella, agregando solo cuando sea absolutamente necesario.