Dado un conjunto de datos y una estructura de red neuronal, ¿es posible predecir la precisión de esa red neuronal (usando otra red neuronal)?

Sí, pero no de la manera que quieres.

Suponga que tiene una red A que produce salidas A_out, y utiliza otra red B que toma A_out y produce B_out. B_out indica si A_out es exacto o no. Aquí viene la parte importante: ¿cómo haces que B sepa que A_out es correcto ? Tienes que entrenar B! Obviamente. Pero entonces, ahora estás atrapado con el entrenamiento B. Esto se repite, tienes que crear otra red C para criticar a B y otra D para criticar a C.

Y toda esta tubería: A a B, B a C, C a D, es básicamente una red neuronal gigante . No es nada nuevo, es solo que la salida de B, C o D es diferente del problema original (A). Pero aún así, es solo una gran red neuronal y tienes que entrenarlos a todos, lo que en realidad es más difícil que entrenar solo a A.

En general, es mucho más fácil entrenar a A con una sola función objetivo. Esta función objetivo suele ser la mejor crítica que puede obtener para hacer A más precisa.

Pero, si aún desea obtener una red B para predecir si A es precisa o no, siempre puede hacerlo. Nadie te impide experimentar. Además, técnicas similares ya se han hecho en la literatura generativa adversa. Sin embargo, tenga cuidado de que no sea tan fácil usar una función objetivo claramente definida más unas buenas variantes SGD (Adam, RMSprop, etc.).

Google ya lo ha hecho … De alguna manera han considerado el problema de la arquitectura de red como una función diferenciable y pudieron optimizarlo … o eso creo. Consulte las noticias recientes en Google AI. Si encuentro, publicaré …

More Interesting

¿Cómo sería el futuro para los graduados de IA?

¿Cuál resultará ser el fenómeno más estable en el universo, el aumento de la entropía o el aumento de la inteligencia?

¿Es el tiempo de aprendizaje de una red neuronal profunda (por ejemplo, para la detección de objetos) proporcional a la cantidad de datos de entrenamiento disponibles?

¿Es posible convertir un documento electrónico (en lenguaje natural) en una representación comprensible de la máquina?

¿Por qué no podemos entender la función cerebral como entendemos la IA de la computadora?

¿Vale la pena aprender HTML o los creadores de sitios web y la inteligencia artificial lo volverán inútil en el futuro?

¿Cómo funciona la IA del comercio de predicción en línea?

¿Cómo se hace el software para controlar grandes máquinas y robots? Cual es el proceso

Cómo crear una red neuronal con PyBrain que tenga un número diferente de valores de salida objetivo para cada entrada

Como médico que programa y participa en la investigación tecnológica, ¿cómo puedo comenzar a aprender sobre aprendizaje automático / aprendizaje profundo?

¿Podemos construir un órgano biónico para el lenguaje?

Quiero construir un robot. ¿Cómo conecto el hardware con el software?

¿Cómo será la sociedad, si / cuando la IA se integra en todas las industrias y, al mismo tiempo, los humanos están genéticamente 'perfeccionados' a través de CRISPR?

¿Cómo pueden prepararse la sociedad y los gobiernos para el 30% de los empleos que se pronostica que se perderán para los robots en 2030?

¿Cómo sería un sistema operativo artificialmente inteligente?