¿Cuáles son los buenos diagnósticos (además del rendimiento de validación) para determinar si una red neuronal se generalizará bien?

Esto en realidad sigue siendo un problema abierto. Mira este artículo:

[1611.03530] Comprender el aprendizaje profundo requiere repensar la generalización

Estoy seguro de que lo encontrará útil. También puede buscar en línea sobre este documento. Ya hay mucha discusión.

¿Qué algoritmos de aprendizaje automático se pueden considerar entre los mejores?
¿Cómo cambiará la inteligencia artificial nuestra vida cotidiana?
¿El aprendizaje automático está sobrevalorado actualmente?
¿Es posible usar IA para obtener nuevas ideas en física teórica y / o matemática?
¿El uso del aprendizaje automático creará alguna vez una máquina en el comercio de acciones / materias primas / FX que expulse completamente a los humanos del juego?

Personalmente, me importaría más su rendimiento real, en comparación con la generalidad. (Sí, son conceptos diferentes). Por lo general, después de una validación razonable, puede encontrar un modelo cuya generalidad no sea mala (bueno, no podemos asegurarnos de que sea el mejor o no). Luego, lo pondré en uso (es decir, implementación) y lo aplicaré a datos más reales. Cuando encuentre algunos datos de que el modelo actual no funciona bien (es decir, no se generaliza bien sobre estos datos), incorporaré alguna muestra nueva como esta para mejorar el modelo (ajuste fino). Los problemas relacionados en la investigación son el aprendizaje activo y la adaptación del dominio.

Echa un vistazo al artículo CVPR 2017 de este chico:

Zongwei Zhou -sobre el aprendizaje activo.

Consulte este documento sobre la adaptación del dominio:

[1612.08894] Adaptación de dominio no supervisada en la segmentación de lesiones cerebrales con redes adversas

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

¿Llegará un momento en que los humanos informarán a los robots inteligentes?

¿Qué es el aprendizaje automático adversarial? ¿Cuáles son algunos ejemplos reales de eso?

¿Puede una máquina construida por humanos ser más inteligente que los humanos? ¿Pueden comprender niveles de intelecto superiores a los que poseen ellos mismos?

Si quiero estudiar inteligencia artificial en el Reino Unido, ¿qué programas (principales) y qué universidades son las mejores opciones?

¿Cuándo sé que estoy listo para el aprendizaje automático?

¿Es el método de conjunto ampliamente utilizado en el campo de la industria? ¿En qué ocasión utilizamos el método de conjunto en el aprendizaje automático?

Todavía estoy aprendiendo, pero voy a tratar de intentarlo, así que tómalo todo con una pizca de sal.

Sí, por lo que puedo decir, este es un problema bastante significativo en el campo. Intente no sintonizar el conjunto de validación. Creo que uno de los enfoques convencionales para la filtración de información es la validación cruzada de k-pliegues. La forma en que funciona la técnica es que divide todo su conjunto de datos en particiones iguales a k, ejecuta su modelo k veces, cada vez que usa una de las particiones como conjunto de prueba y el resto de las particiones son su conjunto de entrenamiento.

Con respecto a su otra pregunta, no sé mucho más que el hecho de que es una buena regla general mantener baja la complejidad de su modelo, por lo que si ve que los pesos y los sesgos son realmente inestables, puede haber potencial sobreajuste. Puede ser útil agregar un parámetro de regularización (L2) para penalizar el tamaño de los pesos / sesgos.

Puede ser de interés: Gavin C. Cawley, Nicola LC Talbot – Sobre el ajuste excesivo en la selección del modelo y el sesgo de selección posterior en la evaluación del rendimiento: http://www.jmlr.org/papers/volume11/cawley10a/cawley10a.pd

Elton Law

More Interesting

¿Cómo puede 'la nube' democratizar la IA?

¿Existe alguna relación entre la teoría de juegos y las redes neuronales?

¿Cuáles son algunos programas / juegos populares que pueden aprender del usuario y mejorar automáticamente?

Si crearas Inteligencia Artificial General, ¿cómo harías para conquistar el mundo?

¿Mi habilidad para programar un robot me ayudará a ganar la experiencia para hacer una IA similar a Jarvis?

¿Qué es la teoría del refuerzo?

¿La supercomputadora 'Watson' realmente lo sabe todo?

En nuestro nivel de tecnología en computadoras y aviónica, o en un futuro próximo, ¿sería posible construir aviones transformables como un Veritech de Robotech (una Valquiria de Macross para puristas)? Si es posible, ¿sería práctico hacerlo?

¿Cómo es tener a Daphne Koller o Andrew Ng como su asesor de investigación?

¿Para qué usarías un robot?