Creo que debería usar la configuración que funciona para sus datos. Si va a utilizar técnicas estándar, arquitecturas, etc., no habrá problemas con la publicación; por estándar me refiero a las cosas NN que puede citar fácilmente. Entonces, por ejemplo, ha utilizado la activación de ReLU y está funcionando bien para usted, por lo que está bien, porque puede citar fácilmente el artículo donde se presentó ReLU. Puede haber un problema cuando se te ocurre alguna nueva función de activación (por ejemplo) y la usas con tu problema sin presentar pruebas, puntos de referencia y teoría de cómo funciona.
Entonces, por “estándar” entiendo todas las técnicas de NN que se publicaron.
Y, por ejemplo, si va a entrenar a NN durante 50 épocas y utilizará un tamaño de lote de 1024, simplemente escriba esto en su artículo. Lo ideal sería si tiene alguna explicación de por qué usó 50 épocas, por ejemplo: “Observamos que el entrenamiento con 50 épocas y 1024 tamaños de lote es suficiente para que NN converja” y trace el entrenamiento de la red en su artículo.
- ¿Es posible que la CIA, la NSA o cualquier otra agencia de inteligencia / seguridad de todo el mundo estén haciendo una investigación clasificada de inteligencia artificial y el resto del mundo no lo sepa?
- En nuestro nivel de tecnología en computadoras y aviónica, o en un futuro próximo, ¿sería posible construir aviones transformables como un Veritech de Robotech (una Valquiria de Macross para puristas)? Si es posible, ¿sería práctico hacerlo?
- ¿Qué problemas resuelve el aprendizaje automático?
- ¿Cuáles son algunos textos recientes sobre el aprendizaje a gran escala?
- ¿Los robots alguna vez vencerán a la humanidad?
Para obtener más detalles sobre los “estándares”, puede consultar el artículo de Y.Bengio https://arxiv.org/pdf/1206.5533v…
¡Buena suerte!