¿Cuánto mejora la aceleración del entrenamiento MLP mediante la inicialización de pesas con distribución no uniforme?

Para responder exactamente a su pregunta, uno necesitaría conocer más detalles sobre el experimento que hizo y qué quiere decir exactamente con “Lomax”, que es su descriptor para la curva azul. Como está interesado en la relación entre la inicialización y la tasa de convergencia, lo guiaré hacia la Normalización por lotes. Al incorporar la normalización en su arquitectura (aplicando el algoritmo 1 en su documento), en lugar de manejar la normalización en su inicialización (como se hace en el llamado método de inicialización de Xavier: una mejora sobre el enfoque de Alexnet de w_i, j ~ N (0, 0.01) o su método w_i, j ~ Unif (a, b)), puede hacer su vida más fácil de varias maneras. Como dice el documento, “al normalizar las activaciones en toda la red, evita que los pequeños cambios en los parámetros se amplifiquen en cambios más grandes y subóptimos en las activaciones en gradientes”, lo que le permite utilizar mayores tasas de aprendizaje y preocuparse menos por la explosión de los gradientes al definir su arquitecturas propias (no probadas previamente) (en lugar de, por ejemplo, entrenar Inception en Imagenet, que es conocido por converger con configuraciones razonables).

Aprendizaje automáticoAprendizaje profundoArtificialInteligenciaInteligencia Artificial GeneralRedes neuronales artificialesRedes neuronales convolucionales

Related Content

¿Cuáles son los aspectos más útiles de la inteligencia artificial para las personas normales?

Cómo (un humano) emular una inteligencia artificial perfecta y su forma de pensar en la vida diaria

¿Cómo funciona TensorFlow con Python en inteligencia artificial?

¿Cuál es la mejor universidad para estudiar inteligencia artificial en Canadá?

¿Qué se necesitaría para que una IA inteligente se dé cuenta de que los humanos son un problema?

¿Cómo se pueden explicar los peligros de la inteligencia artificial utilizando modelos teóricos filosóficos?

¿Dónde calificaría la dificultad de crear inteligencia general artificial (AGI) frente a los otros problemas gigantes que la humanidad enfrenta / enfrentará?

More Interesting

Cómo extender mi conocimiento a la inteligencia artificial cuando tengo un buen conocimiento del aprendizaje automático, pero cero conocimiento en IA

¿IoT e inteligencia artificial promoverán la seguridad pública?

¿Cómo es hacer una investigación de IA?

¿La inteligencia artificial será propensa a los mismos prejuicios que los humanos? Si no, ¿cómo se evita (/ será)?

¿Cuál es el concepto erróneo más grande de la inteligencia artificial?

¿Qué es realmente tan diferente sobre la inteligencia artificial en comparación con los buenos algoritmos antiguos?

¿Puedo enseñarme inteligencia artificial?

¿Crees que el surgimiento de la IA es una amenaza para el mundo en un futuro cercano?

¿Podría la Inteligencia Artificial responder preguntas en Quora y pretender que es humano?

¿Cuál cree que es el mayor inconveniente de nuestros algoritmos de inteligencia artificial actuales?

¿Cuáles son algunas de las mejores películas o libros de ficción sobre inteligencia artificial?

¿El avance en la IA y el sector robótico desencadenará el desempleo?

Cómo crear una aplicación de chat de inteligencia artificial en Android

¿Es posible enseñarle a AI qué es el amor?

¿Qué harías con una cantidad arbitraria de video del mundo que nos rodea y una computadora arbitrariamente poderosa?

Web Analytics