¿Cómo medimos el rendimiento de aprendizaje de una red neuronal artificial?

De hecho, estoy trabajando en Neural Nets, así que me gustaría darle una oportunidad a esta pregunta. Por favor comente si hay dudas o correcciones para el mismo.

Para un clasificador de redes neuronales, las métricas tienden a ser ‘Precisión’, ‘Pérdida’, etc., lo cual se ha discutido aquí (Enlace).

Para una red neuronal de regresión, las métricas son ‘Factor de correlación’, ‘Pérdida’, ‘Binary_Cross_Entropy’ y así sucesivamente.

La representación gráfica entre dos métricas o una métrica con épocas nos da una idea bastante generalizada sobre la eficiencia de dicha red neuronal.

Sin embargo, las métricas prácticas incluirían la cantidad de GPU que se utilizan para entrenar la red, el tiempo necesario para hacerlo, la complejidad del conjunto de datos y la arquitectura del modelo. Por ejemplo, la red neuronal más compleja en estos sentidos sería 1. Google NN: tardó una semana en entrenar en cientos de GPU (lo siento, no pude encontrar el enlace) 2. Un grupo europeo entrenó a un NN de 16 capas

¡Aclamaciones!

Básicamente, lo que hago es dividir sus datos en un conjunto de entrenamiento y un conjunto de pruebas según su resultado, y ellos entrenan su red neuronal en el conjunto de entrenamiento y usan el conjunto de prueba para la predicción. De esta manera, conoce los resultados originales de su conjunto de pruebas y los resultados pronosticados de su modelo, por lo que puede calcular la precisión de su predicción.

La precisión de la prueba es la mejor métrica, pero a menudo también rastreamos la precisión del entrenamiento y la pérdida de prueba / entrenamiento. La pérdida de validación también se usa a menudo.

More Interesting

Cómo obtener un trabajo relacionado con IA (aprendizaje automático / minería de datos / procesamiento de lenguaje natural / recuperación de información) si no tengo experiencia laboral real en ninguno de esos campos

¿Cuál es el peor de los casos para la inteligencia artificial?

Quiero hacer una IA simple (inteligencia artificial), entonces, ¿qué lenguaje de programación debo aprender para hacer una IA simple?

¿Por qué hay diferencias en el rendimiento entre modelos idénticos de aprendizaje profundo implementados en diferentes marcos?

Conceptualmente, ¿qué significa tener múltiples neuronas en una sola capa de una red neuronal?

¿Cómo se pueden aprender las características del corpus en bruto mediante el aprendizaje automático / aprendizaje profundo?

¿Qué métodos efectivos automatizados / arquitectónicos existen para detectar trolls en línea?

¿Es posible hacer el reconocimiento de voz de otras maneras aparte del reconocimiento de patrones, o podemos hacerlo mejor? Si la respuesta es sí, ¿cómo?

El futuro: a largo plazo, ¿cuáles serán más inteligentes, máquinas inteligentes o humanos?

¿Existe un problema moral / ético con las relaciones sexuales entre humanos y robots humanoides, cuando el robot se ve y se comporta exactamente como un humano?

Soy ingeniero industrial, y me gustaría continuar con los estudios de doctorado en inteligencia artificial en algunos de los laboratorios de investigación de primer nivel en los Estados Unidos. ¿Hay algún problema especial que sugiera que tenga en cuenta?

¿La IA se volverá más inteligente que los humanos y eventualmente invadirá todo?

¿Cuál es el Go AI de código abierto más fuerte?

¿Qué tipo de inteligencia se usa al aprender a dominar el skateboarding? Especialmente trucos técnicos.

¿Cuál es el lenguaje de programación más utilizado para la IA?