Si su red neuronal no está aprendiendo (o no está aprendiendo mucho), ¿qué pasos toma para descubrir por qué?

Podrían ser muchas cosas, desde un algoritmo mal escrito, un error en su código, no hay suficientes datos de entrenamiento, no hay suficientes épocas de entrenamiento, etc.

Entonces, ¿por dónde empiezas?

Si no está seguro de su algoritmo, intente entrenarlo en datos donde conozca la solución. Conjuntos de datos famosos como MNIST o IRIS son excelentes para la evaluación comparativa y son gratuitos en la web. Busque un conjunto de datos para principiantes que pueda ser menos complejo y de un tipo similar al de sus datos, para ver qué tan bien funciona.

Si funciona con datos más simples, tal vez su problema no sea suficiente información de capacitación, o tal vez no sea lo suficientemente diversa. Recuerde que necesita muchos datos según el tipo.

Ahora digamos que su algoritmo no es muy bueno incluso con un conjunto de datos más simple. Bueno, ahora debes pensar en lo que podría estar mal. Para ayudar con esto, necesitaría saber un poco más sobre su arquitectura, ya que una red neuronal será diferente de Kmeans ect.

Si necesita ayuda más específica, busque cualquier error en Google, haga preguntas sobre el desbordamiento de la pila, etc. ¡Eso definitivamente es parte del proceso!

More Interesting

¿Cómo es usar las API de servicios cognitivos de Microsoft?

¿Cuáles son los criterios principales para la inicialización de los pesos en el aprendizaje profundo? Si quiero diseñar un algoritmo para la inicialización del peso, ¿qué factores debo tener en cuenta?

Siendo un principiante, ¿dónde debería comenzar a aprender Machine Learning?

¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?

¿Qué arquitectura / herramientas usan los gigantes tecnológicos como Facebook / Amazon / Apple / Microsoft para el análisis de big data / ML?

¿Cómo reconocemos a un usuario en particular en un registro de chat de Internet multiusuario largo?

¿Se puede extraer información significativa de datos hash para el aprendizaje automático?

¿Cómo entiendes las ecuaciones de MLE para los clasificadores Naive Bayes en el libro de aprendizaje automático de Kevin Murphy?

Soy candidato a doctorado en una universidad en Irán, tengo experiencias en PNL persa, Spark, Hadoop y aprendizaje profundo. ¿Tengo alguna posibilidad de ingresar a Google?

¿Cómo se derivan las funciones de costo para las redes neuronales?

¿Es posible el aprendizaje automático acelerado por GPU utilizando un controlador de gráficos de software libre?

Cómo detectar regiones de texto solo de documentos escaneados

¿Cuál es el mejor método para la reducción de dimensionalidad y la selección / extracción de características en datos de espectrometría de masas?

¿Qué habilidades de programación / habilidades informáticas debo aprender si quiero especializarme en visión por computadora y aprendizaje automático?

¿Cuáles son los pasos necesarios para el análisis de sentimientos de las redes sociales?