¿Cuál es la teoría de las redes neuronales?

Ahora, la ingeniería de redes neuronales se basa casi por completo en heurística, casi ninguna teoría sobre las opciones de arquitectura de red. Puede leer más sobre el método de ingeniería en una obra del profesor Billy Koen, especialmente “Discusión del método. Realización del enfoque del ingeniero para la resolución de problemas”.

En cuanto a los enfoques contemporáneos de la teoría de redes neuronales, la promesa es la física evolutiva: puede profundizar en ella comenzando con enlaces desde aquí: ¿Por qué funciona el aprendizaje profundo? Pero es demasiado pronto para tener una fórmula definitiva para una respuesta sobre números óptimos para estructuras óptimas en una arquitectura de red neuronal.

Una de las ideas aquí es crear una red neuronal de arquitectura que esté capacitada para capturar heurísticas arquitectónicas sobre la ingeniería de redes neuronales. Y cuando necesite diseñar alguna red neuronal para una tarea particular, puede obtener números para su arquitectura de red neuronal objetivo óptima de ese arquitecto NN. Lo habitual: ¡los programas deberían escribir / generar programas óptimos, los programas neuronales deberían escribir programas neuronales óptimos! Hoy en día es casi un sueño, pero la gente está trabajando para este nuevo y valiente CANNE (ingeniería de redes neuronales asistida por computadora). Pero todavía no es una teoría, se trata de heurística, una nueva ronda de empirismo (más sobre esto aquí: Aprendizaje profundo y el triunfo del empirismo).

Ayuda a pensar en las neuronas como objetos que convierten entradas en salidas con una función de transferencia. Puede ser binario, en cuyo caso se llaman perceptrones, o cualquier otro. Las más populares en las redes neuronales son las neuronas sigmoideas. Luego, para cada capa de neuronas estás ajustando un montón de regresiones. Pasas de la primera capa a la última capa y luego regresas hasta que has convergido en los pesos óptimos para cada neurona en cada capa. Óptimo = minimizar una medida del error.

Eso es realmente todo lo que hay que hacer. La parte difícil es la implementación, especialmente cuando la red neuronal permite bucles de retroalimentación.

Muchas herramientas existentes permiten el “barrido de parámetros”, por ejemplo, construir modelos varias veces con los mismos datos, pero con parámetros variables, como el número de capas y el número de neuronas por capa. La selección de parámetros puede ser aleatoria o de Montecarlo o simplemente cubrir toda la cuadrícula. Tenga en cuenta que el conjunto de parámetros “correcto” no es el que proporciona el mejor modelo de puntuación, sino el que le proporciona una puntuación aceptable con recursos mínimos (número de capas / neuronas). De lo contrario, podría sobreajustar su modelo.

Las redes neuronales son modelos poderosos. Pero desafortunadamente no hay una teoría definitiva que nos diga cómo elegir la cantidad correcta de neuronas. Sin embargo, existen trabajos teóricos sobre el número de neuronas y la capacidad general del modelo. Pero esos rara vez son prácticos.

More Interesting

¿En qué sección la introducción de robots e IA causará riesgos laborales? En ese momento, ¿cuál será el trabajo más rentable?

¿Cuáles son las mejores formas de comenzar a implementar una red neuronal?

¿Dónde puedo comenzar a aprender sobre redes neuronales?

¿Cuáles son las bibliotecas de aprendizaje automático basadas en Python más populares?

¿Qué evento específico podría llevar a una computadora a ser consciente de sí misma?

¿Qué lenguaje de programación debería aprender para la IA que será predominante en el futuro cercano?

¿Es importante el modelado de un sistema (aquí, un robot del mundo real)?

¡Inventé un abogado humanoide pero solo los humanos pueden ser abogados! ¡El juez está enganchado a la IA! ¿No debería mi abogado humanoide ser capaz de representarme?

¿Hay una lógica detrás de cómo se creó el juego 2048? Si es así, ¿qué es?

¿Es el método de conjunto ampliamente utilizado en el campo de la industria? ¿En qué ocasión utilizamos el método de conjunto en el aprendizaje automático?

¿Hay libros sobre reconocimiento de patrones por lógica y lingüística en lugar de estadísticas y matemáticas?

¿Qué crm usa la inteligencia artificial?

¿Cuánto le costó a Google construir un prototipo completamente funcional del automóvil autónomo?

¿Cuáles son sus recomendaciones para el aprendizaje automático de autoaprendizaje?

¿Crees que sería bueno que una IA suficientemente inteligente tuviera la capacidad de abordar perfectamente las preguntas de Quora?