¿Es difícil construir un simulador de planta de energía usando una enorme red neuronal artificial para fines de simulación y educación?

El problema es que un ANN gigantesco no es mejor que un ANN promedio con una gran cantidad de entradas, y si entrena un ANN, la tasa de error ni siquiera disminuye con el tamaño, solo aumenta el tiempo de entrenamiento exponencialmente y el error final es no se garantiza que baje, también puede aumentar. tampoco se garantiza que una red basada en ANN aprenda nada, incluso si es multicapa, se sabe que el aprendizaje mediante retropropagación logra buenos resultados en redes de 2-3 capas, pero nunca se trata de redes más profundas. Yo también caerá fácilmente en una sobrecompensación, produciendo habilidades de generalización menores o nulas, por lo que su red rinde inutilizable. Nadie afirmó que un gran ANN haría ninguna tarea, la cosa reside en la arquitectura misma.

Solo piense en esto: ¿por qué han pasado tantos años desde CPU simples hasta procesadores inteligentes multinúcleo reales? – La respuesta no está en haber usado millones de transistores pequeños, con tamaños decrecientes … si es así: ¿por qué no construyeron una súper CPU en los años 60 para diseñar las CPU reales? La respuesta, mi amigo, radica en la arquitectura, el paralelismo y las teorías detrás de ellos.

La velocidad y la precisión individuales son inútiles sin una teoría adecuada relacionada con una arquitectura adecuada.

¡Ahí está el secreto que se encuentra!

Para elaborar una respuesta, primero debe observar las fortalezas de un NN. Son muy buenos para reconocer patrones en sus datos. Coloca sus datos en las entradas y una pequeña parte de la información emerge en el otro extremo, ya sea en un rango numérico o en un esquema de clasificación.

Teniendo eso en cuenta, ¿qué tipo de simulación estás buscando? Tal vez, si desea saber la temperatura del núcleo dada la configuración de los gagues, puede hacer un “simulador”. Si necesita simular los niveles de agua, la desintegración radiactiva, los desechos, las presiones de las tuberías y toneladas de otras cosas, las NN probablemente no sean lo que está buscando. En ese punto, necesitarías hacer simulaciones de física.

Quizás pueda compartir un poco más de lo que está tratando de lograr y podríamos ayudarlo.

Respuesta corta, no porque necesitas datos para entrenarlo.

Las redes neuronales se pueden usar como un proxy de coincidencia de patrones, donde uno alimenta una serie de puntos de sensores y con el tiempo puede predecir el siguiente punto de datos probable, pero esto solo es útil cuando intenta construir una emulación de una estación de energía existente.

Pero esto tiene un valor educativo limitado, ya que principalmente en la educación desea examinar los casos límite, donde hay algún problema y el ejercicio es averiguar qué hacer.

En este caso, se usaría un simulador de proceso dinámico como Aspen o un simulador de componentes que se personalizaría para construir el modelo e insertar la lógica de cambio de estado para simular la emergencia, según sea necesario para las lecciones individuales.

Una red neuronal puede tener uso como proxy de supervisión sobre este modelo, detectando y clasificando anomalías, suponiendo que se puedan inyectar suficientes peterbaciones, pero no es adecuado generar el modelo ya que no hay base para su aprendizaje.

¿El conjunto de datos cubre casos extremos? (Por ejemplo, ¿variar los controles para hacer que la planta se apague o explote?). Probablemente no. Como tal, crear una simulación con “objetos” que representen las diversas partes y bucles proporcionaría una mejor experiencia educativa.

No estoy seguro de que una red neuronal sea necesariamente la mejor herramienta para el trabajo (y mucho menos una red neuronal “enorme”, que requiere más datos). ¿Qué tipo de simulación estás construyendo?

Si estás intentando hacer predicciones de carga, ¿has mirado:

http://web.stanford.edu/~gorin/p

Un simulador de planta de energía necesitaría bucles de retroalimentación de control analógico o digital, y un ANN no es del todo correcto para este propósito. Por ejemplo, creo que no es una buena combinación intentar implementar bucles PID usando NN.
Además, tener un buen control sin fallas en todo el rango de valores analógicos requeriría una gran cantidad de datos. No veo este enfoque de la simulación como práctico.

Yo diría que depende de la cantidad de datos etiquetados que tenga (y la calidad).

Empezaría mucho más simple que NN.

No estoy familiarizado con un ” simulador de planta de energía”, pero buscaré más en la programación probabilística como sentimiento … Creo que tienes muchos ‘antecedentes’ sobre cómo debería funcionar una planta de energía, o al menos es un requisito previo de problema 😉