Cómo explicar la estructura de una red neuronal artificial al personal de alta gerencia que no sabe acerca de ANN, como las capas ocultas y sus nodos

En primer lugar, pregúntate (¡y a ellos!) Qué es lo que necesitan o quieren entender. Por lo general, buscan “buenos sentimientos difusos”, no una comprensión completa de todos los detalles y caprichos de las redes neuronales. Probablemente no estén interesados ​​en las diferencias de, por ejemplo, RBMs Spiking Networks, o NEAT. Solo quieren tener un concepto general suficiente para poder engañarse y pensar que entienden ALGO acerca de lo que de otro modo sería un completo misterio para ellos.

En segundo lugar, una vez que entiendes lo que realmente quieren entender, puedes darle forma a tu explicación. Si está hablando de redes basadas en propagación inversa, puede, en términos simples, explicar acerca de la minimización del error entre las capas durante la fase de capacitación. No profundizaría mucho más que eso, a menos que tengan algún conocimiento de las matemáticas, porque los perderías rápidamente.

O si está hablando de Evolución neuronal, puede hablar en términos de seleccionar las redes más aptas para la reproducción y evaluar a sus hijos en la próxima generación.

Piense en cómo se lo explicaría, por ejemplo, a un niño inteligente. Desea darle al niño los conceptos básicos sin asustarlo. El equilibrio adecuado con los objetivos reales en mente: las “pelusas cálidas”.

Solo dibuja. El dibujo es una herramienta poderosa.

Haría la analogía con el cerebro humano, comenzaría dibujando una neurona, que algunos otros.

Yo diría que vas de izquierda a derecha. La entrada podría ser los colores que ven tus ojos y la salida 0 o 1 a la respuesta “¿Necesito cerrar los ojos?” en el caso de un reflejo, por ejemplo.

Explique que la red está dividida en capa (y dibuje una línea entre ellas). Que toma números como números de entrada y salida y que entre cada capa se hacen algunos cálculos.

Explique que en cada enlace entre el nodo hay un peso y que las matemáticas usan este peso.

Este peso ha sido calculado durante el proceso de entrenamiento.

Puede hacer un ejemplo simple con pesas falsas y tomar “multiplicar” como función de activación. En una pizarra, es fácil de seguir y comprender.

Evitaría la parte de entrenamiento ya que es la más complicada. A partir de ahí, puede sugerir un entrenamiento de nivel 2 donde será más complicado.

La vista de composición de funciones de las redes neuronales es bastante fácil de entender para cualquiera. Primero describa a su audiencia sobre su tarea, y la entrada (X) y la salida (Y). Por ejemplo, si la tarea es la de clasificación de imágenes, X es la imagen e Y es la categoría de objeto. El objetivo de cualquier enfoque de clasificación es aprender una función [matemáticas] Y = f (X) [/ matemáticas]. En el caso de ANN, la función [matemática] f [/ matemática] se compone de múltiples funciones: [matemática] Y = f_L (f_ {L-1} (f_ {L-2} (… f_ {1} (X) )) [/ math]. Eche un vistazo a Ch1,2 del tutorial del Prof. Bengio ( http://www.iro.umontreal.ca/~ben …) para obtener una mejor explicación de la vista de composición de funciones de la red neuronal.

Descargo de responsabilidad: no estoy sugiriendo si debe explicar sobre ANN a la alta dirección o no. En caso de que decida hacerlo, creo que la vista de composición de funciones es relativamente simple de explicar.

En su forma más simple, una red neuronal puede entenderse como una función, Y_hat = aX + b, en la que los parámetros ayb se ajustan para minimizar la diferencia entre Y_hat, la suposición de la red neuronal y la respuesta verdadera. En lugar de una entrada x, tiene muchas, cada una con sus propios coeficientes que ajustan la señal. La red simplemente asigna esas entradas x a las salidas, Y, que en un clasificador serían las etiquetas, o categorías, que aplica a los datos.

Hola

Gracias por el A2A @ Mohsen Abdallah

Mi primera idea es la analogía con el cerebro humano. Por favor, lea este bonito artículo, relacionado con mi pensamiento: Cómo funcionan las redes neuronales

Espero eso ayude.

Gracias por el A2A.

Depende de lo que intentes lograr. ¿Por qué está tratando de explicar la estructura de las redes neuronales al personal de la alta dirección? La forma en que creo que debería explicarlo debería variar dependiendo, por ejemplo, de si la administración es escéptica sobre el funcionamiento de las redes neuronales o si les gustaría aprender más sobre cómo funcionan las redes neuronales.

Usted no

Les dice cómo lo que ha logrado puede generar ingresos, para qué se puede usar y cómo esto es mejor que la competencia, etc. Como máximo, describa la solución como una caja negra, solo hablando de características visibles desde el exterior.

Digamos que quisieras venderme un auto: ¿Me hablarías de la aleación de metal utilizada en las bujías y el proceso de fabricación? Por supuesto no.

Considere la tarea de clasificación supervisada del aprendizaje automático, en la que se le da un conjunto de puntos de entrenamiento [matemática] (x_i, y_i) [/ matemática] e intenta aprender una función [matemática] f [/ matemática] que mapea un determinado [matemática] x [/ matemática] a su correspondiente [matemática] y [/ matemática] dentro de una tasa de error aceptable. Para modelar esta función, generalmente define una clase de funciones y luego elige la función que mejor se ajusta a los datos de entrenamiento. Dependiendo de cómo defina esta clase de funciones, obtendrá diferentes paradigmas de aprendizaje automático. Uno de esos paradigmas es el de las redes neuronales.

El elemento básico de una red neuronal es una neurona o perceptrón, que es una función no lineal de una combinación lineal de sus entradas:
[matemáticas] f (x) = g (\ sum w_i x_i) [/ matemáticas]
donde g es una función no lineal. Diferentes pesos w le dan diferentes funciones f. El proceso de aprendizaje implica encontrar los pesos que optimizan alguna función.

Claramente, esta clase de función no podrá modelar tareas de clasificación complejas. Entonces, lo hace más complejo al tener capas de tales neuronas: tome algunas neuronas, cada una de las cuales toma el vector de entrada x y devuelve un número real. Las salidas de todas estas neuronas se alimentan a otra neurona que da una salida final. A medida que apila las neuronas horizontal y verticalmente, la clase de funciones que obtienes se vuelve cada vez más compleja, y ahora tienes una “red neuronal profunda”. Un detalle adicional es que en la descripción anterior, todos los pesos de todas las neuronas son independientes, mientras que en una red neuronal profunda real, los pesos de muchas neuronas (típicamente en la misma capa) están obligados a tener el mismo valor. Dependiendo de cómo restrinja estos pesos, obtendrá diferentes tipos de capas, que se pueden combinar para generar una red profunda completa.

(Respuesta original: la respuesta de Prasoon Goyal a ¿Qué es un algoritmo de aprendizaje profundo, simplemente explicado?)

Oh sí, es un gran error incluso intentarlo. Siempre piense en lo siguiente: para empezar, no tienen idea de cómo se procesan los datos. Lo mejor que puede hacer es explicar claramente qué problema está resolviendo su idea y omitir parte de los detalles técnicos. Intenta resumirlo y explicárselo de una manera que muestre cómo es beneficioso posiblemente en una pequeña historia.

Un pequeño ejemplo de cómo expliqué la realidad aumentada:

Piensa en caminar por una calle. A la izquierda, hay una parada de autobús, a la derecha, hay una parada de taxis. Justo en frente de ti hay una pequeña tienda. Entonces, miras a la izquierda y ves la parada de autobús. Encima de la parada del autobús hay una pequeña señal y cuando señala la señal con la mano, se abre una hoja que muestra el horario en el que vienen los autobuses. Ningún autobús vendrá en el futuro cercano. Entonces miras al frente. Hay un video en el escaparate que muestra una breve descripción de todas las cosas importantes que vende la tienda. No le interesa y mira a la derecha. No hay taxis parados en la parada de taxis. pero de nuevo, hay un símbolo encima del stand, que puede usar para llamar a un taxi. Como no tiene nada que hacer y tendría que esperar mucho tiempo para tomar el autobús, decide llamar a un taxi, señalar el ícono que se encuentra arriba de la parada de taxis y un taxi autónomo llegará a su ubicación 1 minuto después. Esa es la realidad aumentada, la fusión del mundo real con elementos digitales.

Ahora tienen una idea de lo que realmente es, no de cómo funciona exactamente. Ven los beneficios y las oportunidades. Es decir, lo que les importa a los altos ejecutivos y gerentes. Los detalles técnicos los aburrirán y dejarán de escuchar después de 1 o 2 minutos y se olvidarán de lo que dijo después de 4 minutos.

En Inteligencia Artificial básicamente haces dos cosas: construir o clasificar. Hay muchos enfoques para estas dos tareas. Un enfoque para la clasificación son las redes neuronales. Una red neuronal toma un conjunto de entrada y lo clasifica como una o más categorías. La entrada puede ser cualquier cosa y las categorías pueden ser cualquier cosa. Por ejemplo, la entrada podría ser atributos de un informe crediticio individual y las categorías podrían aprobar crédito o denegar crédito. La entrada podría ser una captura de pantalla de un videojuego y el último cambio en la puntuación, las categorías podrían moverse el controlador del juego hacia la izquierda o hacia la derecha. Las posibilidades de clasificación son infinitas.

Gracias por el A2A.
En mi experiencia, las personas de la alta gerencia no están particularmente preocupadas por las complejidades de su implementación. Solo necesitan tener una comprensión amplia de cuál es su producto y cuáles son sus capacidades. Entonces, en lugar de hablar sobre las capas y sus roles en el logro de sus objetivos de rendimiento, hablaría sobre las características que podría admitir en el futuro y lo que no es posible.

Sin embargo, eso no es lo que pediste. Realmente desea explicar a la “alta gerencia” qué son los ANN. La respuesta a eso depende de quién pregunta en la alta dirección. Si provienen de un entorno puramente financiero o comercial, probablemente podría decir que una ANN es una red que es capaz de aproximarse a una función arbitraria. Que el truco está en el método de búsqueda utilizado para generar la función aproximada. Si tienen alguna comprensión de las matemáticas y las técnicas de optimización, entonces podría explicar cómo se usa el descenso de gradiente para entrenar estas redes. Si son personas con experiencia en software, entonces hablaría sobre las bibliotecas y otras optimizaciones de rendimiento que son especiales para su producto. Si son expertos en algún campo relacionado sin experiencia directa en ANN, entonces probablemente estén tratando de ver si su propia experiencia podría ayudar a mejorar el producto. Todo depende de quién en la alta dirección le haga la pregunta.

Respuesta simple: ¡No lo haces!

Son gerentes, no ingenieros. Si fuera usted, invertiría mi tiempo elaborando cómo los ANN aumentarán los ingresos o reducirán los costos en lugar de explicar cómo funciona.

Sí, por supuesto, solo explique que si necesita vender un automóvil, por sus funcionalidades, el modelo y la motorización, son solo una cuestión de precio final (recursos computacionales), no de elección.

Solo eso, si puede abstraer las funciones, puede explicárselo a las personas sin aturdirlas con peculiaridades tecnológicas, que solo afectan sus nervios.

No siendo realmente un fanático de las redes neuronales artificiales, me enfocaría en lo que las hace tan poderosas: el hecho de que están compuestas por una gran cantidad de máquinas simples unidas en una red de procesamiento en paralelo,

Esto significa que una ANN tiene muchas entradas sensoriales y muchos efectores (salidas que hacen cosas). En el medio, hay muchas máquinas pequeñas que dividen el problema en pequeños bits mientras mantienen las interrelaciones de los bits como parte de la estructura de la red.

Pero destacaría el hecho de que, en contraste con la mayoría de los programas de computadora que se adhieren a la arquitectura de Von Neumann, un ANN se ejecuta esencialmente en paralelo.

La alta gerencia es la alta gerencia porque se preocupan por el resultado final y porque confían en usted para implementar lo que se requiere.

Por consiguiente, muéstreles la situación actual con cifras clave (tasa de reconocimiento, tasa de error, costo en tiempo de cómputo, costo en implementación, etc.) y luego qué cifras espera obtener gracias a ANN.

Ahora están prestando atención, saben que al tomar la decisión correcta durante esa reunión pueden hacer una diferencia positiva para la empresa.

Use entonces un ejemplo que sea significativo para ellos, si la compañía está haciendo zapatos, use un ejemplo sobre zapatos. Después de eso, el nivel de detalle que desea obtener depende de su comprensión de cuánto quieren saber y no puedo responder eso.

Es fácil: solo diles que estás utilizando técnicas avanzadas de aprendizaje automático.

Creo que la mejor manera de ganar la confianza de las personas es explicar las cosas en sus términos. Esta creencia no me ha llevado a ninguna parte de la cadena de gestión, que nunca ha sido mi objetivo, pero las personas con las que trabajo tienden a confiar en mi experiencia (o eso creo).

Entonces, si desea que las NN sean más amigables para la alta gerencia, simplemente dígales que es como una cadena de suministro de múltiples capas, que es.

Se sentirán decepcionados: el envoltorio de regalo alrededor de una pala es más brillante que la pala en sí, pero por lo general son personas inteligentes, y entenderán que esta pala es lo que necesitan si quieren extraer estos datos.

¡Aclamaciones!

More Interesting

¿Cómo funcionan los juegos con una gran cantidad de artículos de IA, mapas y coleccionables? Por ejemplo, AOE. Puede que no sean visibles en la pantalla, pero seguirán consumiendo recursos.

¿Cuáles son las mejores aplicaciones de IA?

Cómo comenzar a construir un robot

Conflictos geopolíticos: ¿tiene sentido que si los humanos se encuentran ahora en las primeras etapas de desarrollo de la IA, algunos seres en otros planetas lejanos ya sean seres con IA?

¿La IA se volverá más inteligente que los humanos y eventualmente invadirá todo?

¿Qué debo elegir para estudiar, aprendizaje automático, análisis de big data o algo más en inteligencia artificial?

¿Qué es lo mejor para entrenar una red neuronal artificial, un algoritmo de retropropagación o un algoritmo genético?

¿Es posible identificar patrones de forex con Azure Machine Learning? Si es así, ¿cómo?

Cómo usar la programación probabilística con marcos como Meteor.js, y ¿es posible usar bibliotecas como Figaro en aplicaciones JavaScript o tiene que codificar las suyas propias?

¿Cómo podemos usar Hadoop para AI?

¿Se puede reemplazar a las personas con máquinas en la MAYORÍA de las líneas de trabajo?

¿Cómo invierte Salesforce en inteligencia artificial en 2017?

Tecnología: ¿Por qué la gente teme a un escenario de Skynet?

¿Cuáles son algunos casos cotidianos que se pueden resolver mediante aprendizaje automático / ciencia de datos / IA?

¿Puede un sistema artificialmente inteligente obtener la iluminación?