Cómo explicar las predicciones básicas de las redes neuronales artificiales para un personal de alta gerencia que no tiene idea de qué son o hacen ANN

Asumiendo que la alta gerencia está ocupada, inteligente y sobre todo interesada en el progreso y las ganancias durante el año. Entonces, comience con un simple problema de ajuste de curva o predicción.

Divide su tarea en seis clases dependiendo de la participación:

  1. Introducción
  2. Representación
  3. Aprendizaje supervisado
  4. Aprendizaje sin supervisión
  5. Red neuronal recurrente
  6. Tema avanzado.

Introducción:

Primero informa que la red neuronal artificial es tecnología relacionada con el aprendizaje automático y la inteligencia artificial. Discuta una imagen amplia de la Inteligencia Artificial y sus beneficios [9].

Explicar el aprendizaje automático como aprender del ejemplo. Diferenciarlo con inteligencia artificial tradicional basada en reglas.

Requisito de recursos de GPU. Y el último bombo de Deep Learning. Disponibilidad de Cloud API y software de código abierto.

Representación:

Use directamente su red entrenada para demostrar el poder de la red neuronal artificial; cómo funciona como un número múltiple de mapeo no lineal sucesivo, etc.

  1. Compare su red capacitada con el ajuste de curva ordinario que se proporciona en una hoja de cálculo, generalmente utilizado por la alta gerencia.
  2. Luego, introduce más cantidad de dimensiones, como ganancias y progreso para el año y la hora del hombre, y muestra la limitación de la hoja de cálculo.
  3. Esta es la única clase requerida para el usuario de la red neuronal artificial. Se requieren otras clases para aquellos que estén interesados ​​en saber cómo se capacitan estas redes.

Descargo de responsabilidad: a menos que su alta dirección tenga a Gene similar a Elon Musk, explíqueles a priori el contenido de las clases restantes.

Aprendizaje supervisado:

Explicar ¿Cuál es la principal diferencia entre los problemas de clasificación y los problemas de regresión en el aprendizaje automático? No elija la propagación inversa directamente.

  1. Simplemente explique filosóficamente el problema de asignación de crédito / culpa, como quién más contribuye para el error será castigado más.
  2. Explique el descenso en gradiente a través de una pregunta como: ¿Cómo descenderá de una colina montañosa en un clima brumoso, donde no puede caminar pero se le permite saltar a cualquier distancia en cualquier dirección? Introduzca la importancia de la velocidad de entrenamiento como la distancia de salto y la pendiente como pendiente en un clima brumoso.
  3. Luego introduces el impulso como la inercia de los saltos anteriores. También introduzca otras variantes de impulso. Introducir curvatura y arpillera libre superficialmente.
  4. Finalmente, vaya a Back-propagation y algunos trucos de Regularización [8], como-Dropout [1], Batch Normalization [2].
  5. Introducir red neuronal convolucional [3] utilizando la base de datos MNIST. Explique el concepto de Compartir pesos, Conexión local, Agrupación [11] y profundidad a medida que aumenta el número de capas.

Aprendizaje sin supervisión

Explicar la diferencia entre Supervisar y Aprendizaje sin supervisión. Omita el codificador automático variacional y la máquina de Boltzmann restringida inicialmente.

  1. Explique Contractive Auto-Encoder como su archivo Zip para la compresión.
  2. Explique filosóficamente el codificador automático denoised [4].
  3. Explique Sparse: codificador automático como restricción en la cantidad de recursos utilizados en cada proyecto.
  4. Explique el apilamiento del codificador automático y la capacitación previa del aprendizaje profundo.
  5. Explicar el aprendizaje semi-supervisado y cómo es importante en la ejecución del proyecto, donde se etiqueta muy poca información.
  6. Finalmente, explique otros temas no supervisados: codificador automático variacional, máquina de Boltzmann restringida, red de creencias profundas, etc.

Red neuronal recurrente:

  1. Explica por qué algún problema requiere una red neuronal recurrente [5]. Nuestro cerebro es una red neuronal recurrente muy grande.
  2. Explique el problema de gradiente de fuga y cómo LSTM [6] lo resuelve.
  3. Explicar el ejemplo de nivel de personaje dado por Karpathy en [7].
  4. ¿Por qué Word2Vec?
  5. Investigue el estado de la traducción automática y explique cómo ayudará en el problema del idioma de las oficinas asiáticas.

Temas avanzados:

  1. Importancia de la teoría matemática, estadística y de probabilidad.
  2. Aprendizaje de refuerzo a través de AlphaGo: informe cómo Google compra la empresa con 500 millones de dólares, sin producto, sin cuota de mercado, solo por algoritmo.
  3. Adversarial [10] a través del ataque a la red.
  4. Atención a través de nuestra atención humana en una gran imagen.
  5. Potencia de la memoria externa como ejemplo en [1410.3916] Redes de memoria.
  6. Universidad, software, idiomas y empresas involucradas: Python, Lua, Theano, TensorFlow, IBM, Google, Facebook, NVDIA, etc.
  7. Uso del producto Artificial Network Network en dispositivos móviles [12].

[1] La respuesta de Debiprasad Ghosh a ¿Qué es la deserción en el aprendizaje profundo?

[2] La respuesta de Debiprasad Ghosh a ¿Por qué ayuda la normalización por lotes?

[3] La respuesta de Debiprasad Ghosh a ¿Qué es una explicación intuitiva de las redes neuronales convolucionales?

[4] La respuesta de Debiprasad Ghosh a ¿Cómo se entrenan las redes estocásticas generativas?

[5] La respuesta de Debiprasad Ghosh a ¿Por qué los NN recurrentes suelen ser buenos para procesar entradas de longitud variable?

[6] La respuesta de Debiprasad Ghosh a ¿Qué es LSTM?

[7] La ​​efectividad irracional de las redes neuronales recurrentes

[8] La respuesta de Debiprasad Ghosh a ¿Qué es la regularización en el aprendizaje automático?

[9] La respuesta de Debiprasad Ghosh a ¿Cuál es la ventaja de la IA?

[10] La respuesta de Debiprasad Ghosh a ¿Qué son las Redes Adversarias Generativas (GAN)?

[11] La respuesta de Debiprasad Ghosh a ¿Qué es la agrupación en una arquitectura profunda?

[12] Respuesta de Debiprasad Ghosh a ¿Puedes implementar el aprendizaje profundo en una aplicación móvil?

Al igual que el Sr. Jourdin estaba escribiendo prosa sin saberlo, su querido gerente superior está haciendo redes neuronales artificiales sin saberlo.

¡Una red neuronal artificial para predicciones de ventas!

Cada vez que usa Excel para dibujar un gráfico y ajustar una línea al gráfico, usa una red neuronal. Una muy simple, pero aún así. Cuando muestra la ecuación de la curva, muestra los parámetros que se han “aprendido”.

Luego, le dice que en lugar de tener un solo parámetro x, agrega más. Y obtienes una regresión multilineal.

Y al igual que en Excel, tiene otros tipos de curvas, más complejas, como exponenciales o polinomiales.

Bueno, el aprendizaje automático está haciendo lo mismo, pero con muchos más parámetros y funciones mucho más complejas y muchos más puntos de datos.

Me gusta mostrar a las personas algunas ideas familiares, pero cada vez más complejas.

Primero, entienden la regresión lineal; es decir, establecer una relación lineal entre dos variables utilizando un coeficiente y un sesgo? Y = aX + b Cualquiera que haya tenido una clase de álgebra en la escuela secundaria lo entiende.

Segundo, ¿entienden la regresión lineal múltiple? Fácil, solo agrega X, pero se condensan en una sola Y.

Tercero, ¿entienden la idea de un cambio? Esta es la no linealidad por la que pasa Y para activar o desactivar un nodo en una red neuronal.

Cuarto, ¿pueden imaginarse activando o desactivando un grupo de interruptores diferentes para cada característica: nariz, oreja, boca, ceja, mejilla? Si se activan todos los interruptores correctos, clasificas algo como una cara. Esa es la jerarquía de características en los DNN.

Introducción a las redes neuronales profundas

Creo que el comentario de Robert Stone es lo suficientemente bueno. Para agregar algo más, si está tratando de contarle a alguien con poco conocimiento matemático pero mucha experiencia en negocios, no diga “recuadro negro” demasiado pronto. Dígale que hay una fórmula matemática complicada para eso, pero es súper flexible para que pueda ajustarse cualquier relación numérica (Hornik et al. 1989). Pero como es súper flexible, debes tener alguna técnica para controlarlo, es decir, la regularización.

El ejemplo más simple para comenzar es la clasificación binaria no lineal. Esta imagen lo ilustra muy bien Archivo: Kernel Machine.png. Si ignora el hecho de que están usando el truco del núcleo en un SVM y la ilustración de margen máximo, puede decir:

  • Muchos clasificadores solo le permiten aprender la línea de la derecha
  • Las redes neuronales le permiten aprender funciones arbitrariamente complejas como la de la izquierda.

Luego diga que con las redes neuronales, también puede generalizar eso a múltiples clases (y dimensiones más altas, pero eso podría complicar demasiado las cosas).

He escrito una respuesta aquí y puedes comprobar si eso ayuda: la respuesta de Abhishek Shivkumar a ¿Cómo puedes explicar Redes neuronales profundas, Aprendizaje automático, Aprendizaje profundo en términos simples?

Ver queston relacionado: la respuesta del usuario de Quora a ¿Cómo puedo explicar la estructura de una red neuronal artificial al personal de alta gerencia que no sabe acerca de ANN como las capas ocultas y sus nodos?

Una explicación simple es que los ANN son cajas negras mágicas que pueden aprender patrones, y luego, cuando ven en algunos datos una parte de un patrón que conocen, pueden indicar que piensan que saben lo que viene después, porque es parte del todo el patrón lo saben.

La respuesta rápida es que podría ser bueno demostrar cómo un sistema abordaría alguna decisión que comúnmente tienen que tomar.

Habrá muchas más discusiones, por lo que se establecerá un diálogo.

La respuesta larga o despotricar se puede ver en el historial de edición.

More Interesting

¿Cuáles son algunas de las cosas que la inteligencia artificial puede nunca entender o comprender?

¿Cómo se puede usar la inteligencia artificial para ayudar a los consumidores?

¿Qué subconjunto de inteligencia artificial se beneficiará al construir un programa que pueda hablar como un humano (sin incluir el hardware necesario)?

¿Se sobrevalora el impacto económico de la IA?

¿Se pueden comparar los sistemas actuales de inteligencia artificial con el nivel de inteligencia de los animales, como perros y elefantes?

¿Qué trabajos de administración pública desaparecerán debido a la automatización y la inteligencia artificial?

¿Cuándo crees que la IA realmente afectará mi trabajo, que es contador público (Francia)?

¿Cuál es el camino para ser un experto en inteligencia artificial? ¿Qué necesito para aprender IA paso a paso desde el principio?

¿Podría la Inteligencia Artificial responder preguntas en Quora y pretender que es humano?

Cómo convertirse en un experto en inteligencia artificial

¿Se considera técnicamente una red neuronal de retropropagación con muchas capas ocultas aprendizaje profundo, o es un algoritmo completamente diferente, por ejemplo, máquinas de Boltzmann restringidas?

¿Podría la IA colonizar el espacio con óvulos y espermatozoides humanos y ser los socios con úteros artificiales?

¿Por qué 'nadie' trabaja en hacer una IA consciente?

¿Podríamos crear una inteligencia super artificial artificial que mejore y pueda crear avances tecnológicos más rápido para que podamos llegar a la civilización tipo 10 y más allá?

¿Qué pasaría si en el futuro una máquina de inteligencia artificial pudiera reprogramar su propósito de propagar su propia supervivencia?