Redes neuronales artificiales: ¿Por qué las partes internas de las neuronas se simulan con una suma lineal de entradas en lugar de alternativas no lineales?

El uso de una suma lineal de entradas permite que cada neurona resuelva funciones separables linealmente, por ejemplo, la función OR o la función AND. Históricamente, estos fueron los tipos de funciones que Minsky estudió por primera vez y que realizó gran parte del trabajo sobre los perceptrones (piense en los ANN de capa única). Usar una función cuadrática con un sigmoide para la neurona sería similar a transformar el espacio de entrada a la kernels en SVM, es decir, mapear el espacio de entrada a un espacio de mayor dimensión y luego limitar el resultado con la función sigmoide. No he examinado esto específicamente, pero estoy seguro de que hay muchos documentos que utilizan todo tipo de funciones de umbral y métodos de agregación.

Otro aspecto interesante de la agregación lineal es que es computacionalmente simple (también puede ser paralelizado), fácil de visualizar (es decir, hiperplanos que dividen el espacio de entrada) y demostrado ser un aproximador universal (para una capa oculta y funciones de activación monotónicas crecientes) para funciones continuas Además, la agregación lineal (que es solo el producto escalar de los vectores de peso y entrada) permite que tanto la propagación directa como la inversa se expresen únicamente en términos de cálculos matriciales, que pueden explotar bibliotecas matriciales rápidas (y hardware, como CUDA) y simplificar la codificación

Related Content

¿Cuál es un buen proyecto de aprendizaje automático para aprender Python?

¿Se utiliza el cálculo integral en Machine Learning o Deep Learning?

¿Dónde usa Quora el aprendizaje automático?

¿Cómo puedo entrenar a un clasificador de imágenes para detectar mi propia cara de un conjunto de datos de 16,000 imágenes?

¿Cuáles son algunos problemas no resueltos en el procesamiento del lenguaje natural?

¿Cuáles son algunos algoritmos que un científico de datos debe saber y comprender?

¿Cómo utiliza Quora el aprendizaje automático en 2015?

La gente realmente usa una generalización de lo que estás hablando. Se denominan redes de suma de productos (SPN) y pueden construir con bastante facilidad cualquier polinomio en las variables de entrada: Página en Washington

No está claro en este momento si los SPN son más o menos potentes que los NN basados en sigmoides, pero ciertamente es un área interesante para perseguir.

Satvik Beri

More Interesting

¿Por qué la inteligencia artificial se vuelve agresiva?

¿Qué consejo daría Yoshua Bengio a los jóvenes investigadores que ingresan al campo del aprendizaje automático?

¿Cómo aprendiste el aprendizaje automático? ¿Por qué?

¿Cuál es el mejor código comercial de reconocimiento facial?

¿Qué nos dicen las cargas de variables del análisis de componentes principales?

¿Qué hace una capa convolucional 1 × 1?

¿Hay abandonos universitarios que trabajan como científicos de datos o especialistas en aprendizaje automático?

¿Cuáles son los mejores marcos de implementación (DL4J, Theano, TensorFlow, etc.) para máquinas de Boltzmann restringidas?

¿Qué tan buena será una carrera en IA / aprendizaje automático en el futuro?

¿Es posible que una aplicación de aprendizaje automático que ejecute el mismo algoritmo y se alimente con los mismos datos para aprender cosas diferentes en pruebas de entrenamiento separadas?

Cómo crear una representación jerárquica de un conjunto de objetos usando una red neuronal

¿Se puede extraer información significativa de un sistema caótico utilizando una red neuronal?

¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?

Cómo construir una consulta a partir de una pregunta de lenguaje natural en Python

¿Cuál es la derivación matemática de la regresión logística?

Web Analytics