¿Qué es un perceptrón?

El cerebro humano puede describirse como una red neuronal biológica, una red interconectada de neuronas que transmiten patrones elaborados de señales eléctricas. Las dendritas reciben señales de entrada y, en función de esas entradas, disparan una señal de salida a través de un axón. O algo así.

Bien, primero, ¿qué es una red neuronal?

Una red neuronal es un sistema computacional “conexionista”. Los sistemas computacionales que escribimos son de procedimiento; un programa comienza en la primera línea de código, lo ejecuta y pasa a la siguiente, siguiendo las instrucciones de forma lineal. Una verdadera red neuronal no sigue un camino lineal. Más bien, la información se procesa colectivamente, en paralelo a través de una red de nodos (los nodos, en este caso, son neuronas).

Uno de los elementos clave de una red neuronal es su capacidad de aprender . Una red neuronal no es solo un sistema complejo, sino un sistema adaptativo complejo, lo que significa que puede cambiar su estructura interna en función de la información que fluye a través de ella. Por lo general, esto se logra mediante el ajuste de los pesos.

Entonces, ¿qué es Perceptron?

Inventado en 1957 por Frank Rosenblatt en el Laboratorio Aeronáutico de Cornell, un perceptrón es la red neuronal más simple posible: un modelo computacional de una sola neurona. Un perceptrón consta de una o más entradas, un procesador y una única salida.

Un perceptrón sigue el modelo de “avance”, lo que significa que las entradas se envían a la neurona, se procesan y dan como resultado una salida. En el diagrama anterior, esto significa que la red (una neurona) lee de izquierda a derecha: las entradas entran y las salidas salen.

El algoritmo de perceptrón:

  1. Para cada entrada, multiplique esa entrada por su peso.
  2. Suma todas las entradas ponderadas.
  3. Calcule la salida del perceptrón en función de esa suma que pasó a través de una función de activación (el signo de la suma).

Hay dos ejércitos: rojo y azul.

Supongamos, en aras de la discusión, que cada soldado de ambos ejércitos tiene las siguientes características:

a. Fuerza

si. Exactitud

C. Velocidad

Podemos llamar a estas características como X donde x1 = fuerza, x2 = precisión y x3 = velocidad. Cada soldado se describe con un valor particular de x1, x2 y x3 . Los reyes acordaron tener algunos pesos asociados con cada característica: w1 para Fuerza ( x1 ), w2 para Precisión ( x2 ) y w3 para velocidad ( x3 ). A cada soldado se le asigna una puntuación basada en la fórmula:

puntuación = (w1 * x1) + (w2 * x2) + (w3 * x3)

Lea una respuesta más descriptiva aquí: Introducción a la Terminología de aprendizaje automático y Perceptron

Ahora, si el soldado tiene más de un umbral, pertenecerá al ejército azul, de lo contrario estará en el ejército rojo.

Para el ejército azul: puntaje> umbral

Para el ejército rojo: puntuación

Podemos generalizar el resultado como:

El perceptrón implementa h (x) definido anteriormente. Dado un conjunto de entrenamiento [(t1, y1), (t2, y2), (t3, y3), (t4, y4) …………… (tn, yn)] que es linealmente separable donde:

El algoritmo de aprendizaje Perceptron selecciona un punto (tm, ym) donde se clasificó erróneamente. Como en, nuestro algoritmo dice que ym es positivo donde, como en realidad, es negativo. En tal escenario, nuestro modelo de aprendizaje actualizará el peso como w = w + tm * ym.

El modelo de aprendizaje comenzará otra iteración hasta que pueda encontrar la división perfecta para el conjunto de datos. Para hacer la visualización, el modelo de aprendizaje de perceptrón encontrará líneas verdes y continuará hasta que pueda encontrar una línea rosa.

Si el conjunto de datos no es linealmente separable, el algoritmo de aprendizaje de perceptrón no convergerá y continuará hasta que se le indique explícitamente que se detenga limitando el número de iteraciones.

[1]

Notas al pie

[1] Introducción a la terminología de aprendizaje automático y perceptrón

More Interesting

¿Se utiliza el aprendizaje automático para resolver otros problemas en lugar de problemas relacionados con la inteligencia artificial?

¿Cuál es el punto de usar el problema dual cuando se ajusta SVM?

¿Cómo son útiles las redes neuronales convolucionales para las empresas e industrias normales?

¿Qué métodos de aprendizaje automático simples e intuitivos ofrecen el mayor valor?

¿Prediciendo compras (en comercio electrónico) a través de modelos estadísticos o de aprendizaje automático?

¿Qué papel juegan las redes neuronales y el aprendizaje automático en la atención médica?

¿Qué es mejor para la dirección de investigación de visión por computadora, redes neuronales o modelos gráficos probabilísticos?

¿Es posible usar 'Mínimo cuadrado (LS)' como la función objetivo cuando se trata con un problema de clasificación?

Cómo construir un proyecto de aprendizaje profundo en dos meses

Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

¿Cuál es la relación entre el modelo Log Linear, el modelo MaxEnt y la regresión logística?

¿Cómo se puede aplicar el aprendizaje automático al póker?

¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?

¿Cuáles son las desventajas de tener un tamaño de paso constante para el Descenso de gradiente estocástico?

¿Cuál es la mejor manera de manejar los valores atípicos en Machine Learning?