¿Qué tan programable es la red neuronal artificial?

Esa es la belleza de un ANN. No ‘programamos’ una red neuronal; nosotros los entrenamos Decidimos una función de activación (perceptrón, sigmoide, etc.), inicializamos aleatoriamente los vectores de pesos y sesgos, y presentamos algunos datos de entrenamiento. La red calcula un resultado y lo compara con el resultado ideal (a partir de los datos de entrenamiento).

Esta brecha en los resultados se utiliza para calcular un “error cuadrático medio”, o [matemáticas] MSE [/ matemáticas]. Con un poco de matemática, te darás cuenta, MSE sería una función de los pesos ‘w’ y el sesgo ‘b’. La red neuronal tiene como objetivo minimizar este error.

[matemáticas] C (w, b) = (1 / 2n) * ∑x‖y (x) −a‖2 [/ matemáticas]

Aquí, [matemática] C (w, b) [/ matemática] es el error, o la función ‘Costo’ (puede imaginar esto como una superficie 2D en un plano [matemático] (w, b) [/ matemático]).

Hay muchos algoritmos interesantes que pueden hacer todo el trabajo duro de minimizar el MSE. Descenso de gradiente estocástico (SGD) es uno de ellos.

Lo que esencialmente hace es diferenciar parcialmente la función MSE wrt [matemática] ‘w’ [/ matemática] y [matemática] ‘b’ [/ matemática] y la iguala a cero (para encontrar el punto más bajo de la función). Da un nuevo conjunto de pesos y vectores de sesgo.

[matemática] ΔC (w, b) ≈ (∂C / ∂w) * Δb + (∂C / ∂b) * Δw = 0 [/ matemática]

El proceso se repite miles o incluso millones de veces, y los valores de peso y sesgo se actualizan después de cada iteración.

De esta manera, la red neuronal sigue aprendiendo según los datos de entrenamiento de entrada.

Imagen cortesía: redes neuronales y aprendizaje profundo

Aprendizaje automáticoArtificialInteligenciaInteligencia Artificial GeneralRedes neuronales artificiales

Related Content

¿Cuál elegirías para nacer, con un aspecto muy hogareño pero súper inteligente o, caer muerto, hermoso y súper estúpido?

¿Java es bueno para la IA?

¿Es posible una IA súper inteligente práctica y segura?

¿Cómo usar la inteligencia artificial para construir un cuestionario? ¿Qué tipo de algoritmos puedo usar?

¿El aumento de la Inteligencia Artificial y la robotización conducirán al desempleo o a la desaparición de la necesidad de trabajar?

¿Hay alguna diferencia entre la inteligencia artificial y el aprendizaje automático?

¿Estoy en lo cierto al decir que las unidades de estado sólido eventualmente reemplazarán a todas las unidades de disco giratorio en computadoras de escritorio y portátiles?

Bueno, de acuerdo con el teorema de aproximación universal (Teorema de aproximación universal – Wikipedia), con solo unas pocas restricciones, pueden aproximar cualquier función.

Existen muchos métodos para “programar” los pesos de la red para producir el comportamiento deseado. Muchas veces es una variante inteligente de prueba y error.

Vinit Shandilya

More Interesting

¿Qué sucede si las personas usan una IA para encontrar la forma más segura de usar IA avanzada (por ejemplo, evitar que se haga cargo)?

¿Qué tipo de trabajos de cuello blanco están en riesgo de quedar obsoletos debido a los nuevos avances y la inteligencia artificial?

Para desarrollar un asistente digital con IA, ¿cuáles son las cosas que debo saber?

¿Por qué preferirías la inteligencia artificial?

¿Qué campos matemáticos avanzados se pueden usar en inteligencia artificial?

¿Qué tan ancha es la zona habitable en nuestro Sistema Solar?

¿Qué es la inteligencia artificial? ¿Existe realmente?

¿Cuáles serían algunas preguntas que le haría a un experto en IA?

¿Qué es realmente tan diferente sobre la inteligencia artificial en comparación con los buenos algoritmos antiguos?

¿Cuántos años faltan para tener una IA capaz de pensar e interactuar como humano?

¿Puedo usar Python solo para trabajos de inteligencia artificial?

Supongamos que tenemos verdadera inteligencia artificial ahora. ¿Cuáles son algunos problemas que necesitaríamos para resolver?

¿Por qué Python es el lenguaje elegido para la inteligencia artificial?

¿Cómo podría uno usar la IA para dominar el mundo?

Cómo programar el amor en mi inteligencia artificial

Web Analytics