¿Cómo almacena un sistema de aprendizaje automático su memoria aprendida?

Cada modelo de aprendizaje automático tiene dos componentes: 1. la estructura del modelo o el algoritmo y 2. los parámetros del modelo. En el caso más simple del modelo de regresión lineal, la estructura es solo una ecuación lineal. Los parámetros son los pesos de las variables dependientes. En un modelo de aprendizaje profundo, la estructura es cómo se conectan los nodos. Los parámetros son los pesos de las interconexiones, etc.

Para responder a su pregunta, el aprendizaje del algoritmo ML se almacena en los parámetros. El proceso de entrenamiento de un modelo ML está afinando los parámetros a través de datos de entrenamiento reales. Los parámetros se pueden actualizar como un proceso por lotes, en otras palabras, a través de un gran lote de datos de entrenamiento o sobre la marcha, donde cada punto de datos se utiliza para actualizar gradualmente el modelo.

Podría haber algoritmos ML más avanzados en los que la estructura en sí misma se modifica, o como dijiste, el algoritmo ML actualiza el código en sí. Pero no hay algoritmos de este tipo utilizados en situaciones prácticas en este momento.

Por lo que he entendido, el sistema no necesita necesariamente almacenar las cosas que aprende. Lo único que importa es el modelo que se está utilizando.
Por ejemplo, supongamos que hay un sistema de clasificación, que puede clasificar un nuevo artículo en clases separadas como deportes, entretenimiento, ciencias, etc.
Actualmente tenemos un modelo que clasifica las noticias entrantes con un 80% de precisión. Si comenzamos a obtener más artículos que involucren muchos conceptos juntos, por ejemplo: Cristiano Ronaldo estuvo en una Feria de Ciencias con Hugh Jackman, la precisión del sistema disminuye. Entonces, lo que hacemos es simplemente volver a entrenar el modelo, lo que significa que damos los artículos más nuevos como entrada al sistema y lo capacitamos nuevamente. Se generará un nuevo modelo que se puede utilizar en tiempo real para clasificar artículos futuros con mayor precisión.

En resumen, la memoria aprendida está cansada en pesos cuyo valor se ajusta a medida que ejecuta el código (regresión, avance / retroceso) repetidamente.

More Interesting

¿Cómo uso la regresión logística si la variable dependiente tiene más de 2 dimensiones?

Cómo usar la red neuronal

Si quiero aprender mucho sobre IA, aprendizaje automático y ciencia de datos, y no tengo absolutamente ninguna experiencia sobre ellos, ¿por dónde empiezo?

¿Cuál es el mejor enfoque para aprender sobre los algoritmos de redes neuronales de predicción del mercado de valores?

¿Por qué necesitamos RandomForestClassifier cuando DecisionTreeClassifier selecciona la mejor característica en cada división?

¿Se puede colocar un previo en el hiperparámetro de un modelo bayesiano jerárquico?

¿Cuáles son los documentos que debería leer sobre los sistemas de recomendación basados ​​en el aprendizaje profundo?

¿NVIDIA GTX 1050 Ti 4GB es suficiente para Deep Learning?

Conjuntos de datos: ¿Cuáles son los principales corpus de texto utilizados por los lingüistas computacionales y los investigadores del procesamiento del lenguaje natural, y cuáles son las características / sesgos de cada corpus?

Cómo configurar Sublime Text para el entorno de Machine Learning

¿Cuáles son ejemplos cuando es útil generar muestras a partir de un modelo probabilístico?

Cómo hacer un bot que pueda ser entrenado para jugar juegos simples usando Python

¿Cuál es la filosofía de la matriz, la descomposición del tensor para encontrar la estructura latente?

¿Hay un grupo de investigadores trabajando en la síntesis de texto EEG (conversión de pensamiento a texto)?

¿Cuál es la diferencia entre Hadoop y Teradata aster?