¿Cómo almacena un sistema de aprendizaje automático su memoria aprendida?

Cada modelo de aprendizaje automático tiene dos componentes: 1. la estructura del modelo o el algoritmo y 2. los parámetros del modelo. En el caso más simple del modelo de regresión lineal, la estructura es solo una ecuación lineal. Los parámetros son los pesos de las variables dependientes. En un modelo de aprendizaje profundo, la estructura es cómo se conectan los nodos. Los parámetros son los pesos de las interconexiones, etc.

Para responder a su pregunta, el aprendizaje del algoritmo ML se almacena en los parámetros. El proceso de entrenamiento de un modelo ML está afinando los parámetros a través de datos de entrenamiento reales. Los parámetros se pueden actualizar como un proceso por lotes, en otras palabras, a través de un gran lote de datos de entrenamiento o sobre la marcha, donde cada punto de datos se utiliza para actualizar gradualmente el modelo.

Podría haber algoritmos ML más avanzados en los que la estructura en sí misma se modifica, o como dijiste, el algoritmo ML actualiza el código en sí. Pero no hay algoritmos de este tipo utilizados en situaciones prácticas en este momento.

Aprendizaje automáticoInteligencia Artificialprogramación de computadoras

¿Cómo se recupera la información de las cajas negras?

¿Cuándo veremos una base teórica y una base matemática para el aprendizaje profundo?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?

¿Debería haber una relación específica entre el número de características y el número de clases? Si tengo 15 funciones pero 50 clases con 1000 datos de entrenamiento, ¿tendré un problema de sobreajuste? ¿Y cuál es la mejor técnica de clasificación para esta relación?

¿Has utilizado Google Translate recientemente? ¿Cómo es la calidad de la traducción con su nueva traducción automática neuronal? ¿Cómo es para cualquier par de idiomas?

¿Cuáles son ejemplos cuando es útil generar muestras a partir de un modelo probabilístico?

Por lo que he entendido, el sistema no necesita necesariamente almacenar las cosas que aprende. Lo único que importa es el modelo que se está utilizando.
Por ejemplo, supongamos que hay un sistema de clasificación, que puede clasificar un nuevo artículo en clases separadas como deportes, entretenimiento, ciencias, etc.
Actualmente tenemos un modelo que clasifica las noticias entrantes con un 80% de precisión. Si comenzamos a obtener más artículos que involucren muchos conceptos juntos, por ejemplo: Cristiano Ronaldo estuvo en una Feria de Ciencias con Hugh Jackman, la precisión del sistema disminuye. Entonces, lo que hacemos es simplemente volver a entrenar el modelo, lo que significa que damos los artículos más nuevos como entrada al sistema y lo capacitamos nuevamente. Se generará un nuevo modelo que se puede utilizar en tiempo real para clasificar artículos futuros con mayor precisión.

Gopi Suvanam

En resumen, la memoria aprendida está cansada en pesos cuyo valor se ajusta a medida que ejecuta el código (regresión, avance / retroceso) repetidamente.

Giridhar Madhavan

More Interesting

¿Cómo uso la regresión logística si la variable dependiente tiene más de 2 dimensiones?

Cómo usar la red neuronal

Si quiero aprender mucho sobre IA, aprendizaje automático y ciencia de datos, y no tengo absolutamente ninguna experiencia sobre ellos, ¿por dónde empiezo?

¿Cuál es el mejor enfoque para aprender sobre los algoritmos de redes neuronales de predicción del mercado de valores?

¿Por qué necesitamos RandomForestClassifier cuando DecisionTreeClassifier selecciona la mejor característica en cada división?

¿Se puede colocar un previo en el hiperparámetro de un modelo bayesiano jerárquico?

¿Cuáles son los documentos que debería leer sobre los sistemas de recomendación basados en el aprendizaje profundo?

¿NVIDIA GTX 1050 Ti 4GB es suficiente para Deep Learning?

Conjuntos de datos: ¿Cuáles son los principales corpus de texto utilizados por los lingüistas computacionales y los investigadores del procesamiento del lenguaje natural, y cuáles son las características / sesgos de cada corpus?

Cómo configurar Sublime Text para el entorno de Machine Learning