Para aplicaciones web grandes, ¿dónde se almacenan los datos de aprendizaje automático?

Depende del tipo de aprendizaje automático. Por lo general, algo como:

– Los conjuntos de datos persistentes para problemas de minimización de gráficos generalmente se almacenan en una base de datos de gráficos como neo4j
– Los datos de entrenamiento se almacenan en bases de datos relacionales como SQL o en un almacén de documentos como MongoDB, dependiendo de si los datos están bien estructurados y encajan en filas, o semiestructurados y más como JSON respectivamente
– Los hiperparámetros históricos de la red neuronal almacenados en una tienda de aplicaciones similar a la viñeta anterior
– Los estados de la red neuronal para los nodos (pesos, sesgos, topología) generalmente se almacenan como blobs / objetos binarios codificados con referencias al conjunto de hiperparámetros original que los sembró, y a veces también incluyen referencias a las semillas aleatorias originales más los datos del conjunto de entrenamiento que produjeron el estado actual
– Cualquier cosa con una representación matricial de un punto en el tiempo generalmente se almacena de manera similar al caso de la red neuronal anterior
– Para una escalabilidad horizontal de alto rendimiento en una nube pública, a veces las redes neuronales simplemente se muestran en una imagen de máquina con los estados de hiperparámetro y matriz escritos en un archivo en el disco antes de apagarse y parpadear. Esto le permite simplemente girar una nueva imagen en el hipervisor y mantener los tiempos de lanzamiento (viscosidad de escala horizontal) al mínimo.

Related Content

¿Es bueno tener más y más parámetros capturados para los datos de calificación crediticia? ¿Los algoritmos comienzan a fallar / se vuelven inexactos si hay demasiados atributos en los datos? ¿Cómo se pueden erradicar los parámetros que no son muy útiles?

¿Cuáles son los pasos de validaciones cruzadas en el aprendizaje automático?

¿Cuál es el tipo de computadora más rápido? ¿Qué lo hace ser más rápido que el resto?

¿Por qué las computadoras siempre realizan la suma?

¿Qué es el almacenamiento?

¿Por qué las GPU son adecuadas para el aprendizaje profundo?

Cómo prepararse para una maestría en informática en aprendizaje automático / ciencia de datos como una persona sin mucha experiencia en el campo de la informática

More Interesting

¿Cómo se usan los minterms y maxterms en el álgebra booleana en circuitos digitales reales (en detalle)?

¿En qué se diferencia la lingüística computacional del procesamiento del lenguaje natural?

¿Cuáles son algunos desarrollos sorprendentes en el campo del procesamiento del lenguaje natural?

¿Cuáles son los algoritmos de aprendizaje automático que se sabe que no son transparentes?

¿Se puede utilizar Machine Learning para el criptoanálisis?

¿Ha cambiado la reputación del Reino Unido en el mundo debido al Brexit?

¿Es la Inteligencia Artificial MS ofrecida por UGA un título que valga la pena buscar si uno está interesado en el campo?

¿Cómo se construye un SO por primera vez?

MySQL ¿La normalización de una base de datos reduce su velocidad o la aumenta y puede normalizarse en exceso?

¿Por qué necesitamos comunicaciones entre procesos?

¿Existen universidades / colegios en la India que sean buenos para obtener una maestría en aprendizaje automático?

¿Qué es un DEBE tener habilidades para un desarrollador de aprendizaje automático?

Cómo aprender a hablar y entender inglés con fluidez para obtener un título en Informática

¿Cuáles son algunos problemas de física interesantes sin resolver que están directamente relacionados con otros campos científicos?

¿Son los sistemas basados en Fedora más para supercomputadoras y los sistemas Debian / Ubuntu más para computadoras más pequeñas?

Web Analytics