Respuesta corta: PostgreSQL es la segunda mejor base de datos para cualquier cosa (¿PostgreSQL es lo suficientemente bueno?). Esto también se aplica aquí.
Respuesta larga: depende de lo que haya en sus datos (imágenes, texto, series de tiempo, datos de marketing, …) y cuán grande sea (principalmente si cabe en una máquina o no). También depende de cuál es la fuente de sus datos y qué desea hacer con ellos.
Por ejemplo, si solo desea descargar el conjunto de datos de ImageNet y entrenar alguna red además de eso, no tiene sentido utilizar ninguna base de datos. Simplemente almacena sus datos en el disco.
- ¿Cuál es la base para comenzar la IA y el aprendizaje automático?
- ¿Son obligatorios los campos de marca en los datos publicitarios de BLE?
- Soy un graduado de secundaria. Quiero completar una licenciatura en informática desde mi casa en un año o año y medio a un costo muy bajo (gratis si es posible). ¿Qué tengo que hacer?
- ¿Cómo explicará 'Compresión de datos' a un laico?
- ¿Quién tiene más probabilidades de resolver el problema P vs NP, un humano o una IA?
A veces, también desea realizar algunos análisis exploratorios de datos. Entonces realmente depende del tipo de datos. ¿Es mucho texto? Utiliza Elasticsearch. ¿Son muchas columnas con características categóricas / numéricas? Quizás use alguna base de datos SQL. ¿Es súper grande y no estructurado / semiestructurado? Busque alguna base de datos NoSQL como HBase / Cassandra.
Y a veces sus datos ya están en alguna base de datos (como datos sobre compras en tiendas electrónicas). Puede tener sentido usar directamente esa base de datos como fuente en lugar de construir y mantener otra base de datos. Pero tenga cuidado y no sobrescriba nada allí.
Y finalmente, por lo general, no desea almacenar su modelo en la base de datos, sino en otro lugar, porque generalmente es solo un archivo grande, que carga en su aplicación de producción / microservicio.