¿Existen extensiones de PostgreSQL relacionadas con la ciencia de datos?

¡Por supuesto! Los dos que me vienen a la mente son:

Madlib: Esta es una extensión que puede instalar pero necesita una instalación de Postgres con soporte de Python. Es una extensión con todas las funciones que puede hacer clasificación, regresión, agrupación, estadísticas descriptivas, y eso es solo por nombrar algunas. Aunque no sé si algunos de los principales proveedores de Postgres como servicio permiten el uso de la extensión en su servicio.

pg_similarity: permite a Postgres ejecutar consultas de similitud. Usaría esta extensión para ver cómo son dos campos de texto entre sí. Tiene bastantes algoritmos integrados.

Dependiendo del tamaño de su conjunto de datos y su flujo de trabajo, estas extensiones pueden ser una gran herramienta en su cinturón de herramientas. Tiendo a hacer un montón de exploración usando estadísticas descriptivas y usaré las funciones en estas extensiones en postgres antes de extraer los datos de la base de datos y usar herramientas como R, Python y Julia.