¿Qué lenguaje de programación de tipo estático proporciona un entorno fuertemente integrado para la ciencia de datos?

Sí, ahora mismo es más o menos Scala. Las razones principales para esto son dos veces.

Primero, Scala se ha posicionado como el lenguaje de primera clase para entornos como hadoop y spark. Esas comunidades están creciendo y construyendo herramientas que crean un ambiente rico. Puede llamar al extenso ecosistema de las bibliotecas de Java, y luce un REPL para la exploración. Para colmo, el sistema de tipos minimiza la sobrecarga de usarlo con uno de los mejores sistemas de inferencia.

El segundo es que la escritura estática no es popular en esas comunidades. Si está tratando de resolver un problema, solo desea escribir un pequeño código y seguir adelante. Lo último con lo que quieres lidiar son los tipos y el casting. Es por eso que esta comunidad ha construido los entornos en torno a lenguajes de tipo dinámico. Son más productivos en el equivalente de Python o Lua. Scala obtiene un poco de aprobación dada su inferencia de tipos y algunas otras sutilezas.

Yo diría que Scala se ajusta a esa factura.

El lenguaje en sí viene con inferencia de tipos incorporada, pero puede ignorarse por completo si la escritura estática es importante para sus necesidades. Además, Apache Spark viene con una API Scala, por lo que incluso puede comenzar a ejecutar con análisis de datos. Estos son algunos ejemplos de la API de Spark en acción con Scala.

Espero que esto ayude.

Además de Scala ya mencionado, puede echar un vistazo a Haskell o F #.