¿Cuáles son las mejores herramientas de software para trabajar con grandes conjuntos de datos financieros (> 50 gb), por ejemplo, datos de acciones de CRSP?

Supongo que desea una aplicación de software con todas las funciones (es decir, no desea programar los algoritmos de análisis usted mismo, simplemente aplíquelos a sus datos).

SAS
http://support.sas.com/kb/8/213….

Editar para responder la pregunta de seguimiento:
Python de 64 bits con Pandas (+ cualquier otro paquete que necesite para el análisis: NumPy, SciPy, scikit-learn, Matplotlib; generalmente puede encontrar un paquete para hacer cualquier análisis que necesite hacer).
Consulte esta pregunta sobre Desbordamiento de pila para obtener algunos consejos sobre cómo cargar grandes marcos de datos con Pandas:
El trabajo de “datos grandes” fluye utilizando pandas
Y el paquete prometedor es Blaze, que extiende la usabilidad de NumPy y Pandas a soporte fuera de núcleo y procesamiento paralelo:
Core – documentación de Blaze 0.7.0
Está en desarrollo, pero tal vez tenga suficiente para lo que necesita.

Hay muchos editores de GUI diferentes para Python. A mucha gente le gusta IPython. Prefiero PyCharm. Hay muchos otros (algunos son muy hábiles, como Light Table).

Si tus cálculos no son demasiado complejos y eres aventurero, Julia es muy divertida. El lenguaje Julia Está realmente en desarrollo, pero promete una paralelización más fácil y una mayor velocidad. Si sus cálculos no son demasiado complejos, esto podría ser un ganador.