¿Cuáles son algunos buenos libros que tratan sobre ciencia de datos usando Python? ¿Qué versión de python es más adecuada para ello?

Uso Python 2.7 y la mayoría de los paquetes de Python son compatibles y creo que esta versión es más estable.

Compre Python para el libro de análisis de datos en línea a precios bajos en India, este libro es bueno y le presenta el manejo de pandas de datos, numpy, Scipy, etc.

Creación de sistemas de aprendizaje automático con Python: Willi Richert, Luis Pedro Coelho: 9781782161400: Amazon.com: Books introduce scikit

y hay buenos moocs para aprender

La respuesta de Mahanthesh Hv a ¿Cuáles son algunos buenos MOOC de análisis de datos y también dicen el propósito? Como es para Big Data, Data Mining o Machine Learning

Edición 1: el mismo Python 2.7 funciona bien para

  • apache spark (Apache Spark ™ – Lightning-Fast Cluster Computing y MLlib | Apache Spark)
  • Apache hadoop (¡Bienvenido a Apache ™ Hadoop®!), MRJOB (documentación de mrjob v0.5.0)
  • Incluso para Amazon AWS boto (AWS SDK para Python)