¿Cuáles son los documentos más influyentes en el mundo del big data? ¿Por qué?

Vea mi lista aquí: http://blogs.msdn.com/b/newtech/…

  1. Nos enfrentamos a un problema de gestión de datos: IDC 2010 Digital Unverse Study. http: //gigaom.files.wordpress.co…
  2. Primera referencia a “Big Data” que encontré en la web, en Nature 4553. http://www.nature.com/nature/jou…
  3. En 2008, se describe la “Programación paralela en la era de los grandes datos”. MapReduce como un marco que ganó protagonismo en grandes sitios web. http://gigaom.com/2008/11/09/map…
  4. “Las patologías de los grandes datos” de Jacob Adams explicaron claramente las limitaciones del modelo de base de datos relacional. http://queue.acm.org/detail.cfm?…
  5. Una introducción y una descripción general de las “bases de datos NoSQL” de Christof Strauch. http://www.christof-strauch.de/n…
  6. Mi documento favorito a partir de mayo de 2011 es el Dr. Raplh Kimball “El papel evolutivo de EDW en la era de Big Data Analytics”. http://www.kimballgroup.com/html…
  7. “Un modelo de datos correlacional para grandes bancos de memoria compartida” propone un lenguaje de consulta común para acceder a datos relacionales o no estructurados. http://queue.acm.org/detail.cfm?…
  8. McKinsey “Big Data: la próxima frontera para la innovación, la competencia y la productividad” se centra en la transformación económica. http://www.mckinsey.com/mgi/publ…
  9. “La promesa y el peligro de Big Data” por el Instituto Aspen. http://www.aspeninstitute.org/pu…
  10. La “Vista previa de Big Data 2011” de GigaOM habla sobre las oportunidades para nuevos modelos de negocios. Http://pro.gigaom.com/2011/01/bi…
  11. “Hadoop y MapReduce: Big Data Analytics” ofrece sugerencias sobre la adopción de implementaciones comerciales de Hadoop. http://www.burtongroup.com/Clien…
  12. “Aprovechar el poder de Big Data” de PricewaterhouseCoopers consiste en revisar el playbok de datos del CIO. http://www.pwc.com/us/en/technol…
  13. “Introducción de LINQ a HPC” por David Chappell describe el enfoque interno de Microsoft para procesar datos no estructurados con Windows HPC. http://www.microsoft.com/downloa…
  14. “Definición de Hadoop: jugadores, tecnologías y desafíos” cubre el ecosistema y los casos de uso de Hadoop. http://pro.gigaom.com/2010/02/wh…
  15. “La era de Exabytes: herramientas y enfoques para administrar Big Data” en ReadWriteWeb. http://rww.to/BigData15
  16. Seis pautas para implementar Big Data Analytics, “Informe de lista de verificación de TDWI: Big Data Analytics. http://tdwi.org/research/2009/05…

Actualización de junio de 2013: consulte el escepticismo de “Big Data” y 9 artículos #bigData que debe leer

Aquí hay algunos importantes de la industria:

Dinamo:
http://s3.amazonaws.com/AllThing

Mesa grande:
http://research.google.com/archi

Mapa reducido:
http://research.google.com/archi

GFS:
http://research.google.com/archi

Llave:
http://research.google.com/archi

Percolador:
Procesamiento incremental a gran escala mediante transacciones distribuidas y notificaciones

Consulte ¿Qué documentos han demostrado que para el aprendizaje automático, el tamaño del conjunto de datos es más importante que el modelo que se está capacitando?