La conferencia Strata de O’Reilly es un buen lugar para escuchar lo que las compañías web y los equipos alpha geek de los minoristas están haciendo con grandes datos a través de la computación distribuida, incluidos los estudios de casos. No ha mencionado el software, esa conferencia se centra en las tendencias emergentes de software de computación distribuida de código abierto: Acerca de – Strata + Hadoop World en San José 2015. Varias conferencias de Strata se llevan a cabo anualmente en diferentes partes del mundo.
El AMPlab en UC Berkeley es una colmena de innovación y actividad de big data, y una serie de personas de UCB presentes en Strata. También gente de Databricks, una startup fundada por gente de UCB, presente allí: AMPLab – UC Berkeley Acerca de nosotros – Databricks
Hay un montón de videos en YouTube sobre estas cosas. Echa un vistazo a este de Paco Nathan, quien también presenta en Strata, “solo las matemáticas suficientes”, para una introducción rápida al contenido que O’Reilly produce que está relacionado con la ciencia de datos para profesionales de negocios:
- ¿Qué cursos PG de tiempo completo o parcial en Big Data recomendarías?
- ¿Por qué se prefiere Mechanical Turk sobre Crowdflower para obtener datos etiquetados para Machine Learning?
- ¿Cuál es la mejor manera de aprender ciencia de datos sin ir a una institución?
- ¿Qué cursos o certificados puedo seguir para prepararme para trabajar en el análisis de datos?
- ¿Qué tan comunes son los trabajos de 40 horas / semana de científicos de datos en Google, Microsoft, Facebook y Amazon?
Recomiendo seguir a personas como Nathan en las redes sociales. Hablan mucho y puedes conocer a otros en los eventos en los que hablan que están interesados en las mismas cosas que tú.