Cómo aprender ciencia de datos y análisis desde un punto de vista de gestión

La conferencia Strata de O’Reilly es un buen lugar para escuchar lo que las compañías web y los equipos alpha geek de los minoristas están haciendo con grandes datos a través de la computación distribuida, incluidos los estudios de casos. No ha mencionado el software, esa conferencia se centra en las tendencias emergentes de software de computación distribuida de código abierto: Acerca de – Strata + Hadoop World en San José 2015. Varias conferencias de Strata se llevan a cabo anualmente en diferentes partes del mundo.

El AMPlab en UC Berkeley es una colmena de innovación y actividad de big data, y una serie de personas de UCB presentes en Strata. También gente de Databricks, una startup fundada por gente de UCB, presente allí: AMPLab – UC Berkeley Acerca de nosotros – Databricks

Hay un montón de videos en YouTube sobre estas cosas. Echa un vistazo a este de Paco Nathan, quien también presenta en Strata, “solo las matemáticas suficientes”, para una introducción rápida al contenido que O’Reilly produce que está relacionado con la ciencia de datos para profesionales de negocios:

Recomiendo seguir a personas como Nathan en las redes sociales. Hablan mucho y puedes conocer a otros en los eventos en los que hablan que están interesados ​​en las mismas cosas que tú.

Hay muchos cursos (MOOC o tradicionales) disponibles en todo el mundo, pero muchos olvidan que un Data Scientist debe ser bueno en CS / IT y ciencias duras, pero también en aplicaciones comerciales y ética y derecho. Esto último se olvida con demasiada frecuencia en los planes de estudio, pero es un desafío enorme.

Visítenos en el Data ScienceTech Institute, con nuestros programas de maestría más intensivos de 1,600 horas, en asociación con personas como SAS France y KDnuggets (Gregory I. Piatetsky-Shapiro)
Y debido a que nos preocupamos por la RSE, también ofrecemos una variedad de becas, que cubren del 50 al 100% de las tasas de matrícula. 😉

No hay que escapar de las estadísticas y la informática si quieres entender la ciencia de datos. Lo mejor que puede hacer es evitar las pruebas matemáticas, pero todo esto es abstracto.

Parece que quiere “ciencia de datos para gerentes”, y nunca he oído hablar de algo así. Hay cursos de posgrado con ese énfasis, pero no tengo idea de cómo lo abordan o si son efectivos / aplicables.

Dicho esto, los siguientes MOOC de curso deberían ser útiles:

“Análisis de datos e inferencia estadística”, que cubre los fundamentos de las estadísticas de las que simplemente no puede escapar si quiere comprender cualquier tipo de debate sobre ciencia de datos. La matemática que necesita es muy básica y tiene un enfoque muy práctico.

La “Introducción a la ciencia de datos” cubre muchos temas brevemente, y debería servirle muy bien para desarrollar vocabulario e inducir nociones básicas.

La serie de MOOC de Jons Hopkins debería ofrecer valor. No los he tomado todos, pero para un gerente, recomendaría echar un vistazo a “Aprendizaje práctico de la máquina”, “La caja de herramientas del científico de datos”, “Investigación reproducible”, “Análisis de datos”, “Modelos de regresión” y “Inferencia estadística”.