¿Cómo obtengo un trabajo de análisis orientado a datos en LinkedIn u otra empresa enfocada en análisis sin muchos antecedentes en matemáticas, estadísticas o disputas de datos?

El equipo de SNA tiene varios lados: productos de datos, implementación de algoritmos (búsqueda / IR, aprendizaje automático), infraestructura de datos y finalmente ciencia de datos. Por supuesto, estas no son categorías estrictas (hay una gran superposición), pero no necesita una estadística o antecedentes de aprendizaje automático para trabajar en infraestructura de datos o productos: solo necesita ser un gran programador con pasión y fortaleza en ya sea infraestructura o desarrollo de productos. Yo, por ejemplo, tampoco tengo antecedentes en estadísticas. Damos la bienvenida a los generalistas.

Independientemente de lo que termine haciendo, tendrá muchas posibilidades de interactuar con personas que trabajan en otros roles. Como ejemplo, Alejandro Crosa, que está “oficialmente” en el paquete de productos, contribuyó con un cliente Ruby para Voldemort (una pieza de infraestructura). Otros (tanto como parte de su trabajo y como proyectos del día del pirateo) con frecuencia escriben trabajos de Hadoop junto con sus homólogos científicos de datos.

Hay cursos disponibles en minería de datos en Stanford a través del SCPD (convenientemente, algunos de mis compañeros de equipo tienen TAd esos cursos) y en lugares como Hacker Dojo. Terminé mi maestría (aunque en ingeniería informática con un enfoque en sistemas y redes) a tiempo parcial mientras trabajaba a tiempo completo en LinkedIn (y antes de LinkedIn, otras compañías): es un desafío, pero la escuela de posgrado y el trabajo no son mutuamente excluyentes.

(tl; dr Envíame tu currículum. No solo contratamos especialistas, también contratamos generalistas: tanto nuevos graduados como pasantes – )

Finalmente, y aquí estoy hablando puramente como yo, sin tapar descaradamente a mi equipo, la mejor credencial para hacer algo que no has hecho antes es hacerlo. Elija un conjunto de datos públicos, haga algo interesante con él (recoja las habilidades que faltan a medida que avanza): vea la respuesta de Michael E Driscoll en ¿Cuáles son algunos buenos programas de verano para estudiantes de doctorado interesados ​​en ciencia de datos? No necesita el permiso de nadie para hacer ciencia de datos por su cuenta.

Hay una contradicción inherente en esta pregunta: ¿por qué quieres un trabajo en análisis si no sabes nada al respecto? O para reformular la misma pregunta, si es algo en lo que estás tan interesado que quieres construir una carrera, ¿por qué no has aprendido nada al respecto ahora?

Es fácil tener acceso a los datos, y hay muchas herramientas que puede usar para aprender algo interesante rápidamente. Un currículum que viene con un “Creo que esto es lo que quiero hacer y estos son los proyectos en los que he estado trabajando en mi propio tiempo” es mucho más convincente que uno que llega con “Creo que quiero hacer esto para mi trabajo a tiempo completo, pero no he podido obtener ninguna experiencia con él “.

Todos comienzan en alguna parte. Nada enseña como la experiencia práctica.

No todos los trabajos en analítica / ingeniería de datos requieren un doctorado en estadística. Contratamos personas que son buenas en algo y luego encontramos la forma de usarlo. “Algo” con frecuencia incluye uno o más de: estadísticas, aprendizaje automático, sistemas distribuidos, concurrencia, componentes internos de JVM, componentes internos de la base de datos, código de escritura y envío que funciona, y que demuestra la capacidad de programación general combinada con la voluntad de aprender.

Una “sensación” de los números ayuda, seguro. Si desea prepararse, repase sus algoritmos y busque distribuciones normales frente a la ley de poder y dónde ocurren. Luego, piense en lo que eso significa para problemas como el almacenamiento en caché, el particionamiento de datos y las mediciones estadísticas básicas, como las medias y las desviaciones estándar.

Envíame un currículum (mi nombre en twitter dot com).

-Dmitriy