¿Un “científico de datos” en un negocio basado en datos realiza esencialmente las mismas funciones que un Wall Street Quant?

Antecedentes: actualmente estoy en un rol de tipo “ciencia de datos” en un inicio web basado en datos. Los datos / análisis son nuestro negocio, y hago un gran análisis de nuestros datos para ayudar a nuestros clientes a encontrar el valor dado sus necesidades comerciales. Anteriormente, era “Wall Street Quant” en una empresa de gestión cuantitativa de activos en Boston (bueno, técnicamente no es Wall Street). Todavía trabajo con este tipo de personas regularmente. Lo que escribo aquí son mis experiencias, y el plural de anécdota no son datos, así que tenga cuidado con el lector. Tenga en cuenta que estas dos compañías también son muy diferentes: una administra miles de millones de dólares de dinero del cliente en el mercado de valores, la otra es una startup de software web empresarial que sirve a varias industrias y desarrolla nuevas tecnologías para llevar al mercado.

En términos generales, diría que los dos roles son bastante similares en los tipos de trabajo que realiza, así como en el tipo de conjunto de habilidades que se necesitan para ser buenos en ellos. Debe tener una sólida comprensión de la tecnología, y debe tener las herramientas que le permitan extraer, alinear y manipular datos en todo tipo de escalas, desde pequeñas a masivas. El conocimiento de las estadísticas y la probabilidad es crítico, y la comprensión de las técnicas de aprendizaje automático, el muestreo y la visualización / resumen de datos es muy útil. En última instancia, ambos roles se tratan de obtener datos para decirle algo interesante. Pueden ser “acciones con estas características que superan al mercado, por lo que invertir en ellas” o pueden ser “las personas con estas características tienden a querer salir con personas con estas características” para usar la analogía OkCupid.

El componente principal que separa a un “científico de datos” generalista de una “cantidad de wall street” es la experiencia en el dominio. Una buena cantidad conoce los mercados por dentro y por fuera, conoce la diferencia entre vol y VaR, y sabe por qué los estándares FASB pueden marcar la diferencia en el mundo de su análisis. Un “científico de datos”, en mi opinión, es alguien que puede acercarse a un espacio problemático aleatorio, conocer los principios subyacentes y los conjuntos de datos disponibles, y llegar a una idea con bastante rapidez. Es posible que no sea tan profundo como las ideas de un cuantificador sobre la naturaleza fluctuante de los diferenciales de oferta / demanda, pero resolverá un problema comercial que antes no tenía solución.

Un problema con la pregunta es que hay diferentes trabajos en Wall Street que llevan el título de “cuant” y “quant” se ha convertido en un término general para muchos trabajos diferentes. Trabajé durante seis años en Wall Street, y hasta el día de hoy, todavía no estoy seguro de si era un cuant o no. Nadie me lo ha dicho nunca.

Hay quants que son esencialmente “fontaneros de código” que no manejan datos sino infraestructura de programas. Hay otros que escriben modelos, pero la cantidad de datos que se ingresan en los modelos puede variar mucho. En algunas áreas (es decir, precios de opciones de capital) existen principios generales del mercado que son en gran medida independientes de los datos, por lo que los quants no manejan mucho en la forma de “big data”. Hay otros trabajos (es decir, algo comercial o valores respaldados por hipotecas) que están fuertemente basados ​​en datos.

Para darle un ejemplo de cómo los diferentes campos pueden ser muy diferentes, podemos ver la diferencia en el precio de un bono exigible y una hipoteca con una opción de reembolso. Al fijar el precio de un bono exigible, realmente no tiene que mirar mucho los datos. Puede suponer que si el titular del bono se beneficia llamando al bono que lo hará, entonces no hay un análisis de datos real.

Aunque las hipotecas tienen la misma opción de prepago, resulta que las personas no pagarán automáticamente su hipoteca, incluso si es rentable hacerlo. Es posible que las personas quieran retener su antigua hipoteca por varias razones (es decir, no pueden obtener refinanciamiento o simplemente no están interesados). Por lo tanto, modelar hipotecas implica una gran cantidad de análisis de datos que no existen con los bonos exigibles.

De acuerdo con Evan: un buen científico de datos (también llamado modelador predictivo o minero de datos) es generalista y combina habilidades analíticas, habilidades de comunicación, ideas de negocios y curiosidad. Los cuantos de Wall Street tienden a trabajar en una gama mucho más estrecha de problemas. Ahora también se supone que los científicos de datos tienen habilidades de Big data, incluidos Hadoop y análisis en la nube.

More Interesting

Quiero aprender por mi cuenta Big data / Hadoop. ¿Cuál debería ser el enfoque más eficiente?

¿Existe un papel significativo para el big data en la economía?

¿Qué opciones de carrera están disponibles en Big Data si uno no tiene un fondo de estadísticas / codificación?

¿Cuáles son algunas aplicaciones donde el análisis de datos topológicos tiene una ventaja sobre otros enfoques de LD?

¿Data Science es el futuro de la programación y la habilidad de aprender de los aspirantes a programadores?

¿Cuáles son algunos de los problemas prácticos con Big Data?

¿Qué empresas están haciendo aprendizaje automático real en lugar de ciencia de datos hacky?

¿Cómo es seguro un hilo de datos en Spring Framework?

¿Existe alguna correspondencia (en línea / visitas cortas al campus) del curso de Ciencia de Datos que ofrecen las Universidades en Europa para los Profesionales que trabajan en India?

Acabo de regresar de Strata 2017 y todas las demás botas mostraban una plataforma de ciencia de datos (es decir, Domino). ¿Cuál es tu plataforma favorita y por qué?

¿Qué papel debería elegir / jugar, si quiero trabajar en Big Data Analytics / Machine Learning?

Soy de una experiencia que no es CS / IT, uniéndome al sector de análisis de datos, aprendiendo R y Python. ¿Es esta la elección correcta? En caso afirmativo, ¿cómo puedo hacerlo?

Cómo dominar el aprendizaje automático en R

¿Debo aprender las estructuras de datos y la informática real o continuar con las aplicaciones de Oracle?

Estoy planeando aprender la herramienta de visualización de datos, ¿cuál debería considerar tableau, Qlik view, Power BI?