¿Qué busca Quora en sus pasantes de Data Science?

En general, los científicos de datos deberían ser los siguientes para ser contratados.

Esto no es solo para quora sino para todas las empresas.

¡Un científico de datos debería ser un buen programador!


Según la definición, los científicos de datos trabajan con datos. Esto implica muchas actividades, como el muestreo y el preprocesamiento de datos, la estimación del modelo y el posprocesamiento (por ejemplo, análisis de sensibilidad, despliegue del modelo, prueba posterior, validación del modelo). Aunque muchas herramientas de software fáciles de usar están en el mercado hoy en día para automatizar esto, cada ejercicio analítico requiere pasos personalizados para abordar las especificidades de un problema comercial en particular. Para realizar con éxito estos pasos, la programación debe hacerse. Por lo tanto, un buen científico de datos debe poseer habilidades de programación sólidas, por ejemplo, R, Python, SAS … El lenguaje de programación en sí no es tan importante como tal, siempre y cuando esté familiarizado con los conceptos básicos de programación y sepa cómo usarlos. para automatizar tareas repetitivas o realizar rutinas específicas.

¡Un científico de datos debe tener habilidades cuantitativas sólidas!


Obviamente, un científico de datos debe tener una amplia experiencia en estadísticas, aprendizaje automático y / o minería de datos. La distinción entre estas diversas disciplinas se está volviendo cada vez más borrosa y en realidad no es tan relevante. Todos proporcionan un conjunto de técnicas cuantitativas para analizar datos y encontrar patrones relevantes para el negocio dentro de un contexto particular (por ejemplo, gestión de riesgos, detección de fraudes, análisis de marketing …). El científico de datos debe saber qué técnica se puede aplicar cuándo y cómo. Él / ella no debe enfocarse demasiado en los detalles matemáticos subyacentes (por ejemplo, optimización), sino que debe comprender bien qué problema analítico resuelve una técnica y cómo deben interpretarse sus resultados. En este sentido, la capacitación de ingenieros en ciencias de la computación e ingeniería empresarial / industrial debe apuntar a una visión integrada y multidisciplinaria, con graduados recientes formados tanto en el uso de las técnicas como en la perspicacia comercial necesaria para llevar a buen término nuevos esfuerzos.

También es importante en este contexto pasar suficiente tiempo validando los resultados analíticos obtenidos para evitar situaciones a menudo denominadas masaje de datos y / o tortura de datos por los cuales los datos se tergiversan (intencionalmente) y / o se dedica demasiado tiempo a discutir correlaciones espurias. Al seleccionar la técnica cuantitativa óptima, el científico de datos debe tener en cuenta las especificidades del problema empresarial. Los requisitos típicos para los modelos analíticos son: capacidad de acción (¿en qué medida el modelo analítico está resolviendo el problema comercial?), Desempeño (¿cuál es el desempeño estadístico del modelo analítico?), Capacidad de interpretación (¿se puede explicar fácilmente el modelo analítico? para los tomadores de decisiones?), eficiencia operativa (¿cuánto esfuerzo se necesita para configurar, evaluar y monitorear el modelo analítico?), cumplimiento normativo (¿está el modelo en línea con la regulación?) y costo económico (¿cuál es el costo de la instalación, ejecutando y manteniendo el modelo?). Sobre la base de una combinación de estos requisitos, el científico de datos debe ser capaz de seleccionar la mejor técnica analítica para resolver el problema comercial.

¡Un científico de datos debe sobresalir en habilidades de comunicación y visualización!

Nos guste o no, pero la analítica es un ejercicio técnico. En este momento, existe una gran brecha entre los modelos analíticos y los usuarios comerciales. Para cerrar esta brecha, la comunicación y

¡Las instalaciones de visualización son clave! Por lo tanto, un científico de datos debe saber cómo representar modelos analíticos y sus estadísticas e informes que lo acompañan de manera fácil de usar, por ejemplo, utilizando enfoques de semáforos, instalaciones OLAP (procesamiento analítico en línea), reglas de negocio si … entonces … ser capaz de comunicar la cantidad correcta de información sin perderse en detalles complejos (por ejemplo, estadísticos) que inhibirán el despliegue exitoso de un modelo. Al hacerlo, los usuarios comerciales comprenderán mejor las características y el comportamiento de sus datos (grandes), lo que mejorará su actitud y aceptación de los modelos analíticos resultantes. Las instituciones educativas deben aprender a equilibrar, ya que se sabe que muchos títulos académicos preparan a los estudiantes que están sesgados a tener demasiado conocimiento analítico o demasiado práctico.

¡Un científico de datos debe tener una sólida comprensión empresarial!


Si bien esto puede ser obvio, hemos sido testigos (también) de muchos proyectos de ciencia de datos que fallaron ya que el analista respectivo no entendió el problema comercial en cuestión. Por “negocio” nos referimos al área de aplicación respectiva, que podría ser, por ejemplo, predicción de abandono o calificación crediticia en un contexto comercial real o astronomía o medicina si los datos respectivos a analizar provienen de dichas áreas.

¡Un científico de datos debe ser creativo!


Un científico de datos necesita creatividad en al menos dos niveles. Primero, a nivel técnico, es importante ser creativo con respecto a la selección de características, la transformación de datos y la limpieza. Estos pasos del proceso de descubrimiento de conocimiento estándar tienen que adaptarse a cada aplicación en particular y, a menudo, la “suposición correcta” podría marcar una gran diferencia. En segundo lugar, el big data y el análisis es un campo en rápida evolución. Nuevos problemas, tecnologías y desafíos correspondientes aparecen de manera continua. Es importante que un científico de datos se mantenga al día con estas nuevas tecnologías y tenga suficiente creatividad para ver cómo pueden crear nuevas oportunidades de negocio.

Conclusión:

Hemos proporcionado una breve descripción de las características que se deben buscar al contratar científicos de datos. Para resumir, dada la naturaleza multidisciplinaria de big data y análisis, un científico de datos debe poseer una combinación de habilidades: programación, modelado cuantitativo, comunicación y visualización, comprensión empresarial y creatividad. La siguiente figura muestra cómo representar dicho perfil.

Fuente-http: //www.kdnuggets.com/2014/09/hiring-data-scientist-what-to-look-for.html

De la descripción de la pasantía en https://www.quora.com/careers/da …, las cosas que buscamos incluyen:

  • Buscando un BS, MS o Ph.D. en un campo científico o cuantitativo
  • Excelente intuición estadística y conocimiento de varios enfoques analíticos.
  • Curiosidad y pasión por Quora.
  • Excelentes habilidades de comunicación y capacidad para explicar su análisis claramente
  • Competencia en SQL
  • Familiaridad con Python o lenguaje de script similar
  • Pasión por aprender y mejorar siempre a ti mismo y al equipo que te rodea.

Estas respuestas no son específicamente sobre la pasantía en ciencia de datos, pero siguen siendo relevantes.

  • La respuesta de Yair Livne a ¿Qué habilidades necesito para ser un científico de datos en Quora?
  • La respuesta de Sarah Smith a ¿Cómo puedo convencer al equipo de reclutamiento de Quora de que soy un buen candidato para ingeniero de software – pasante? (¡tenga en cuenta que los desafíos se aplican también a los científicos de datos!)