¿Qué conjuntos de habilidades son imprescindibles para un aspirante a científico de datos además de la calificación educativa?

Esta es una gran pregunta: veo las calificaciones educativas como un proxy para las habilidades de señalización, y el pensamiento en torno a la capacitación en ciencia de datos probablemente pueda beneficiarse de un mayor énfasis en las habilidades en lugar de los debates sobre “¿Es el curso A” mejor “que el curso B?”

Recientemente di una charla sobre ‘qué hace que un MVP de Data Science (mínimo profesional viable)’, y mi respuesta fue que las 7 habilidades que necesitan son:

  1. Trabajar con bases de datos : las empresas de un tamaño decente al menos mantendrían sus datos en al menos algunos datos estructurados en una base de datos relacional.
  2. Probabilidad y estadísticas: el modelado de datos y la intuición estadística son imprescindibles si se trata de conjuntos de datos en bruto y granulares y se les pide que los usen para hacer recomendaciones o desarrollar productos.
  3. Exploración de datos y munging: esto rara vez se enseña formalmente, pero es una habilidad de utilidad clave, porque en realidad forma una gran parte del trabajo de ciencia de datos a nivel del suelo. Pocos conjuntos de datos vienen bien empaquetados, como en los tutoriales, a menos que se compren externamente, generalmente a un alto costo.
  4. Programación: … no es un “deber” en algunas compañías donde las herramientas empresariales son obligatorias debido a procesos o regulaciones establecidas. Pero, en general, he encontrado que el costo de algunas herramientas es prohibitivo y la falta de flexibilidad sofocante, por lo que tengo preferencia por los científicos de datos que pueden redactar su ingesta de datos, integración y canalización de modelado por su cuenta. Preferiblemente en herramientas de código abierto. Esta también es una maravillosa habilidad transferible.
  5. Traducción del programa: esta habilidad consiste en mantener una conversación de media hora con alguien sobre un problema comercial y traducirlo en una serie de proyectos discretos de ciencia de datos. Difícil de enseñar, pero crucial. Fuera de los casos de uso comunes en material de marketing de proveedores y conferencias de alto nivel, hay muchos casos de uso menos obvio de ciencia de datos en cualquier empresa y esta habilidad los desbloquea.
  6. Visualización de datos: las habilidades de visualización de datos son importantes porque hay formas de engañar a los lectores a través de visualizaciones deficientes. Y una de las formas de ganar credibilidad cuando se trabaja con nuevos internos o externos es simplemente mostrarles algunas visualizaciones geniales y personalizadas que no pueden hacer por sí mismas. Historia verdadera.
  7. Cuentacuentos: Cliché pero cierto: algunos equipos técnicos fuertes pierden el trabajo ante los equipos más débiles porque el equipo más débil simplemente se comunica mejor. Para las situaciones en las que el valor de un proyecto de ciencia de datos se basa en que el receptor del análisis tome una decisión, el valor de ese proyecto depende de si el equipo de ciencia de datos puede comunicarse de manera simple y convincente para que el receptor actúe. O el análisis se desperdicia.

Para terminar, hay algunas omisiones obvias: el aprendizaje automático no está presente, junto con algunas verticales como la optimización o la econometría. Esto es deliberado.

Los científicos de datos vienen en todas las formas y tamaños, y lo que estoy compartiendo son habilidades básicas, mientras que todas las omisiones son especializaciones . Sí, la mayoría de los científicos de datos vienen con, o adquieren, una especialización.

Pero todos los aspirantes a científicos de datos necesitan la base.

Suponiendo que por calificación educativa te refieres a las habilidades técnicas requeridas para ser un Científico de Datos, siento que las siguientes habilidades blandas son imprescindibles:

  1. La capacidad de formar planes detallados sobre cómo abordar un problema y resolverlo. (Habilidades visionarias) . La mayoría de las veces, dependerá de los científicos de datos pensar y repensar lo que están buscando dado un problema de negocios, y mapear variables relevantes de los datos (lea GB’s a Tb’s) analizando qué ayudará a responder lo que está buscando.
  2. Habilidades de comunicación. Es el Data Scientist quien entiende lo que transmiten esas tramas geek y coloridas, una vez que se realiza el análisis y es el Data Scientist quien necesita poner esto en términos que sean fáciles de entender para las personas de negocios que toman las riendas (tomadores de decisiones) .
  3. Escepticismo (hasta cierto punto). Cuando un científico de datos termina su análisis, debe ser escéptico y hacerse preguntas si lo que entienden del análisis es realmente el mensaje que los datos están tratando de decirles. Esto es esencial porque muchas veces, incluso lo mejor de lo mejor puede ser engañado por los colores en los cuadros y es esencial mirar ese tablero de cuadros y pensar si esto es lo que se requiere y cómo esto puede ayudar a resolver el problema. .

More Interesting

Deep Learning se implementa principalmente en big data. ¿Qué piensa sobre usarlo en datos con muestras limitadas pero de altas dimensiones como fMRI?

Tengo más de 4 años de experiencia en el desarrollo de .net, pero ahora quiero cambiar a Big Data. ¿Dónde puedo aprender big data y obtener trabajo?

¿Qué aspectos del aprendizaje automático teórico y aplicado requieren una formación formal en qué subdisciplinas de las matemáticas y / o estadísticas?

Ciencia de datos: ¿Es cierto que actualmente existe un auge en este dominio y la mayoría de las empresas están buscando científicos de datos?

¿De dónde puedo obtener una lista de compañías que usan Big Data?

¿Quién es el ganador del desafío ImageNet LSVRC-2016? ¿Cuál es su enfoque?

Como licenciado en Ciencias de la Computación, ¿debería seguir un aprendizaje teórico de aprendizaje automático o un aprendizaje de aprendizaje automático aplicado?

¿Alguien ha hecho alguna vez el curso de Sliderule (renombrado como Springboard) en Ciencia de Datos, y si es así, ¿qué le quitó a la experiencia?

¿Cómo se puede usar la ciencia de datos en la aviación?

Estoy trabajando actualmente. Quiero convertirme en un científico de datos. ¿Cuáles fueron los conceptos y tecnologías centrales que necesito aprender?

¿Cómo se puede ser un mejor dueño de mascotas a través de la ciencia de datos?

¿Es la ciencia de datos un tema extremadamente aburrido?

¿Cuáles son las aplicaciones de la ciencia de datos y el aprendizaje automático en las industrias de petróleo y gas?

¿Qué tan bueno es Master en ciencia de datos o analista de datos?

¿Qué tiene de diferente el desarrollo de Big Data en comparación con el desarrollo de Data Warehouse?