¿Cuáles son algunos de los desafíos que enfrentan las personas cuando pasan de la academia a la ciencia de datos?

Las dos diferencias más inmediatas entre la academia y la industria para mí fueron:

  • Otras personas ahora están mirando y usando mi código. En los 14 meses desde que comencé mi posición actual, mi estilo de codificación ha cambiado drásticamente para acomodar la colaboración en el código mismo. No ingresé a Data Science desde la ruta típica de Computer Science, así que codifique ya que el producto en sí ha sido nuevo para mí. Antes era simplemente una herramienta para obtener información sobre dónde los resultados y no el código eran el producto. En consecuencia, me he convertido en un programador mucho más fuerte.
  • La compensación entre precisión y tiempo. Saber cuándo es lo suficientemente bueno es esencial en un entorno empresarial donde las respuestas buenas y rápidas son más útiles que las precisas y lentas. Con poca frecuencia tiene el tipo de tiempo que tendría en la academia para ajustar con precisión un modelo para exprimir algunos puntos porcentuales adicionales de precisión.

Anecdóticamente (o quizás más exactamente, estereotípicamente) los científicos de datos de la academia están demasiado preocupados con la optimización de algoritmos y procesos hasta un punto en el que el valor comercial de gastar ese tiempo y esfuerzo no está del todo allí.

El desafío puede ser aplicar el principio de Pareto (la regla 80-20) a proyectos de ciencia de datos en el lugar de trabajo. Dependiendo de la situación, pasar un día optimizando un producto de datos para obtener un ligero aumento en la precisión puede no valer la pena.

Nuevamente, esto es solo un estereotipo pero un problema comercial real: vea esta publicación de blog de HBR.

More Interesting

¿Cuál es un buen flujo de trabajo de Git para un equipo de análisis o ciencia de datos?

¿Quién es el mejor blogger a seguir para las noticias de análisis de datos?

¿Cuál es el mejor para un científico de datos / curso analítico y certificaciones, Coursera o Udemy?

¿En qué se diferencia el algoritmo vecino k-más cercano de la agrupación k-means?

¿Puedes citar un ejemplo de ley escrita usando Big Data?

¿Qué campo prefiere si reinicia su carrera ahora, Machine Learning, Data Science, Quant?

¿Cuál es la diferencia entre la ciencia neuronal, el aprendizaje automático y la minería de datos?

¿Cuáles son algunas cosas interesantes que ha publicado el equipo de ciencia de datos de LinkedIn?

¿Cómo se puede pasar de la función de consultor de un MBB a la función de ciencias de datos?

¿Cuál es el mejor marco de Python para el procesamiento en paralelo (procesamiento SMP y de clúster)?

¿Cuáles son algunas aplicaciones de análisis de datos que pocas personas conocen?

¿Qué dicen los grandes datos sobre el ajedrez? ¿Hay algún algoritmo numérico simple para evaluar las posiciones de ajedrez que no impliquen calcular árboles de posición? ¿Tienen éxito al predecir los resultados de los juegos de ajedrez entre jugadores de habilidades similares?

¿Qué tan efectivos son los cursos en línea para aprender ciencia de datos?

¿Cómo deberían funcionar mejor la ciencia y la ingeniería de datos?

¿Cuáles son las mejores herramientas utilizadas para el modelado de datos?