¿Cuáles son algunos de los desafíos que enfrentan las personas cuando pasan de la academia a la ciencia de datos?

Las dos diferencias más inmediatas entre la academia y la industria para mí fueron:

Otras personas ahora están mirando y usando mi código. En los 14 meses desde que comencé mi posición actual, mi estilo de codificación ha cambiado drásticamente para acomodar la colaboración en el código mismo. No ingresé a Data Science desde la ruta típica de Computer Science, así que codifique ya que el producto en sí ha sido nuevo para mí. Antes era simplemente una herramienta para obtener información sobre dónde los resultados y no el código eran el producto. En consecuencia, me he convertido en un programador mucho más fuerte.
La compensación entre precisión y tiempo. Saber cuándo es lo suficientemente bueno es esencial en un entorno empresarial donde las respuestas buenas y rápidas son más útiles que las precisas y lentas. Con poca frecuencia tiene el tipo de tiempo que tendría en la academia para ajustar con precisión un modelo para exprimir algunos puntos porcentuales adicionales de precisión.

AcademiaBig DataCiencia de datosdesafíosOrientación profesionalTransiciones profesionales

¿Cómo se puede detener la esclavitud india de TI?

Siendo un experto en ciencia de datos, ¿es necesario implementar todo desde cero?

¿Cuáles son las principales demostraciones de big data?

¿Por qué la clasificación funciona mejor para predecir conjuntos de datos con categorías nominales o binarias que los conjuntos de datos con categorías ordinales (como las clases de ingresos)?

Cómo enviar datos a otra computadora en una red diferente

¿Qué tipo de métodos de ciencia de datos se pueden aplicar a los datos de tráfico web?

Anecdóticamente (o quizás más exactamente, estereotípicamente) los científicos de datos de la academia están demasiado preocupados con la optimización de algoritmos y procesos hasta un punto en el que el valor comercial de gastar ese tiempo y esfuerzo no está del todo allí.

El desafío puede ser aplicar el principio de Pareto (la regla 80-20) a proyectos de ciencia de datos en el lugar de trabajo. Dependiendo de la situación, pasar un día optimizando un producto de datos para obtener un ligero aumento en la precisión puede no valer la pena.

Nuevamente, esto es solo un estereotipo pero un problema comercial real: vea esta publicación de blog de HBR.

Christie Haskell

More Interesting

¿Cuál es un buen flujo de trabajo de Git para un equipo de análisis o ciencia de datos?

¿Quién es el mejor blogger a seguir para las noticias de análisis de datos?

¿Cuál es el mejor para un científico de datos / curso analítico y certificaciones, Coursera o Udemy?

¿En qué se diferencia el algoritmo vecino k-más cercano de la agrupación k-means?

¿Puedes citar un ejemplo de ley escrita usando Big Data?

¿Qué campo prefiere si reinicia su carrera ahora, Machine Learning, Data Science, Quant?

¿Cuál es la diferencia entre la ciencia neuronal, el aprendizaje automático y la minería de datos?

¿Cuáles son algunas cosas interesantes que ha publicado el equipo de ciencia de datos de LinkedIn?

¿Cómo se puede pasar de la función de consultor de un MBB a la función de ciencias de datos?