¿Qué hace a un buen científico de datos? ¿Cómo superan los principales científicos de datos a otros generalistas (es decir, actuarios de P&C, analistas de negocios) en análisis predictivo?

Un buen científico de datos solo tiene un trabajo: aprovechar los datos para mejorar los resultados comerciales. Para los principales científicos de datos, entonces, no necesariamente necesitan “vencer” a estos otros generalistas porque tienen un conjunto completamente diferente de habilidades.

Por un lado, a menudo son más versátiles para adquirir nuevos tipos de datos, porque conocen SQL y otras tecnologías que les permiten reunir un conjunto de datos más grande. Luego, en lugar de ejecutar análisis con herramientas simples como Excel, aprovechan herramientas altamente adaptables como Python, Stata, R, etc., que les permiten intentar ejecutar varios modelos y análisis diferentes.

Específicamente para el análisis predictivo, el aspecto más importante es adquirir datos, analizarlos y probarlos en datos REALES para ver cómo funcionan. Al igual que la ingeniería de software, si no puede emular cómo podría funcionar en la producción, no hay forma de evaluar el modelo. Un buen científico de datos no solo entrenará modelos predictivos, sino que también los probará en datos reales en vivo y monitoreará su desempeño. Otros generalistas a menudo no tendrán las habilidades para ir de principio a fin desde la recopilación de datos, el análisis hasta las pruebas de producción.

Con herramientas como Jupyter Notebooks y Datmo, eso puede cambiar muy bien, aunque en su mayor parte, los principales científicos de datos se desempeñan mejor que los generalistas debido a sus habilidades en las 3 etapas del proceso.

Para empezar, los científicos de datos no superan a otros generalistas (actuarios, analistas de negocios, …) en análisis predictivo.

En cambio, usan (de alguna manera) diferentes métodos para obtener buenos resultados. Estos resultados pueden superar a los proporcionados por “otros generalistas” (como los llama) en estos casos:

  • Tener acceso a muchos datos que no caben en una sola computadora . En este caso, un científico de datos (bueno) utilizará un clúster informático y podrá ejecutar el modelo. Un actuario, por ejemplo, podría carecer de los conocimientos necesarios para hacer que tal modelo funcione.
  • Pruebe muchos enfoques más ya que carece de especialización. Una vez más, un actuario podría probar modelos actuariales (series de tiempo, modelos de riesgo, etc.), pero un científico de datos probará tantos enfoques como sea posible, los ejecutará en paralelo y elegirá el que ofrezca el mejor resultado.

En otros casos, un científico de datos complementará el trabajo de otros trabajadores especializados. Algunos científicos de datos provienen de diferentes entornos, algunos de ellos son actuarios reentrenados o analistas de negocios.

Finalmente, en algunos casos, el actuario obtendrá un modelo mucho mejor si la muestra de datos es pequeña y el modelo requiere una amplia ingeniería de características (estas son habilidades difíciles de obtener).

Buena suerte.

Un buen científico de datos aprovecha los datos para descubrir ideas que pueden ayudar a una empresa. Usar los métodos correctos basados ​​en los supuestos del algoritmo es clave, y esto viene de conocer las matemáticas detrás de los algoritmos, así como el conocimiento práctico de la computación. A partir de ahí, uno debe interpretar correctamente los resultados y presentar los hallazgos clave a las partes interesadas.

More Interesting

¿Cuáles son algunos de los métodos que hacen los científicos para analizar datos?

¿Qué clases debo tomar en CMU si quiero ser un científico de datos?

¿Existe la posibilidad de que el error de entrenamiento aumente junto con el aumento de la complejidad del modelo?

¿Cuánto importa el tema de tesis doctoral para conseguir un buen trabajo?

¿Por qué hay tantos científicos de datos falsos e ingenieros de aprendizaje automático?

¿Qué son los datos internos?

Para ser un buen analista de negocios, ¿qué tan bueno debería ser en R prog? ¿Están bien los conceptos básicos o debo tener un conocimiento profundo de ellos?

¿Qué instituto es mejor para un curso de ciencia de datos en Hyderabad?

Cómo comenzar con un proyecto relacionado con big data

¿Alguien ha tomado un curso inmersivo de ciencia de datos con la Asamblea General cuando ya había hecho algo lejos de las computadoras? ¿Pudieron encontrar un trabajo?

¿Cuáles son las definiciones de 'experimento, prueba, replicación, repetición, datos, mediciones' en estadística?

¿Cuál es el mejor instituto en Mumbai para hacer ciencia de datos y certificación de big data?

¿Tenemos una estrategia de control de calidad para satisfacer todos los volúmenes, variedad y velocidad en Big Data?

Si tengo datos en forma de curvas (y no puntos de datos), ¿puedo encontrar una curva que se ajuste a estos datos?

¿Cuánto más complejo es el desarrollo de IA en comparación con el desarrollo de aplicaciones móviles sociales?