Depende de lo que quiere decir con “científico de datos”, principalmente. En general, R es el mejor para el análisis estadístico convencional en datos pequeños y medianos. Su biblioteca de paquetes no tiene paralelo, y está diseñada específicamente para análisis exploratorios.
Python es un lenguaje de programación más general y, por lo tanto, le permite realizar una mayor transformación de los datos e integrarse con otros sistemas de software más fácilmente en el mismo programa. Es menos especializado para análisis, pero su biblioteca de software es más amplia y general.
Realmente, el lenguaje en sí no es el factor principal. No creo que nadie piense que R es un buen lenguaje; Es legado. Pero funciona lo suficientemente bien como para admitir el uso de sus excelentes paquetes.
- Ciencias de datos o nube, ¿cuál es mejor?
- ¿Hasta qué punto son aplicables las leyes de privacidad de la UE, por ejemplo, el derecho al olvido, a las empresas que dependen de modelos personalizados de aprendizaje automático?
- ¿Cuáles son algunas ideas o proyectos en Machine Learning o análisis de big data en un hackathon?
- ¿Por qué son útiles los modelos generativos profundos?
- ¿Es la ciencia de datos y big data la próxima gran novedad en tecnología?
Python también en mi humilde opinión no es un buen lenguaje per se. Ha sido diseñado y conformado para una escala más pequeña, desarrollo rápido de software similar a un script. Tiene dificultades en comparación con Scala + JVM y su conjunto de herramientas para la implementación de software a gran escala. Pero, la ciencia de datos se trata principalmente de hacer programas cortos tipo script. Entonces, esto no es simplemente un problema, si no una fortaleza, para Python.
Pitón.