Depende
R está construido para el análisis de datos. Es muy rico en análisis de datos, munging y visualización. Tiene una gran variedad de paquetes de terceros para muchas cosas en varios dominios.
Python es un lenguaje de programación de propósito general. Se puede utilizar para diversas tareas y una de ellas es la ciencia de datos.
- ¿Qué es mejor para un cambio de carrera para los graduados de matemáticas, ciencias de datos o big data?
- ¿Los gráficos circulares merecen su reputación actual como malas visualizaciones?
- Comparta materiales gratuitos interesantes sobre ciencias de datos / Big Data / Machine Learning aquí?
- ¿Qué es la minería de datos? ¿Cuál es la necesidad de la minería de datos?
- ¿Consejos prácticos para el aprendizaje automático?
Además, varias funcionalidades / paquetes de R fueron portados a Python. Un paquete notable es Python Pandas. Este paquete proporciona muchas utilidades para el análisis de datos. Hay muchos otros paquetes que se portan a Python. Si los paquetes Python disponibles son suficientes para su trabajo, puede elegir Python sobre R. La ventaja es que puede usar Python para muchas otras cosas además de la ciencia de datos.
Si necesita alguna funcionalidad / paquetes de R, entonces debe aprender R. Tenga en cuenta que la comunidad R es mucho más grande que Python en el dominio estadístico.
He visto a muchas personas que terminan aprendiendo ambas.
La regla general es, use R si su trabajo está más orientado a las estadísticas, use Python si su trabajo está más orientado a la programación.
La ciencia de datos en sí es un término muy amplio. Si especifica su dominio y la naturaleza de su trabajo, podría ayudarlo a dar una respuesta más relevante.