R y Python son de hecho las mejores opciones para la ciencia de datos. Sin embargo, una palabra de precaución. Elija uno u otro según su situación y no según la opinión de los demás. La gente tiende a tener fuertes opiniones sobre los lenguajes de programación. Es posible que esté recibiendo un consejo bien intencionado que puede no ser el mejor en su situación particular.
Aquí hay un resumen rápido de por qué elegiría uno u otro.
¿Por qué R?
R se ha utilizado para la informática estadística durante más de dos décadas. Puede comenzar a escribir código útil en poco tiempo. Ha sido utilizado ampliamente por los científicos de datos y tiene una cantidad increíble de paquetes disponibles para muchas tareas relacionadas con la ciencia de datos. Casi siempre he podido encontrar un paquete en R para realizar la tarea muy rápidamente. Tengo buenas habilidades en python y he escrito código de producción en python. Incluso con eso, encuentro que R es un poco mejor para probar ideas rápidamente, probar diferentes formas de visualizar datos y realizar rápidamente trabajos de creación de prototipos.
- ¿Cuál es una buena herramienta GUI para PostgreSQL que tiene una vista con pestañas cómoda para resultados y consultas, fácil clasificación y agrupación de resultados, IntelliSense, un buen "generador de consultas" para ayudar con la sintaxis, soporte para el control de versiones del código SQL y una buena depuración ¿modo?
- Quería obtener el certificado de ciencia de datos de Harvard. ¿Las materias enseñadas en este curso de certificación sientan una base sólida requerida para cambiar de carrera a la corriente de la ciencia de datos?
- Cómo prepararse para una entrevista de ciencia de datos o aprendizaje automático en una gran empresa tecnológica
- Cómo aplicar la minería de reglas de asociación en datos textuales usando Python
- ¿Cómo explicaría la respuesta a esta pregunta de matemáticas a alguien con poco conocimiento de las matemáticas?
Por que Python
Python tiene muchas ventajas sobre R en ciertas situaciones. Python es un lenguaje de programación de propósito general. Python tiene bibliotecas como pandas, numpy, scipy y scikit-learn, por nombrar algunas que pueden ser útiles para realizar trabajos relacionados con la ciencia de datos.
Si llega a señalar dónde tiene que mostrar su trabajo de ciencia de datos, Python una vez sería un claro ganador. Python combinado con django es un marco de aplicación web increíble, que puede ayudarlo a crear un servicio / sitio web con su ciencia de datos y programación web realizada en el mismo idioma.
Es posible que escuche algunos argumentos de velocidad y eficiencia de ambos campos: ignórelos por ahora. Si llega a un punto en el que está haciendo algo lo suficientemente sustancial como para que la velocidad de su código sea importante para usted, probablemente descubrirá las cosas por su cuenta. Así que no te preocupes por eso en este momento.
Conclusión
Teniendo en cuenta que eres un principiante tanto en ciencia de datos como en programación, y que tienes experiencia en economía y estadística, me inclinaría por R. Además de ser muy poderoso, Python es sin duda uno de los lenguajes de programación más amigables para principiantes: pero sigue siendo un lenguaje de programación. Su curva de aprendizaje puede ser un poco más pronunciada en Python que en R.
Definitivamente, debe aprender Python, una vez que se sienta cómodo con R, y haya comprendido los conceptos generales de la ciencia de datos, lo que llevará algún tiempo. Puedes leer ¿Cuáles son las habilidades clave de un científico de datos? para tener una idea del conjunto de habilidades necesitarás convertirte en un científico de datos.
Comience con R, haga la transición a Python gradualmente y luego comience a usar ambos según sea necesario. Ambos son excelentes para la ciencia de datos, pero uno es mejor que otro en ciertas situaciones.