¿Por qué proceso decide si usar R o Python (Pandas) para leer y analizar grandes conjuntos de datos con formato CSV?

Suponiendo que ambos pueden hacer lo que se propuso hacer, hay algunas preguntas que hacer:

  • Qué es el ecosistema primario dentro de la organización: implementaciones existentes, familiaridad con el conjunto de herramientas y la mentalidad de los usuarios principales (los estadísticos gravitan hacia R, los desarrolladores, hacia Python). R tiene un enfoque nítido, Python es un lenguaje de propósito general con bibliotecas.
  • ¿Es un esfuerzo independiente (R es más fuerte) o necesita integrarse en un flujo de trabajo (Python es más fuerte)?
  • Velocidad en el procesamiento. R es inherentemente más lento que Python, todas las demás cosas son iguales.
  • Si necesita poner al equipo al día con la tecnología, R tiene una curva de aprendizaje mucho más pronunciada, especialmente para aquellos que no tienen una inclinación estadística.
  • Money – R tiene una prima de aproximadamente 30% sobre Python cuando contrata personal experimentado

Hay pocos más, pero esto es lo que les pido a los clientes / partes interesadas con mayor frecuencia.

Principalmente elijo R porque soy más nativo del idioma y me desplazo fácilmente. La investigación es fácil, estoy acostumbrado a la documentación y su estilo y, en general, me gusta el IDE.

Al mismo tiempo, Python podría ser mejor, pero me resulta difícil encontrar el tiempo y experimentar con Python cuando puedo hacer lo mismo en R en solo unos minutos.

Entonces … elijo R por comodidad. Cuando tenga suficiente confianza con Python, probablemente cambiaré y usaré principalmente Python, PERO quién sabe …