Python (lenguaje de programación): ¿Qué se puede hacer con Python y simplemente no se puede hacer con R en el dominio de la ciencia de datos?

Los creadores de R querían crear una alternativa SAS de código abierto, y su público objetivo era un estadístico que necesitaba obtener resultados rápidamente, de una manera interactiva ad-hoc.

R fue diseñado para ser un DSL (lenguaje específico de dominio), pero ahora ganó popularidad, y es posible hacer otras cosas además de las estadísticas, por ejemplo, desarrollar servidores web con él.

La verdadera pregunta es “¿Debo usar R para cualquier cosa que no sea estadística?”

Creo que cualquier lenguaje que le permita cambiar los valores de la lógica “Verdadero” y “Falso” no debe usarse en la producción.

T <-0

F <-1

Python, por otro lado, fue diseñado de abajo hacia arriba.

Python es un lenguaje de propósito general, utilizado en servidores web, administración de sistemas, interfaz gráfica de usuario y también estadísticas.

Un científico de datos, por lo general, desarrolla programas que son parte de una tubería, (lectura de X, escritura a Y, registro de errores en Z), y debe estar pensando todo el tiempo sobre el despliegue de su trabajo.

Python hace que la transición al código de producción sea más rápida y fácil.

Mi creencia personal es que si los resultados de su trabajo serán solo una parte de un informe o una presentación, use R, de lo contrario use Python.

Si interpreto su pregunta como “¿Qué es realmente fácil en Python pero realmente difícil en R”, creo que la mayor ventaja de Python es el hecho de que es un lenguaje de programación de propósito general .

  • ¿Quieres publicar el código de puntuación como un servicio web? Aproveche las capacidades del servicio web Pythons.
  • ¿Las simulaciones de Monte Carlo dependen de objetos? Utiliza la estructura orientada a objetos Pythons.
  • ¿Trazar sus datos en un casco de realidad virtual? Python tiene una biblioteca para eso.
  • ¿Se conecta a algún servicio web / base de datos / punto final IoT exótico? Lo más probable es que Python tenga un conector
  • ¿Desea escribir una GUI para sus parámetros / análisis / informe interactivo? Claro que puedes hacer eso en Python

R, por otro lado, tiene toneladas de modelos y algoritmos específicos disponibles de fábrica que requieren que los codifique usted mismo en Python. Por supuesto, puede ejecutar el código R en Python, que le ofrece lo mejor de ambos mundos.

R es rico en paquetes satísticos y ML, pero Python es un buen lenguaje de programación en ciencia de datos. Encuentro python útil para el screeping web
y escribir API tranquila para predicción IO. Python es fácil de aprender compitió con R. Python también tiene ricos paquetes de ML como scikit learn y el módulo pandas en python puede manejar los marcos de datos como en R.

Hola,

Como somos una empresa de Big Data, ya tenemos nuestra propia opinión sobre el tema. Para ir directo al grano, solo publicaré la conclusión de nuestro artículo aquí:

R es muy bueno para la investigación científica, donde necesitamos procesar pequeños conjuntos de datos específicos con la ayuda de métodos estadísticos exóticos, por ejemplo, hacer una corrección estacional de series de tiempo en econometría, y para la enseñanza, donde la tarea principal es hacer un análisis expreso y trazar buenos gráficos. Al mismo tiempo, Python es mejor para desarrollar algoritmos que son más seguros y están mejor escalados, cuando necesitamos desarrollar software eficiente y cualitativo para el usuario final. Evidentemente, para proyectos de análisis de datos sociales, Python es la mejor opción.

Si quieres conocer todos los argumentos, dirígete a nuestro blog R vs. Python