¿Python es mejor que R para la ciencia de datos?

Depende

R está construido para el análisis de datos. Es muy rico en análisis de datos, munging y visualización. Tiene una gran variedad de paquetes de terceros para muchas cosas en varios dominios.

Python es un lenguaje de programación de propósito general. Se puede utilizar para diversas tareas y una de ellas es la ciencia de datos.

Además, varias funcionalidades / paquetes de R fueron portados a Python. Un paquete notable es Python Pandas. Este paquete proporciona muchas utilidades para el análisis de datos. Hay muchos otros paquetes que se portan a Python. Si los paquetes Python disponibles son suficientes para su trabajo, puede elegir Python sobre R. La ventaja es que puede usar Python para muchas otras cosas además de la ciencia de datos.

Si necesita alguna funcionalidad / paquetes de R, entonces debe aprender R. Tenga en cuenta que la comunidad R es mucho más grande que Python en el dominio estadístico.

He visto a muchas personas que terminan aprendiendo ambas.

La regla general es, use R si su trabajo está más orientado a las estadísticas, use Python si su trabajo está más orientado a la programación.

La ciencia de datos en sí es un término muy amplio. Si especifica su dominio y la naturaleza de su trabajo, podría ayudarlo a dar una respuesta más relevante.

Cuando decide qué es más importante, primero debe pensar en la comunidad de soporte, el soporte de la comunidad de ciencia de datos para R es mayor que el de Python.

En segundo lugar, R está diseñado para facilitar el trabajo del científico de datos / analista, mientras que Python es de uso general, lo que significa que la mayoría de las tareas de aprendizaje automático, minería de datos y visualización tienen soluciones listas para ser llamadas usando una sola función o un un par de funciones conocidas y ya está, mientras que necesitará ajustar y tal vez escribir un código desde cero para finalizar sus tareas en Python. Las estadísticas están disponibles para usted todo el tiempo, no necesita escribir ningún código adicional para obtenerlas.

Para la ciencia de datos iré definitivamente por R

Ambos lenguajes tienen muchas similitudes en sintaxis y enfoque, y realmente no puedes equivocarte con ninguno de los dos. Aquí hay un desglose rápido de los dos idiomas.

R es más funcional, mientras que Python está más orientado a objetos. R permite que funciones como lm , predit y otras hagan la mayor parte del trabajo. Compare esto con la clase LinearRegression en Python y el método de muestra en marcos de datos

R tiene más análisis de datos incorporado, ya que Python se basa en paquetes. Por ejemplo, cuando miramos estadísticas de resumen, podemos usar la función de resumen incorporada en R, pero tendríamos que importar el paquete statsmodel en Python.

Python tiene paquetes “principales” para tareas de análisis de datos, R tiene un ecosistema más grande de paquetes pequeños. Con Python, podemos hacer regresión lineal, bosques aleatorios y más con el paquete scikit-learn. En R, tenemos una mayor diversidad de paquetes, pero también una mayor fragmentación y menos consistencia.

R tiene más soporte estadístico, mientras que usaría Python para hacer más tareas no estadísticas. Con bibliotecas como BeautifulSoup y solicitudes, el raspado web en Python es mucho más fácil que en R.

Esta publicación de blog proporciona un punto de vista objetivo y entra en más detalles sobre los 2 idiomas.

Si por ciencia de datos te refieres a análisis estadísticos y numéricos, no. Si te refieres a integrar productos de datos, sí.

Piensa así:
Python es un par de alicates: una buena herramienta de uso general en casa en cualquier caja de herramientas. Los mecánicos pueden usarlos, las cajas de herramientas domésticas se benefician de ellos.

R es una llave dinamométrica de alto grado. Hace tornillos. Todos los mecánicos necesitan uno, pero solo son útiles en algunas cajas de herramientas domésticas.

Si necesita trabajar en el motor de su automóvil, puede girar los pernos con unos alicates, pero si lo vi atacar los pernos del cabezal del motor sin una llave dinamométrica, me avergonzaría.

Python es el preferido para proyectos de minería de texto, procesamiento de imágenes y procesamiento de sonido / audio. El inconveniente básico de usar R es su mecanismo de carga de todos los datos en la memoria primero y la falta de soporte multi-core. R está más orientado a las estadísticas, bueno para EDA. Prueba estadística y diagramas de tablas y gráficos. Hay muchas comparaciones disponibles en internet. En un informe reciente publicado por O’Reilly R está ganando más popularidad nuevamente. Microsoft es compatible con R, por lo que el futuro de R es brillante. Si bien Python es fácil de usar e implementar.