¿Cuál es una mejor iniciativa para aprender ciencia de datos: Python o R?

“Déjame decirte lo más importante antes de usar cualquier lenguaje de programación”.

Necesidad primaria : ¿cuál es el requisito?

Necesidad secundaria: su interés (o más cómodo con)

Caso similar con R y Python también. Ambos lenguajes de programación son los mejores para la ciencia de datos. No podemos decir exactamente cuál es mejor.

Lea más sobre el lenguaje R.

Ahora, le haré saber cada concepto uno por uno. En primer lugar, le proporcionaré una definición simple de R y Python

R – Es un lenguaje de programación de código abierto. También, disponible como software libre bajo los términos de la GNU de la Free Software Foundation.

Una de las cosas más importantes sobre R es que proporciona la mejor publicación de calidad de publicación.

Aprende por qué R es importante

Python : es un lenguaje muy simple. Que fácilmente cualquiera puede aprender. Una de las cosas importantes sobre python es que no requiere demasiado tiempo en inversión. Además, su sintaxis es fácilmente legible.

Además, por su simplicidad, es un lenguaje de enseñanza ideal. Además, permite a los recién llegados recogerlo rápidamente. Como hemos visto, los desarrolladores pasan su tiempo pensando en el problema que intentan resolver, y menos tiempo pensando en las complejidades del lenguaje.

Aquí, tengo un enlace para los mejores libros de R.

Ahora, te diré cuál es el caso con la ciencia de datos para R y python :

¿Por qué es Python excelente para la ciencia de datos?

  • Fue lanzado en 1989.
  • El IDE de IPython / Jupiter es excelente.
  • Hay un ecosistema muy grande para python.

¿Por qué R es genial para la ciencia de datos?

  • Fue creado después de Python en 1992.
  • En este lenguaje de programación, Rcpp ayuda a facilitar la extensión con C ++.
  • En R, utilizamos R studio para llamar a un IDE maduro y excelente.

Para las preguntas y respuestas de la entrevista R, puede seguir este enlace mencionado a continuación:

R Entrevista Preguntas y respuestas

Introducción a R y Python para guerras de ciencia de datos :

Hay un enlace de entrevista para personas nuevas y experimentadas. Puede llamar a seguir este enlace de mención a continuación para este particular:

Preguntas y respuestas de la entrevista 125 R para estudiantes de primer año y experimentados

Introducción a R y Python para guerras de análisis de datos

Ahora, al final, discutiremos los pros y los contras de R y Python

Una vez que haya terminado con la preparación de la entrevista, puede verificar cuánto ha entendido con el cuestionario R:

R Programación de preguntas y respuestas de cuestionarios en línea

Aquí, tengo un enlace más a R Quiz:

R Preguntas y respuestas de opción múltiple

Además, si siente alguna consulta, no dude en preguntar en la sección de comentarios. Espero, resolveré tu problema.

No, no importa

Además, ha habido un gran número de preguntas sobre esto en Quora. Un billón. Y lo digo como científico de datos. Cuando Quora dijo “yo, mira estas preguntas similares” … Desearía que alguien escuchara, pero no lo hacen, y … culpo a Quora. ¡Vamos chicos! Yair Livne William Chen Adam D’Angelo puedes arreglar esto … ¡Creo en ti!

¿Puede Python desplazar a R para Data Science?

¿Qué es mejor para el análisis de datos: R o Python? ¿R sigue siendo un mejor lenguaje de análisis de datos que Python? ¿Alguien más ha usado Python con Pandas, en gran medida, en proyectos de análisis de datos?

¿Qué idioma se usa más en Machine Learning y Data Science: R o Python?

¿Python es mejor que R?

https://www.quora.com/Is-Python-…

¿Vale la pena aprender R, o puedo usar Python para la ciencia de datos?

¿Qué es mejor para aprender Python o R?

¿Qué es mejor para las estrategias cuantitativas, R o Python?

¿Qué podría ser mejor SAS, o R, o Python?

¿Qué es mejor para Google Analytics R o Python?

¿Qué es mejor para las estrategias comerciales de backtesting, R o Python?

En términos de velocidad y pros / contras, ¿cuál es mejor para el procesamiento de datos: R, Python o Java?

¿Qué lenguaje es mejor para el análisis de series de tiempo, Python o R? Descubrí que formatear las fechas es bastante fácil en ambos casos. Entonces, ¿qué idioma es mejor para cosas como el modelado ARIMA y la estimación de densidad espectral?

¿Cuál tiene mejor desempeño en disputas de big data, R o Python?

¿Qué es mejor para la gestión y agregación de datos: R o Python?

¿Qué es mejor para los codificadores: Python o R?

¿R está basado en Python? La gente siempre pregunta si R es mejor que Python, ¿por qué? ¿Qué tiene de especial Python? ¿Por qué no otros idiomas?

¿Cuáles son las principales diferencias entre MS SQL, Python y R? ¿Y qué sistema es mejor para admitir una plataforma de BI de Corporate Finance?

¿Qué es mejor para uso industrial en ciencia de datos: R o python?

~~~

Lo más importante es poder moverse rápidamente y ser increíble, dado un conjunto de herramientas. Siempre puedes aprender otras herramientas.

Los científicos de datos, en todo el mundo, han preferido usar ambos en gran medida porque ambos son increíbles con capacidades únicas. Ambos tienen algunas ventajas sobre el otro también. Si bien R tiene excelentes capacidades estadísticas, las bibliotecas y capacidades de Deep Learning de Python están en aumento.

R también tiene algunos excelentes paquetes de Machine Learning y solo mejora con el tiempo. Puedo seguir y seguir con las diferencias y similitudes entre los 2, pero quiero responder a su verdadera pregunta: ¿Cuál tiene un futuro mejor?

¡La respuesta es ambas! Hay toneladas de compañías que usan ambas porque ambas están disponibles gratuitamente. Si recién está comenzando su camino en “Ciencia de datos”, primero descubra por qué desea seguirlo.

¿Está realmente interesado en realizar una investigación en visión artificial, sistemas de inteligencia artificial como automóviles autónomos, para ayudar a las ONG a aprovechar al máximo sus datos? Averigua qué te interesa en Data Science además del salario y los trabajos.

Otra cosa es que, si recién está comenzando, le sugiero que comience con Python, aunque realmente también apoyo a R. Si estás tratando de aprender ambos al mismo tiempo, estás sobrecargando tu cerebro. En cambio, también debe centrarse en aprender las Matemáticas detrás de cada algoritmo, como qué es exactamente el Índice de Gini, cómo funciona realmente un algoritmo XGBoost y cómo el ajuste de un hiperparámetro cambia su salida. Esta es el área en la que debería centrarse más.

Además, Python también está integrado con el back-end de muchos sistemas dentro de las organizaciones, por lo que obtener un conocimiento más profundo sobre cómo funciona Python también puede ser realmente útil.

Las habilidades siempre son transferibles, si eres bueno programando en un idioma y siempre y cuando sepas lo que quieres, puedes aprender otro idioma y su sintaxis bastante rápido. Así que siéntase libre de dar un paso atrás, pensar en Data Science en su conjunto y por qué desea seguirlo, y luego pensar en qué idioma cree que es mejor comenzar. El número de bibliotecas que admiten Deep Learning en Python definitivamente está aumentando y uno podría argumentar que Python gana la batalla, donde siento que deberíamos aprovechar al máximo lo que esté disponible para nosotros.

Espero que esto haya ayudado y ¡Feliz aprendizaje!

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes desarrollan proyectos sobre conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Sí, Python es mejor que R. Muchas personas, incluido yo, se enamoran fácilmente del lenguaje Python. Python se ha convertido en un lenguaje de programación popular y vibrante con Ruby, Perl y muchos más.

Python ha ganado recientemente la fuerza para crear sitios web utilizando sus múltiples marcos web. Mucha gente cree en llamar a Python como un lenguaje de script ya que uno puede escribir fácilmente scripts o programas rápidos y pequeños. Personalmente no me gusta llamar a Python como lenguaje de programación porque es más un lenguaje de programación general.

El lenguaje de secuencias de comandos implica que Python no se puede usar para construir software de misión crítica que no sea cierto. Python es ampliamente utilizado en aplicaciones industriales. Sin embargo, sus alas también cubren la investigación académica en informática científica.

Cuando hablamos de análisis de datos, Python se compara con muchos otros lenguajes de código abierto. No obstante, últimamente, el sólido soporte de la biblioteca de Python se ha convertido en una preferencia obvia para la mayoría de los analistas para realizar tareas de análisis de datos. Además, al ser un lenguaje de programación general, actúa como un lenguaje único para el desarrollo de aplicaciones, especialmente las centradas en datos.

Python tiene muchos paquetes diferentes. Pandas es uno de los paquetes de análisis de datos más reconocidos que ofrece herramientas y estructuras de alto rendimiento para el análisis de datos. Los paquetes de Python ayudan a acortar el tiempo entre iniciar el proyecto y hacer un trabajo constructivo dentro de ese proyecto. Si desea Python y algunas funcionalidades de R, entonces RPy2 ofrece todas las funcionalidades clave de R.

Probablemente deberías elegir Python si ya tienes algo de experiencia en programación. También es un lenguaje muy flexible. Entonces, incluso si tiene que cambiar a otros proyectos una vez que haya terminado con el proyecto de análisis de datos, aferrarse a Python ya que no tendrá que aprender un nuevo idioma.

Gracias a su flexibilidad, ya que es una elección de idioma perfecta cuando se trata de actividades de producción. Especialmente cuando las aplicaciones web deben integrarse con tareas de análisis de datos. No hay necesidad de integrarse con otro idioma.

Python ya ha demostrado ser tan bueno como R Programming, en términos de todo el proceso bajo análisis de datos. Cualquier principiante que ingrese al campo del análisis de datos puede usar este lenguaje de programación para iniciarse en la industria de la ciencia de datos. Como resultado de sus usos multipropósito, hay muchos institutos que ofrecen cursos en Python.

Si eres un nuevo estudiante de programación y desconoces la sintaxis universal, la curva de aprendizaje para Python y R probablemente sea la misma. Sin embargo, si su objetivo final es seguir los conceptos básicos del análisis de datos, entonces Python es la mejor alternativa. Esto será válido teniendo en cuenta las mejoras de scikit-learn para el arsenal de paquetes de Python.

El paquete está fuertemente en desarrollo y se mantiene adecuadamente. R también tiene una mayor variedad de paquetes, pero la consistencia entre los paquetes es muy baja.

Tanto R como Python están en paridad entre sí, independientemente de su problema. Pero, si quieres algo que sea multipropósito, que sea flexible pero flexible para el análisis de datos, ¡Python es el ganador del juego!

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Ambos idiomas tienen sus ventajas cuando se usan para la ciencia de datos. Depende principalmente de

  • cuál es la tarea en cuestión,
  • si ya tienes experiencia en un idioma u otro o no,
  • cuáles son las tendencias en su industria y
  • qué otras herramientas disponibles tiene a su disposición para abordar la tarea en cuestión.

Fuente: ¿Elegir R o Python para el análisis de datos? Una infografía

Para agregar a esto, me gustaría agregar este gráfico, que apareció recientemente en The Impressive Growth of R – Stack Overflow Blog para mostrarle que la elección de un idioma u otro puede tener algo que ver con la industria que usted estás trabajando en:

Pero, lo que tal vez sea más importante, me gustaría llamar su atención sobre el hecho de que la mayoría de los científicos de datos conocen tanto a R como a Python y la demanda de competencia en ambos a menudo se pregunta:

Fuente: La industria de la ciencia de datos: quién hace qué (infografía)

Lo primero que quiere hacer es desenfocarse en R y Python y centrarse en las técnicas de los científicos de datos. Quizás ya lo estés, si no, hazlo.

Es mucho más importante saber cuándo una técnica es aplicable a un conjunto de datos que saber cómo ejecutar una técnica en una herramienta. Muy pocas personas de ‘ciencia de datos’ están haciendo esto. Hay un evento en vivo gratuito para que pueda orientarse al final de esta publicación.

  1. Tomemos un ejemplo de la técnica ARIMA para pronosticar en R y Python. , ¿cuál es el número mínimo de años de datos o variables mínimas necesarias para usar ARIMA en un conjunto de datos en primer lugar y predecir la ciclicidad, tendencia y estacionalidad?
  2. Si no tengo suficientes años de datos, ¿puedo ejecutar ARIMA o si no tengo variables, puedo retroceder mis datos usando R o Python?
  3. ¿Puedo ejecutar el método Johansen para manejar valores perdidos en datos estacionales como datos de comercio electrónico?

Las respuestas a estas preguntas son importantes, pero lo más importante es que se aplican por igual a R, Python e incluso SAS.

Volviendo a su pregunta, disculpas por mi desvío aquí es mi opinión sobre las herramientas.

R: Las bibliotecas encantadoras que no tienen equivalente en Python pero carecen de capacidad de producción, ya que técnicamente no es un lenguaje de programación completo. Permanecerá más tiempo que SAS, ya que es de código abierto y una generación de científicos de datos creció en él. Aprende, está alrededor por un tiempo.

Python: un lenguaje lúcido para escribir, excelente y completo con capacidad de producción y bibliotecas que están mejorando.

SAS: Tendencia a la baja, pero llevará 15 años convertirse en lo que son los combos de hoy, el refugio de las empresas que no pueden comprar un nuevo producto y los profesionales que no saben qué aprender más. Bueno aún para bancos e instituciones financieras, ya que tienen los dos factores mencionados anteriormente. Bueno para Europa y Canadá y EE. UU., Pero no para el futuro.

¿Por qué Python no tiene bibliotecas tan buenas como R?

Los estadísticos trabajan en R y los técnicos aman Python. Los estadísticos escribieron más bibliotecas para R que los codificadores en Python. Los codificadores tampoco están tan metidos en las estadísticas por cierto. Prefieren ML DL y más. Formas fáciles para que la máquina elimine los datos y encuentre el fantasma (respuesta) sin disfrutar del viaje estadístico en el camino.

Herramientas de visualización: seguro que su lista necesita MSBI además de Tableau, ya que MSBI y Tableau son el número uno este año en el cuadrante de Gartner si Business Intelligence. Además, Microsoft está impulsando el poder de BI a 750 millones de computadoras que tienen Excel instalado. Entonces va a crecer con seguridad.

Nuevamente, comprender la visualización exploratoria versus la visualización explicativa es muy importante. La mayoría no sabe la diferencia.

Lea este importante artículo ¿Deberían los científicos de datos dedicar más tiempo a los algoritmos de aprendizaje automático o visualizar los datos?

Muchos técnicos y geeks lo pasan por alto como cuadros y gráficos, lo que no es así. Visual Analytics se trata de explorar y analizar datos visualmente. Power BI y Tableau son buenas opciones. También mira la herramienta de visualización gratuita de airbnb llamada superconjunto. Su libertad gratuita podría ser el futuro en la visualización. Veo venir una visualización gratuita. Esto podría ser

Si desea aprender gratis, únase a este evento Aprenda y crezca con Analytics

¡Gracias!

¿Ya sabes cómo programar en un idioma real o estás dispuesto a dedicar una buena cantidad de tiempo al aprendizaje? Si alguno de esos es cierto, recomendaría Python. Python es un lenguaje bien diseñado con todas las funciones. Conocerlo bien le permitirá hacer muchos de los aspectos no analíticos del rol de la ciencia de datos. Si alguna vez va a construir una tubería, Python probablemente será el lenguaje en el que lo hace, y la experiencia con un lenguaje real lo hará más capaz de profundizar en el código de producción si es necesario.

He usado R por años y nunca me gustó. R es como si alguien mirara a Matlab, identificara todas las malas decisiones de diseño, comenzara con esas como base y agregara el doble de más. No es eficiente si alguna vez quieres hacer algo para lo que R no está específicamente diseñado, y su manejo de tipos buscará nuevas formas de hacerte tropezar todos los días. En el lado positivo, fue construido para realizar manipulación matemática en un entorno interactivo de una manera que Python no era, y probablemente nunca pueda ser. Como resultado, es bastante rápido recogerlo si eso es lo que quieres hacer. Ha sido la opción predeterminada para el análisis estadístico durante muchos años, y ha acumulado paquetes para hacer cualquier cosa que desee a lo largo de los años, incluidas algunas herramientas gráficas bastante ingeniosas. Comenzando con cero experiencia en programación, podrá hacer mucho con R en sus primeros dos días de lo que haría con Python.

Aún así, apuesto a que Python se convertirá en el idioma de elección eventualmente. Funciona bien en un entorno interactivo, y los paquetes de análisis están mejorando. Todavía hay cierto debate en la industria sobre el grado en que los científicos de datos necesitan habilidades SWE. Si el lado “más” gana, todos terminarán en Python. Si gana el lado “menos”, las personas podrán sobrevivir con R, pero Python seguirá funcionando bien.

Realmente, realmente depende de qué dominio es interesante para usted y qué es lo que le gustaría hacer.

Pitón

La respuesta corta es que Python es más comercializable para la mayoría de las situaciones. Es un lenguaje de propósito general, simplista y está en el centro de todo el bombo de Data Science. Es cierto que, debido a todas las ventajas y bibliotecas que tiene, es más fácil implementar un sistema de producción en Python, pero personalmente, para sistemas grandes y pesados, me gustaría evitarlo. Y no está libre de problemas todo el tiempo, especialmente dependiendo de dónde se almacenan sus datos.

Por alguna razón, también es uno de los idiomas que no me hace sentir como en casa, además de JavaScript. Cada vez que intento profundizar en ello, encuentro algo que me aleja. Prueba el curso de introducción en el sitio de DataCamp: si puedes disfrutarlo y soportarlo, ¡Python puede ser justo para ti!

Además de algunas de las bibliotecas que aparecen primero para Python, hay una gran ventaja sobre R: generalmente es una ruta directa para hacer algo en Python, que es bueno copiar y pegar código y trabajar con otras personas en un solo proyecto .

R

Este no es exactamente un lenguaje (de propósito general), sino un sistema estadístico con su propia sintaxis. Y, a veces, puede volverse extraño en términos de sintaxis o consistencia. Hay una razón para eso: puede rastrear las raíces de R hasta 1976, cuando nació su predecesor “S”. En contraste, Python es 15 años más joven y apareció en el escenario en 1991. Y en términos de TI, esta es una diferencia de tiempo considerable.

R puede no tener el problema de transición que había con Python 2 y Python 3, pero no existe una filosofía única de cómo hacer las cosas en R. Debido a la gran variedad de paquetes que uno tiene, elegir entre dplyr y data.table puede ser suficiente para dividir Tu equipo. Y comentar sobre el uso de for- loops en código R por parte de otra persona ha echado a perder más de una amistad.

A veces, no es un lenguaje sencillo. Es fácil comenzar, pero difícil de dominar. Y si lo domina, existe una gran posibilidad de que sus colegas no compartan sus habilidades, por lo que es posible que tenga que vivir con su código de peatones, ya que la mayoría de las veces estas personas provienen de roles estadísticos (SAS, SPSS, Excel, etc.) . Sus colegas de Python pueden tener experiencia en CS y ser mejores en la codificación (aunque la experiencia diferente también viene con diferentes puntos ciegos).

R es tan malo? ¡No! Hay varias cosas que me hacen seguir con esto, personalmente:

  • Gran soporte para múltiples formatos de salida. Esencialmente, me permitirá crear informes y documentación que pueda presentar en cualquier formato que me funcione. Este puede ser un informe interactivo con Shiny y producir un Markdown amigable con GitHub con el mismo código.
  • Más simple para interactuar con los datos, especialmente si lo hace a diario. Subconjunto es solo una brisa. Todo está vectorizado, y la indexación comienza desde 1. La negación excluirá el elemento del vector, y los límites superiores funcionan como límites inferiores. Python es una pesadilla en comparación con esto. Para mí, R se siente más natural para lidiar con entornos dinámicos o lo desconocido en general.
  • Trazar es asombroso
  • (Casi) brillante soporte de Java con el paquete rJava, y un gran soporte para REST API. Este es un gran atajo para el ecosistema de Java y es donde viven los proyectos más destacados de Apache.

Si apuntas a sistemas de producción pesada con big data, transmisión de datos, concurrencia, ambas herramientas se quedarán cortas y R será el primero en renunciar, por supuesto. Una vez más, YMMV, pero encuentro el pensamiento que R cultiva para facilitar la transición a un lenguaje como Scala (un lenguaje bellamente diseñado) que será una opción más sólida para un sistema de producción grande. Por supuesto, en un entorno más tradicional, también puedes utilizar Java.

Aún así, lo más probable es que nunca necesite ese nivel de complejidad y Python estará bien para usted. Es una habilidad valiosa tener en tu CV / Currículum de todos modos, incluso si te gusta usar R a diario.

Realmente depende de la dirección en la que te dirijas. Python es más un lenguaje de programación de propósito general, pero aún tiene muchas bibliotecas estadísticas que R tiene. Debido a la naturaleza de programación de uso general de Python, he encontrado que muchas personas que vienen a la ciencia de datos desde la informática prefieren Python. Esto es algo a tener en cuenta si en el futuro desea aprender otros idiomas, porque probablemente desarrollará mejores habilidades de programación general con Python.

R es increíblemente propicio para la creación rápida de prototipos, la construcción de modelos, la exploración de datos, las disputas y la generación rápida de gráficos (sin decir que no puede hacer nada de esto en Python, porque sí puede). Además, si viene de trabajar principalmente con datos en Excel, muchas de las funciones en R en términos de argumentos se sentirán similares a Excel (aunque esto está cambiando con las tuberías magrittr).

A medida que avanza por la madriguera del conejo, encontrará que hay algunas tareas que un idioma hace mejor que el otro. Por lo tanto, si está aprendiendo a usarlo seriamente a diario en su profesión, lo más probable es que llegue a la conclusión de que debe aprender ambos y mucho más.

En cuanto a las comunidades / documentación, ambas son extremadamente fuertes con una gran cantidad de material de aprendizaje gratuito y pago. Para ambos, es muy probable que un error que encuentre ya sea respondido aquí o en stackoverflow. Mi sugerencia es probar ambos y ver cuál prefiere al intentar definir y resolver un problema simple primero. La forma más rápida de obtener la configuración con el menor número de dolores de cabeza es mediante el uso de R y RStudio y la distribución Python de Anaconda de Continuum Analytics. Ambos idiomas tienen muchos ejemplos en la documentación para probar. Además, sea cual sea el idioma que decida seguir o ambos, le recomiendo las guías de estilo de Google para que pueda seguir las convenciones estandarizadas y no desarrollar malos hábitos.

¡¡Es un empate!!

Depende de usted, el científico de datos, elegir el idioma que mejor se adapte a sus necesidades.

R y Python están librando una guerra: mientras que ambos lenguajes de programación están ganando protagonismo en la comunidad de análisis de datos y están luchando por convertirse en el lenguaje elegido por los científicos de datos. Depende de ti de qué lado estás tomando?

Veamos una pequeña introducción sobre R y Python

R

R es un lenguaje de programación y un entorno de software libre para computación estadística y gráficos que es compatible con la Fundación R para la Computación Estadística. El lenguaje de programación R es ampliamente utilizado entre los estadísticos y los mineros de datos para desarrollar software estadístico y análisis de datos.

Pitón

El lenguaje de programación Python fue concebido a fines de la década de 1980, y su implementación fue iniciada en diciembre de 1989 por Guido van Rossum en CWI en los Países Bajos como sucesor de ABC capaz de manejar excepciones e interactuar con el sistema operativo Amoeba. Van Rossum es el autor principal de Python, y su papel central continuo en la decisión de la dirección de Python se refleja en el título que le dio la comunidad de Python, Dictador benévolo para la vida (BDFL). Python fue nombrado para el programa de televisión de la BBC Monty Python Flying Circus.

Cosas que debes saber sobre estos idiomas

R

  • R es una implementación del lenguaje de programación S (laboratorios de Bell).
  • El diseño y la malución de R son manejados por el grupo R-care y la fundación R
  • El entorno de software de R se escribió principalmente en C, Fortran y R.
  • R se centra en un mejor análisis de datos, estadísticas y modelos gráficos fáciles de usar.
  • R se ha utilizado principalmente en la academia y la investigación. Sin embargo, R se está expandiendo rápidamente en el mercado empresarial.

Pitón

  • Python se inspiró en C, Modula-3 y particularmente ABC.
  • Python recibe su nombre de la serie de comedia “Monty Python Flying Circus”.
  • Python Software Foundation (PSF) se encarga de los avances de Python.
  • Python enfatiza la productividad y la legibilidad del código.
  • Python utilizado por programadores que desean profundizar en el análisis de datos o aplicar técnicas estadísticas y por desarrolladores que recurren a la ciencia de datos.

Usabilidad y flexibilidad de R y Python

R

  • Los modelos estadísticos se pueden escribir con solo unas pocas líneas.
  • Hay hojas de estilo R pero no todos las usan.
  • La misma funcionalidad se puede escribir de varias maneras en R.
  • Es fácil usar fórmulas complejas en R. Todo tipo de pruebas estadísticas y modelos están disponibles y se usan fácilmente.

Pitón

  • La codificación y depuración es más fácil de hacer en Python, principalmente debido a la sintaxis “agradable”.
  • La sangría del código afecta su significado.
  • Cualquier pieza de funcionalidad siempre se escribe de la misma manera en Python.
  • Python es flexible para hacer algo nuevo que nunca antes se había hecho. Los desarrolladores también pueden usarlo para crear secuencias de comandos en un sitio web u otras aplicaciones.

R y Python es fácil de aprender?

R

  • R tiene una curva de aprendizaje empinada al inicio. Una vez que conozca los conceptos básicos, puede aprender fácilmente cosas avanzadas.
  • R no es difícil para programadores experimentados.

Pitón

  • El enfoque de Python en la legibilidad y la simplicidad hace que su curva de aprendizaje sea relativamente baja y gradual.
  • Python se considera un buen lenguaje para los programadores principiantes.

Imarticus ayuda a los aspirantes como usted a actualizarse y comenzar una carrera en ciencia de datos. Amplios proyectos, estudios de casos y tutorías son algunos de los aspectos más destacados de nuestros cursos, ya que creemos en ” Aprender haciendo “, que nos ha ganado varios premios estimados en la industria.

Imarticus ofrece Data Science Prodegree , en colaboración con Genpact como socio de conocimiento, es uno de los cursos en línea más adecuados para usted. Este curso lo ayudará a comprender en profundidad el análisis de datos y las estadísticas, junto con las perspectivas comerciales y las prácticas de vanguardia que utilizan SAS, R, Python, Hive, Spark y Tableau.

Visite el sitio web de Imarticus ( http://imarticus.org/?id=Website …) para comprender los cursos que ofrecemos o visite nuestro centro con sede en Mumbai, Pune, Delhi, Coimbatore y Chennai.

Podemos comenzar a llevarte al camino correcto este 2018.

Gracias..:)

La pregunta no debería ser si usar Python o R, sino si usar Python Panda o R, y esa es la diferencia. R a menudo se usa como un motor matemático de escritorio de entrada-salida, muy similar a MATLAB, mientras que Panda se usa a menudo en Python Scripts para procesos de análisis fijos. Pero: Panda y R se pueden usar en modo en vivo dentro de una Terminal, por lo que comparar esos dos escenarios -> son muy similares.

Ambos permiten la inclusión de conjuntos de datos, clasificación, coincidencia, clasificación, gráficos, filtrado, integración de datos del sitio web, capacitación de datos, regresión, ajuste de modelos y generación de gráficos. Todos estos puntos funcionan uno al lado del otro tanto en Panda como en R, e incluso tienen una sintaxis muy similar. la diferencia entre los dos?

Panda tiene muchos paquetes grandes y potentes que puede integrar en el proceso (todos los paquetes disponibles para Python para ser exactos).

R tiene una mayor cantidad de paquetes, que son más pequeños. Los paquetes pueden instalarse directamente en el ecosistema R y usarse en todo el sistema (igual que Python). R también está creciendo rápidamente en diferentes áreas, incluida la integración de Latex en su propio RMarkdown, que es una herramienta de escritura muy poderosa, y muchas más.

Un poco más de detalles si quieres leer al respecto: Python vs R: análisis de datos cara a cara

Espero poder ayudar!

Yo diría que la respuesta sería ‘Sí’. Esto sería potencialmente inestable si se le preguntara incluso un año y seguramente hace un par de años diferente.

Hay algunos lenguajes de programación que definitivamente se convierten en la opción para mucho trabajo (como Java estuvo durante algunas décadas), donde hay áreas como Java Script que está extremadamente llena de número de marcos y la velocidad a la que las personas prefieren nuevas formas de trabajar .

El espacio de la ciencia de datos, R fue firme durante un buen número de años y ninguno desafió su espacio. Sin embargo, en los últimos años, las bibliotecas Python de Pandas, scikit-learn y ahora Deep Learning (TensorFlow, Keras) se han desarrollado, madurado y ganado una tracción significativa. Tanto es así, que las plataformas como Kaggle, stackoverflow, KDNuggets han demostrado a través de los datos actuales que Python se convertirá en el lenguaje más preferido, eclipsando a R.

Con estos datos, definitivamente tiene más sentido que los nuevos participantes en el espacio de Data Science tengan Python como su primer lenguaje de programación.

Ciencia de datos con Python

Si desea cambiar su carrera para convertirse en un Científico de Datos , o mejorar sus métodos de Ciencia de Datos, definitivamente puede optar por el lenguaje de programación Python. Has venido al lugar correcto para conocer los detalles sobre Python y su importancia en el campo de la ciencia de datos. El objetivo principal de esta página es proporcionar la información necesaria requerida por cualquiera que vaya al estudio de Data Science.

Para entender Python y su importancia, lea las principales razones para aprender Python. Le dará todos los detalles importantes sobre Python. Discutirá las ventajas de usar Python. También puede leer el rol de trabajo, la responsabilidad y las tendencias salariales del desarrollador de Python para ver mejor el futuro con Python. Continuando, veamos ahora cómo sobresalir en el aprendizaje de Python.

¡Prepare su sistema!

Por fin has decidido aprender Python. Ahora debe configurar su sistema descargando Anaconda de Continuum. Io La Anaconda está repleta de casi todas las cosas que necesitará para aprender Python. Debe esperar a que se actualicen los paquetes y, por lo tanto, es posible que tenga que esperar a la próxima actualización aunque estén actualizados en otras bibliotecas.

Conceptos básicos de Python

Definitivamente necesita comprender los conceptos básicos de Python. Debe aprenderlos junto con las bibliotecas y la estructura de datos. Aprenda Python en detalle con la capacitación en línea de BigClasses Python . Esta capacitación en línea lo ayudará a aprender sobre la codificación desde el nivel básico hasta el avanzado. El plan de estudios del curso se actualiza constantemente con todas las características y funciones importantes en el lenguaje de programación Python.

Expresión en Python

Cuando aprenda Python, tendrá que pasar por una gran parte de la limpieza de datos, si está trabajando especialmente en los datos de texto. La mejor manera de aprenderlos a crear una hoja para ello. Al igual que las tarjetas de juego te hacen recordar las palabras y su significado, las mismas pueden ayudarte a entender Python y sus códigos fácilmente.

Bibliotecas en Python

Python tiene una gran biblioteca. Todos los módulos involucrados en las bibliotecas son importantes y deben entenderse. Tenemos Python NumPy, SciPy, Matplotlib y Pandas. Otros incluyen Requests, Scarpy, wxPython, Pillow, SQLAlchemy, BeautifulSoup, Twisted, Pygame, Pyglet, pyQT, PYGtk, pywin32, nose, SymPy, Ipython e IPython.

Aprendizaje automático y Scikit

El Scikit es una biblioteca increíble en Python. Y es útil para Machine Learning en Data Science. Puede aprender algoritmos supervisados ​​como regresión, árboles de decisión, modelado de conjuntos y algoritmos de aprendizaje no supervisados ​​como agrupamiento.

Practica tus habilidades de Python

Python es un gran lenguaje de programación. Es enorme y tiene todos los temas fundamentales necesarios para ser un experto en ciencia de datos. Necesita practicar sus habilidades de codificación una y otra vez. Debe trabajar en cada biblioteca con un ejemplo dado por el entrenador. Sin duda, puede ser un científico de datos profesional siendo un experto en Python. Para obtener más información sobre Python, lea Las principales empresas que usan Python .

Sin duda, ambos idiomas harán todo lo que necesita hacer. Si tienes experiencia en matemáticas / estadísticas, entonces probablemente encuentres más uso en el aprendizaje de R. Si este es el caso, recomiendo instalar RStudio, un IDE para R que hace que aprender el idioma sea mucho más fácil. Si vienes de una formación en informática o no tienes experiencia en programación, entonces optaría por Python. La curva de aprendizaje para Python es menos agresiva que la de R y dentro de unas pocas líneas de código simples puede producir una gran cantidad de resultados.

Desde mi propia experiencia personal a través de pasantías y prácticas, Python fue el lenguaje preferido para la ciencia de datos. Dentro del último equipo en el que trabajé, todos los que conocían y se sentían cómodos en Python, sin embargo, solo unas pocas personas tenían experiencia en R.

No importa.

Puede comenzar con cualquiera de los dos y no puede salir mal. Todo depende de tus preferencias personales. Es posible convertirse en un científico de datos con conocimiento de R o Python. Al mismo tiempo, nada debería impedir que aprendas otro lenguaje de programación si es necesario. En términos de programación, el enfoque siempre debe ser “¿qué programa / lenguaje es el más adecuado para resolver el problema en cuestión?”. Por lo tanto, si puede proporcionar la solución usando R o Python, entonces debería estar bien. La mejor manera es comenzar tratando de resolver problemas simples tanto en R como en Python. Luego, con el tiempo, decida cuál es la herramienta que elija según la que más le guste / prefiera en términos de facilidad de uso / aplicabilidad. No te puedes equivocar con ninguno de los dos.

La respuesta es realmente fácil, pero a mucha gente no le gusta.

Es Python.

La construcción de modelos más aplicada es Python . Aplicado significa que vas a trabajar para una empresa y te pagan por construir modelos que terminan siendo utilizados en un entorno de producción con datos nuevos.

Google no front-end sus modelos TensorFlow en R, usan Python . En el espacio de datos, Google siempre está 5 a 10 años por delante de la curva.

Ojalá pudiera ser más diplomático porque me gusta R, pero la verdad es que el aprendizaje automático se trata de Python y esa tendencia no ha cambiado en los últimos 3 años y no lo hará en los próximos tres.

Si tiene algo de tiempo, consulte mi curso GRATUITO sobre Python y algunas bibliotecas para la construcción de modelos. Es un curso corto y si eres nuevo en esto te dará algunas respuestas. Míralo durante el almuerzo.

Las 5 mejores bibliotecas de aprendizaje automático en Python – Udemy

En el 90% de los casos no lo hace.

Lo hace en ciertas áreas de la ciencia. Por ejemplo, si planea participar en la investigación clínica (especialmente ensayos controlados aleatorios), entonces R [1] es la única opción sensata, además de las comerciales como SAS o Stata (Gracias, David Okunlola, por recordar).

Por supuesto, aún puede usar Python (como cualquier otro lenguaje de programación posible), pero su biblioteca es deficiente en esta aplicación, por lo que tendrá que implementar las herramientas necesarias, que existen en R durante mucho tiempo.

Notas al pie

[1] R en investigación clínica y medicina basada en evidencia

Creo que depende del contexto. Si está buscando manipular datos en línea y desea crear rápidamente un tablero que muestre el resultado. Buscaría Python en lugar de R. Puedes hacer todo lo que Python puede hacer incluso en este escenario. Es solo que Python lo hace mucho más fácil. Mi sugerencia personal es aprender ambos. De esta manera, puede decidir qué idioma elegir para qué tipo de solución en problemas de ciencia de datos.

En el caso de R, instalar R en Windows es fácil. Luego puede descargar y aprender RStudio. Eso te pone en la dirección. Sugiero tutoriales de Youtube o Datacamp si quieres seguir la ruta del curso premium.

En el caso de Python, descargue Jupyter y configure su entorno, luego comience a trabajar con numpy, scipy y pandas. Vea si los encuentra más fáciles en comparación con los paquetes R. Además de jupyter, hay otros paquetes como Conda que lo ayudan a configurar toda la pila de ciencia de datos en el escritorio.

El bioinformático se convirtió en científico de datos aquí.
Al contrario de la mayoría de las respuestas, comencé con R (gracias a mi plan de estudios) y luego entré usando Python.
Personalmente, me sentí muy fácil en comparación con la programación de Python.

Mi perspectiva es comparar cómo puede escribir una función y llamar a funciones en R vs Orientación de objetos en Python.

Por otro lado, aprender los conceptos básicos, realizar la manipulación de datos, el análisis de cadenas y las operaciones de principiantes están bastante al mismo nivel. Si hablamos de la funcionalidad y el uso de aplicaciones de las herramientas, esa es una historia completamente diferente, ya que ambos tienen un propósito conjunto, pero son buenos en sus diversas formas.

Entonces, si diría que aprender de R vs aprender de python – Definitivamente R

Data Science es un campo vasto y uno tiene que reducir su alcance antes de aprender para R y Python.

Ambos idiomas son muy utilizados por profesiones que se encuentran en los campos de ciencia de datos / analista de datos, ya que ambos son de código abierto y admiten una gran cantidad de bibliotecas externas.

La limpieza de datos, el procesamiento previo de datos, el modelado predictivo, etc. se implementan fácilmente en R, mientras que NLP, SVM, se implementan sin problemas utilizando algunas bibliotecas externas en Python. Por lo tanto, depende totalmente de qué tarea realmente quieres aprender R o Python

Estar en NLP por un tiempo tranquilo, soy totalmente dependiente de Python ya que hay múltiples bibliotecas que son útiles para el trabajo relacionado con NLP (procesamiento del lenguaje natural). Además, para el aprendizaje profundo y las redes neuronales, bibliotecas como Tensorflow,

Theano

etc son bastante buenos con visualizaciones interactivas.

También hay bibliotecas y paquetes en R que se pueden usar para PNL, pero en Python obtendrá una gran cantidad de bibliotecas diferentes con una amplia variedad de funcionalidades que hacen que su trabajo sea más fácil. Además, los tutoriales para Python están fácilmente disponibles en comparación con R .

En pocas palabras, desde mi punto de vista, si eres nuevo en este campo y quieres aprender sobre alguno de ellos, diría que debes ir a Python.

PD: Ambos idiomas se consideran sustitutos entre sí para la mayoría de las tareas de aprendizaje automático.