¿Debo aprender Python o R para el aprendizaje automático si estoy cursando mi licenciatura en matemáticas e ingeniería informática? ¿Qué idioma se usa más en las industrias?

Hay algunas cosas que tendrá que tener en cuenta antes de decidirse por uno de los dos. Piense en la pregunta como un enunciado del problema. Tus inclinaciones actuales y tu comprensión de lo que quieres en el futuro te ayudarán a encontrar una respuesta. Si tiene prisa, solo lea el texto en negrita y lea el resto de los puntos.

  • Si actualmente no tiene idea de qué tipo de industria o carrera desea seguir, elija Python. Aunque tiene sus propias sutilezas y matices, es sintácticamente simple para empezar. En los últimos años, la pila científica y científica de datos de Python ha evolucionado rápidamente. Hay una gran cantidad de bibliotecas disponibles para mezclar datos, manipulación de datos, recopilación de datos, aprendizaje automático, etc. Muchas bibliotecas escritas en un lenguaje de nivel inferior emplean un contenedor / interfaz para permitir que Python las use. Todo esto permitirá que un principiante se centre más en los conceptos de ML en lugar de tener que lidiar con otras trivialidades.
    Bibliotecas útiles para principiantes: scikit-learn, Pandas, Matplotlib.
  • Si está interesado en las estadísticas, la informática estadística o más inclinado a explorar el lado matemático del aprendizaje automático, elija R. R es utilizado ampliamente por los estadísticos, tanto en la academia como en la industria. Es posible que tenga que acostumbrarse a su sintaxis; algunas personas lo encuentran peculiar (¡aunque me gusta!) Fue construido por estadísticos para estadísticos; Entonces eso es todo. Tiene un gran ecosistema de paquetes de aprendizaje automático pero algo disperso. Sin embargo, caret es un paquete que intenta unificar varios algoritmos de ML y funcionalidades relacionadas en una sola interfaz. Similar a Python, muchas bibliotecas escritas en diferentes lenguajes proporcionan una envoltura / interfaz para R. Sin embargo, no hay tantas como Python.
    Gran parte de las matemáticas involucradas en el aprendizaje automático se toman / derivan de las estadísticas (además del álgebra lineal, la optimización, etc.) Definitivamente ayuda a comprender los detalles subyacentes. Pero, de nuevo, no es absolutamente necesario; particularmente cuando estás más inclinado hacia el lado de la ingeniería de las cosas.
    Paquetes útiles para principiantes: caret, dplyr, ggplot2.
  • Si está interesado en crear productos de aprendizaje automático o ingeniería / desarrollo de software, Python es para usted. Python definitivamente se integra mucho mejor que R en el esquema más amplio de cosas en un entorno de ingeniería. Aunque, para escribir código realmente eficiente, uno podría tener que emplear un lenguaje de nivel inferior (C / C ++ / Java), pero proporcionar una envoltura de Python para ese código es una buena opción para permitir una mejor integración con otros componentes.
  • Si está interesado en análisis de datos o visualizaciones, R pulgadas más adelante. Para la creación rápida de prototipos y trabajar con conjuntos de datos para construir modelos de aprendizaje automático, encuentro R un poco mejor. Python ha atrapado algunos, pero R todavía parece ser mucho mejor en las visualizaciones de datos.

Comience con cualquiera de ellos y concéntrese en los conceptos de ML por algún tiempo. Eventualmente, aprender ambos te beneficiará. También le aconsejaré que intente lograr dominio en al menos un lenguaje de bajo nivel (C / C ++ o Java). ¡Puede ser útil alguna vez!

Experiencia personal
———————————

Había usado exclusivamente R cuando comencé con ML. Ya conocía Python y C / C ++ en ese momento (a través de WebDev, programación competitiva). Pero quería probar R, y estaba interesado en las estadísticas y los detalles matemáticos involucrados. Un beneficio que, al apegarse a uno solo, y a uno de alto nivel, fue el poder concentrarse en los conceptos relacionados con el aprendizaje automático. Entonces, cuando después de unos meses, comencé con la pila científica y ML de Python, las cosas fueron mucho más fáciles.

Mientras diseñaba el plan de estudios de ciencia de datos para GreyAtom, tuve la oportunidad de comprender las necesidades de la industria. Después de mucha discusión, nuestro equipo de académicos y profesionales de la industria llegó a una conclusión para ir con Python. Puedo enumerar algunos puntos que podrían justificar mi elección.

Por que Python

En la academia, especialmente en el campo de la estadística, R es mucho más utilizado que Python. En la industria, la tendencia de la ciencia de datos se está moviendo lentamente de R hacia Python.

Un factor que contribuye es que las compañías que usan una pila de aplicaciones basadas en Python pueden integrar más fácilmente a un científico de datos que escribe código Python, ya que eso elimina un obstáculo clave en la “producción” del trabajo de un científico de datos.

Personalmente, creo y trabajo para cerrar la brecha entre la industria y los académicos. Por lo tanto, Python se convierte en el lenguaje de elección para el bien común.

Python es una de esas herramientas que tiene un atributo único, de ser un lenguaje de programación de propósito general y fácil de usar, cuando se trata de computación analítica y cuantitativa. Python ha estado en la industria durante bastante tiempo y se ha utilizado en industrias como informática científica, petróleo, gas, finanzas, física, procesamiento de señales y más.

Python también se ha utilizado en la creación de aplicaciones como YouTube, ha sido fundamental para impulsar la infraestructura interna de Google, etc. Esta herramienta puede coordinar grupos masivos de servidores de gráficos por computadora y ayudar en la producción de películas, este atractivo atributo es la razón por la cual compañías como Disney, Sony, Dreamworks y similares dependen de él.

Cuando se trata de ciencia de datos, Python es una herramienta muy poderosa, también de código abierto y flexible, que agrega más a su popularidad. Se sabe que tiene bibliotecas masivas para la manipulación de datos y es extremadamente fácil de aprender y usar para todos los analistas de datos.

Cualquiera que esté familiarizado con los lenguajes de programación como Java, Visual Basic, C ++ o C, encontrará que esta herramienta es muy accesible y fácil de usar. Además de ser una plataforma independiente, esta herramienta tiene la capacidad de integrarse fácilmente con la Infraestructura existente y también puede resolver los problemas más difíciles. Se dice que esta herramienta es potente, amigable, fácil y funciona bien con otros, además de ejecutarse en todas partes.

Muchos bancos usan esta herramienta con el propósito de procesar datos, algunas instituciones la usan para analizar y visualizar. Esta herramienta ofrece el gran beneficio de utilizar un lenguaje de programación en múltiples plataformas de aplicaciones.

Python ya ha demostrado ser tan bueno como R Programming, en términos de todo el proceso bajo análisis de datos. Cualquier principiante que ingrese al campo del análisis de datos puede usar este lenguaje de programación para iniciarse en la industria de la ciencia de datos. Como resultado de sus usos multipropósito, hay muchos institutos que ofrecen cursos en Python.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

¡¡Hola yo!!

Depende de usted, en Machine Learning, elegir el idioma que mejor se adapte a sus necesidades.

R y Python están librando una guerra: mientras que ambos lenguajes de programación están ganando protagonismo en el análisis de datos, así como en la comunidad de aprendizaje automático, y están luchando por convertirse en el lenguaje elegido por los científicos de datos. Depende de ti de qué lado estás tomando?

Veamos una pequeña introducción sobre R y Python

R

R es un lenguaje de programación y un entorno de software libre para computación estadística y gráficos que es compatible con la Fundación R para la Computación Estadística. El lenguaje de programación R es ampliamente utilizado entre los estadísticos y los mineros de datos para desarrollar software estadístico y análisis de datos.

Pitón

El lenguaje de programación Python fue concebido a fines de la década de 1980, y su implementación fue iniciada en diciembre de 1989 por Guido van Rossum en CWI en los Países Bajos como sucesor de ABC capaz de manejar excepciones e interactuar con el sistema operativo Amoeba. Van Rossum es el autor principal de Python, y su papel central continuo en la decisión de la dirección de Python se refleja en el título que le dio la comunidad de Python, Dictador benévolo para la vida (BDFL). Python fue nombrado para el programa de televisión de la BBC Monty Python Flying Circus.

Cosas que debes saber sobre estos idiomas

R

  • R es una implementación del lenguaje de programación S (laboratorios de Bell).
  • El diseño y la malución de R son manejados por el grupo R-care y la fundación R
  • El entorno de software de R se escribió principalmente en C, Fortran y R.
  • R se centra en un mejor análisis de datos, estadísticas y modelos gráficos fáciles de usar.
  • R se ha utilizado principalmente en la academia y la investigación. Sin embargo, R se está expandiendo rápidamente en el mercado empresarial.

Pitón

  • Python se inspiró en C, Modula-3 y particularmente ABC.
  • Python recibe su nombre de la serie de comedia “Monty Python Flying Circus”.
  • Python Software Foundation (PSF) se encarga de los avances de Python.
  • Python enfatiza la productividad y la legibilidad del código.
  • Python utilizado por programadores que desean profundizar en el análisis de datos o aplicar técnicas estadísticas y por desarrolladores que recurren a la ciencia de datos.

Usabilidad y flexibilidad de R y Python

R

  • Los modelos estadísticos se pueden escribir con solo unas pocas líneas.
  • Hay hojas de estilo R pero no todos las usan.
  • La misma funcionalidad se puede escribir de varias maneras en R.
  • Es fácil usar fórmulas complejas en R. Todo tipo de pruebas estadísticas y modelos están disponibles y se usan fácilmente.

Pitón

  • La codificación y depuración es más fácil de hacer en Python, principalmente debido a la sintaxis “agradable”.
  • La sangría del código afecta su significado.
  • Cualquier pieza de funcionalidad siempre se escribe de la misma manera en Python.
  • Python es flexible para hacer algo nuevo que nunca antes se había hecho. Los desarrolladores también pueden usarlo para crear secuencias de comandos en un sitio web u otras aplicaciones.

R y Python es fácil de aprender?

R

  • R tiene una curva de aprendizaje empinada al inicio. Una vez que conozca los conceptos básicos, puede aprender fácilmente cosas avanzadas.
  • R no es difícil para programadores experimentados.

Pitón

  • El enfoque de Python en la legibilidad y la simplicidad hace que su curva de aprendizaje sea relativamente baja y gradual.
  • Python se considera un buen lenguaje para los programadores principiantes.

Imarticus ayuda a los aspirantes como usted a actualizarse y comenzar una carrera en ciencia de datos. Proyectos extensos, estudios de casos y tutoría son algunos de los aspectos más destacados de nuestros cursos, ya que creemos en ” Aprender haciendo “, que nos ha ganado varios premios estimados en la industria.

Imarticus ofrece Data Science Prodegree , en colaboración con Genpact como socio de conocimiento, es uno de los cursos en línea más adecuados para usted. Este curso lo ayudará a comprender en profundidad el análisis de datos y las estadísticas, junto con las perspectivas comerciales y las prácticas de vanguardia que utilizan SAS, R, Python, Hive, Spark y Tableau.

Visite el sitio web de Imarticus ( http://imarticus.org/?id=Website …) para comprender los cursos que ofrecemos o visite nuestro centro con sede en Mumbai, Pune, Delhi, Coimbatore y Chennai.

Podemos comenzar a llevarte al camino correcto este 2018.

Gracias..:)

Aquí hay algunas diferencias y su uso sobre R y Python, que yo sepa.

  • R está hecho especialmente para la ciencia / análisis de datos.
  • Python se usa en muchos campos, por ejemplo, python se puede usar para aprendizaje automático / ciencia de datos / minería de datos, desarrollo web, así como desarrollo de juegos, etc.
  • Hay muchas bibliotecas disponibles para el aprendizaje automático en Python que pueden implementar Svm, árbol de decisión, bosque aleatorio, K-NN, etc. insertando 2-3 líneas de código en su programa.
  • La mejor parte de Python es que se puede aprender muy fácilmente, es como si estuvieras aprendiendo inglés: D.

En resumen, Python es un superconjunto de R ya que Python se puede usar en muchos campos junto con el aprendizaje automático / ciencia de datos y es muy fácil de aprender.

Por lo tanto, te sugiero que sigas adelante con Python, ¡buena suerte!

Un descargo de responsabilidad que he mencionado antes es que Python es mi lenguaje de programación favorito y R es el lenguaje que uso casi exclusivamente hoy en día.

Depende de la industria e incluso del país y el continente. Mi sensación general es que Python es más fuerte en los EE. UU. Y R es más fuerte en Europa, pero no tengo datos para respaldar esto. Sé de compañías que usan una de la otra exclusivamente y otras que usan lo que sea que haga cada trabajo.

En mi opinión, deberías aprender ambos y probablemente lo harás en algún momento, además de algunos otros idiomas.

Entonces, la pregunta principal es con cuál deberías comenzar, supongo. En mi opinión, deberías comenzar con Python. La razón por la que aconsejo a Python es porque usted dice claramente el aprendizaje automático. Hay tareas en las que Python es más avanzado, como NLP. Además, SciKit de Python es una gran lib estándar para comenzar a trabajar.

Sin embargo, si hubieras mencionado otras tareas, probablemente recomendaría a R.

Python es bueno porque obtendrá recursos para él fácilmente. Cuando comencé a usar R en ese momento, los recursos no eran suficientes y tampoco eran muy buenos. Pero este no es el caso con Python. Elegí R porque quería usar el brillo para construir una interfaz de usuario rápidamente para mis análisis. De lo contrario, habría usado Python.

Alguna diferencia importante b / w a considerar cuando elige R o Python sobre el otro:

Aprendizaje automático: tiene 2 fases, una es la construcción de modelos y otra es la fase de predicción. Por lo general, la construcción de modelos se realiza como proceso por lotes y las percepciones se realizan en tiempo real. El proceso de construcción de modelos es un proceso intensivo de cómputo, mientras que la predicción ocurre en un santiamén. Por lo tanto, el rendimiento del algoritmo que usa el lenguaje Python o R no lo afecta.

Bibliotecas: Ambas tienen bibliotecas enormes y confiables. R tiene alrededor de 5000 bibliotecas que atienden dominios mant y Python tiene bibliotecas increíbles como numpy, pandas, geopy, opencv-python, jupyter y muchas más.

Desarrollo: Ambos idiomas son idiomas interpretados. Muchos dicen que Python es fácil de aprender porque es casi como leer inglés. Mientras que R requiere un esfuerzo de estudio inicial. Pero ambos idiomas tienen buenos IDEs (Spyder, Atom para python y Rstudio para R).

Velocidad: en términos de velocidad, el lenguaje R es un gran cálculo rápido porque está escrito en C, lo que lo hace increíblemente rápido. Pero, Python es un lenguaje de alto nivel y es relativamente lento.

Visualización: en ciencia de datos, tendemos a trazar datos para mostrar patrones a los usuarios. Entonces, la visualización se convierte en un área importante en la elección del software R que realmente mata a Python a este respecto.

Entonces ambos idiomas son igualmente buenos. Dependiendo de su dominio y el lugar donde trabaje, puede elegir cualquiera de estos dos idiomas (R o Python). El usuario de negocios (análisis de marketing y análisis minorista) generalmente utiliza el lenguaje de programación estadística (R) debido a su visualización.

Dependiendo de su dominio y el lugar donde trabaje, debe elegir inteligentemente el idioma correcto. El mundo de la tecnología generalmente prefiere usar un solo idioma. Los usuarios comerciales (análisis de marketing, análisis minorista) generalmente utilizan lenguajes de programación estadística como R, ya que con frecuencia realizan prototipos rápidos y crean visualizaciones (que se hace más rápido en R que en Python).

Aprendizaje automático con R y Python

R es específico para Machine Learning (Data Analytic) mientras que Python es un lenguaje de programación de propósito general. Si conoce las secuencias de comandos en Python, puede cambiar fácilmente a cualquier lenguaje basado en secuencias de comandos. Entonces, si invierte en Python, aprender a trabajar en R no será tan difícil.

Mi recomendación se adhiere a Python (si es de fondo CS) para fines de aprendizaje, ya que tiene mucho más uso.

Para Machine Learning, te sugiero que elijas R. Ya que tiene muchas bibliotecas de implementaciones de machine learning disponibles gratuitamente. Y también la mayoría de los grandes gigantes de TI están buscando expertos en R.

Incluso trabajé un poco usando R en mi empresa y confía en mí, es muy útil y fácil de usar. Como eres de antecedentes matemáticos, sería un punto a favor para que aprendas.

Python es fácil de aprender para todo, pero se vuelve lento cuando se trata de un análisis de datos de gran tamaño.

En el caso de R, funciona bien para el análisis de datos.

Ambos son buenos para el aprendizaje automático.

Si desea que su programación se use en otro lugar que no sea el análisis, vaya a Python, R es excelente para el aprendizaje automático. Recomiendo R si eres nuevo en ambos.

Si está interesado en aprender Machine Learning, Python sería el mejor lenguaje de programación para ello.

More Interesting

¿Cuándo usan los combatientes la ametralladora / cañón y cuándo usan misiles en el combate aire-aire?

¿Es posible detectar una estructura de acordes en una canción usando el aprendizaje profundo? Si es así, ¿cómo?

¿Por qué no utilizamos la regresión logística para grandes conjuntos de datos de características?

¿En qué casos las redes convolucionales no son una buena opción para la clasificación de imágenes?

Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?

¿Cuáles son las revistas científicas mejor calificadas para Machine Learning / Data Science?

¿Existe algún modelo de aprendizaje profundo o algún otro método que ingrese como una colección de documentos y pueda predecir la probabilidad de un nuevo documento?

Cómo entrenar a una CNN con datos insuficientes y no tan buenos

¿Es razonable excluir valores atípicos en su conjunto de datos de entrenamiento para su clasificador?

Cómo calcular la cantidad óptima de datos de entrenamiento para un pronóstico de series de tiempo usando Python

¿Cuál es una buena manera de entender la pérdida de Minkowski con una configuración diferente?

¿Qué conocimiento se requiere para usar bibliotecas de aprendizaje automático pero no implementarlas?

¿Cómo funciona la selección de características bayesianas?

¿Cuál es la mejor herramienta de aprendizaje automático para Mac OS?

¿Cuáles son las nuevas modificaciones en las redes neuronales recurrentes cuando se considera el aprendizaje profundo?