¿Qué tan importante es el lenguaje de programación R hoy en día? ¿Debo continuar tomando un curso que enseñe el aprendizaje automático a través de la programación R, o ir al curso convencional de aprendizaje automático de Stanford?

Si desea una introducción al mundo del aprendizaje automático y no tiene ningún conocimiento del campo, le sugiero que tome el curso ML de Andrew Ng (Stanford) y luego repase la programación de R.

Comprender los conceptos del aprendizaje automático es importante antes de aplicarlos en cualquier idioma. El curso de Machine Learning en Coursera cubre un terreno decente en diferentes etapas de la tubería de ML:

  • Selección de características: elegir características apropiadas para un modelo estadístico.
  • Regularización: explica la regresión de Ridge para penalizar los coeficientes.
  • Reducción de la dimensionalidad: la matemática detrás del análisis de componentes principales, valores propios, vectores propios.
  • Equilibrio de sesgo-varianza: cómo el aumento en la complejidad del modelo puede conducir a un problema de alta varianza.
  • Medidas de rendimiento: precisión simple, precisión, recuperación, medida [matemática] F _ {\ beta} [/ matemática]
  • Redes neuronales: explica las matemáticas detrás de la propagación hacia atrás para estimar pesos y sesgos en una red neuronal artificial típica.
  • Modelado estadístico: regresión lineal, regresión múltiple, regresión logística y máquinas de vectores de soporte

Todo se enseña usando Octave (o MATLAB) debido a las habilidades de manipulación de la matriz del lenguaje.

No obstante, R proporciona excelentes herramientas para la visualización de datos y un revestimiento para ajustar modelos estadísticos. Python utiliza el concepto de marcos de datos de R para almacenar y manipular datos en la biblioteca de pandas . Creo que R es conveniente para trazar algunos gráficos rápidos, comprender la distribución de datos y resumir los puntos de datos en general.

A pesar de que R y MATLAB tienen sus ventajas, uso predominantemente python para la programación de la ciencia de datos porque la base del código está bien documentada para bibliotecas oscuras. Explico más sobre esto en la respuesta de Ajay Halthor a ¿Por qué los científicos de datos prefieren Python? Compruébelo usted mismo si tiene tiempo.

Aunque sugiero el curso de Stanford, honestamente no puedes equivocarte de ninguna manera siempre y cuando te concentres en los fundamentos del aprendizaje automático antes de intentar dominar la sintaxis del lenguaje efímero.

Hay dos preguntas allí.

¿Qué tan importante es R hoy en día?

Casi todas las organizaciones importantes usan R. Muchas universidades usan R. Google no solo usa R sino que escribió estándares para el lenguaje que en general son ampliamente aceptados. Microsoft compra Revolution Analytics, una especie de versión comercial de R y servidores y servicios desarrollados.

Es muy importante

Sin embargo, esa no es la verdadera pregunta. La verdadera pregunta es “¿debería tomar este curso o ir al curso de aprendizaje automático convencional?”

Supongo que estás hablando de Andrew NG. Depende de lo que quieras hacer. Piense en ello como aprendizaje automático teórico y máquina aplicada. Si optas por lo teórico, debes hacerlo, pero eso no significa que R no sea relevante o que no lo uses en el futuro. Si opta por la parte práctica, R o Python son un buen punto de partida y, en algún momento, es probable que use ambos más otros.

Todo esto para decir que probablemente estás haciendo la pregunta equivocada. Lo que debe decidir es lo que quiere aprender y hacer y aprender las herramientas para aprender y hacerlo. No permita que los idiomas o la tecnología interfieran con sus decisiones. La tecnología y los idiomas se pueden aprender.

Como han mencionado otras respuestas, R es más un entorno estadístico que un lenguaje de programación per se.

Sin embargo, en lo que respecta a la importancia, R es y seguirá siendo un recurso indispensable para los científicos de datos. R permite al usuario realizar una amplia gama de análisis estadísticos utilizando paquetes y bibliotecas predefinidos. Si bien Python se usa a menudo para hacer esto también, Python es estrictamente hablando un lenguaje de programación. Como tal, la estructura de código requerida para realizar ciertas operaciones dentro del programa a menudo es más extensa que R.

Además, la plataforma Shiny utilizada junto con R se ha vuelto cada vez más popular al permitir el diseño de aplicaciones web interactivas que permiten que un especialista que no sea R realice análisis estadísticos con una IU más sofisticada. Esto se está volviendo cada vez más importante a medida que el lenguaje R se orienta cada vez más hacia los no especialistas que desean interactuar con el programa de una manera más simple e interactiva.

En resumen, R sigue siendo uno de los paquetes estadísticos más importantes para un científico de datos. No va a desaparecer pronto.

Hay muchas razones para aprender R:

  1. Si alguien planea implementar algoritmos de aprendizaje automático, R es uno de los mejores lenguajes adecuados que facilitarán el trabajo. Hay funciones incorporadas que completan la tarea requerida en código pequeño. puede comenzar R por el curso en línea desde https://www.coursera.org/learn/r… .
  2. ¿Quieres un trabajo genial en esta era? ¿Quieres ser un científico de datos? Aprender estadísticas Es el futuro. El economista jefe de Google, Hal Varian, dijo que el trabajo atractivo en los próximos diez años será el estadístico Enterprise Software no tiene que ser malo.
  3. ¿Estás actualizado con las tendencias actuales? Empresas líderes como NY Times, Google, Facebook, Bank of America, Pfizer, Merck están utilizando R. comience hoy R tutoriales

Feliz aprendizaje..!!!

No quiero que mi opinión parezca parcial, debido a que tengo Python como mi lenguaje de programación preferido para mis proyectos de ciencia de datos.

Pero, tengo otros amigos de Data Scientist que usan principalmente R, y todos trabajan en proyectos de producción de alto nivel sin problema. Me gustaría agregar que R es un lenguaje y un entorno para la computación estadística y los gráficos, por lo tanto, tiene una gran comunidad y potentes kits de herramientas que lo ayudarán a ser un Data Scientist exitoso.

Habiendo dicho eso, ¿por qué no aprendí R ? porque Python y R tienen una larga curva de aprendizaje, y quiero dominar uno a la vez para ser más productivo. Si domina R y Python, estará por encima del promedio de los científicos de datos, por lo tanto, tendrá más oportunidades de ser contratado, ya que puede adaptarse a cualquier proyecto en desarrollo.

¿Por qué elegí Python sobre R? Python es un lenguaje de programación para programación general, que me ayuda a construir un backend de software para hacer análisis simples usando bibliotecas como; Pandas, NumPy o nacidos en el mar.

¡No abandones R por los ruidos que rodean a Python!

Creo que para su primera parte de la pregunta, hay suficientes respuestas que indican la importancia de R. Sí, R es muy importante.

Pero responderé la segunda parte de la pregunta. Espero que refiera el curso de aprendizaje automático de Andrew NG como “curso convencional de aprendizaje automático de Stanford”. Si eso es cierto, te sugiero que tomes el curso de aprendizaje automático de Andrew NG. Su área de investigación es el aprendizaje automático y el aprendizaje profundo y ha dirigido múltiples proyectos de aprendizaje de máquinas y ha enseñado aprendizaje automático durante años. Esa experiencia te ayudará a aprender mejor el aprendizaje automático. Yo diría que también es un gran maestro. Ese hombre de voz suave da una sensación de sala de clase real y el aprendizaje es genial. Tomé su curso de aprendizaje automático en Coursera hace unos años y ahora su curso de aprendizaje profundo. Yo diría que no puedo conseguir un mejor maestro que él para aprender esto en línea.

R es una herramienta muy flexible para hacer análisis matemáticos y estadísticos.

Considero a R más como un paquete estadístico como Stata, Matlab, etc. que como un lenguaje de programación per se, como python o javascript.

R tiene un objetivo declarado de facilitar a los no programadores la programación a través de su estructura, uno que aprecio mucho al ver los beneficios de la programación al realizar cálculos a mi gusto.

En resumen, pruébalo, R vale la pena.

Si tiene poca o ninguna experiencia en programación, recomendaría R o MATLAB para el análisis interactivo. También podría considerar Python, pero sería mejor si comprende algo de la programación orientada a objetos.

En mi opinión, R es más prometedor que MATLAB, que es utilizado por el curso “convencional”.

Por lo general, se usa en ciencia de datos y estadísticas más que otras herramientas (a menos que esté en Silicon Valley). Si desea aprender R y Python, probablemente sea muy comercializable con respecto a las posiciones.

R ocupa el puesto 9 por IEEE ( http://spectrum.ieee.org/static/interactive-the-top-programming-languages ). Su popularidad está creciendo constantemente y tiene una comunidad grande y estable.

Sin embargo, no es tanto un lenguaje de programación, es más una herramienta estadística. Puede hacer todo tipo de cosas en R, pero realmente su propósito principal es el análisis estadístico y la visualización de datos.

Desde mi experiencia con el aprendizaje automático, no seguiría un curso que use R para eso. R es excelente para usar el aprendizaje automático, ya que tiene muchas cosas “listas para usar”, que realmente no lo ayudarán a comprender los conceptos del aprendizaje automático.


El rápido crecimiento en big data y la aplicación de algoritmos analíticos ha creado enormes oportunidades para los científicos de datos. La investigación se realizó sobre herramientas / lenguajes utilizados entre los científicos de datos y es la siguiente


Figura 1: tomada de LAVASTORM Analytics: Analytics 2014 Industry Trends Survey (Página 21)

Pocas razones de su popularidad son: –
R es software libre de código abierto y actualmente hay alrededor de 5796 paquetes en el repositorio de paquetes CRAN.
Todos estos paquetes se prueban regularmente y están ampliamente documentados.
También tiene una vibrante comunidad de usuarios.
R es fácilmente extensible a través de paquetes.

“¿Cuáles son los mejores recursos para aprender RHadoop?”

Usando R con Hadoop
Aprovechando R en entornos Hadoop
RevolutionAnalytics / RHadoop

Es un gran lenguaje para crear prototipos, como lo es Python, pero ninguno de ellos es lo suficientemente bueno en computación. Así que supongo que solo depende de por qué estás tomando la clase. ¿Lo está tomando para aprender la ciencia de datos o para aprender los aspectos relacionados con la computación, la informática superior y los relacionados?

Bueno, R es realmente importante para la ciencia de datos. Sin embargo, personalmente no me gusta usarlo para ML. Creo que R es más apto para EDA. R para el aprendizaje profundo o para otros paquetes ML no lineales no funcionan tan bien en la plataforma R. Así que le sugiero que tome el curso de Stanford y aprenda a usar Python para algoritmos de ML

Bastante importante Hay una buena demanda de desarrolladores R y definitivamente un buen lenguaje para aprender sobre análisis exploratorio.
El único inconveniente es que R no escala. No puede manejar grandes conjuntos de datos de manera eficiente.

Si eres un analista, R siempre hace tu vida más fácil. Es muy importante aprender y procesar con R.

Si tienes tiempo para hacer R y Python, entonces estarás bastante listo.

Comience con un curso de mooc en línea y vea qué idioma se adapta mejor a sus necesidades.

R es la herramienta que más te gustaría si estás en ciencia de datos. Período