¿Por qué Udacity se enfoca en Python para el análisis de datos y el aprendizaje automático en lugar de R?

No sé exactamente por qué Udacity se enfoca más en Python que R, pero tengo el presentimiento de por qué es eso. Así que tenga en cuenta que la gente de Udacity podría reírse mucho cuando vean mi respuesta y reenviarla internamente dentro de un correo electrónico titulado “¡LOL, este tipo está loco!”

Las poblaciones R y Python parecen estar divididas de la siguiente manera:

  • Los usuarios de R a menudo no tienen experiencia previa en programación o la programación no es su habilidad principal. A menudo son académicos, estadísticos, investigadores, etc.
  • Los usuarios de Python a menudo tienen experiencia en programación y la programación es una de sus habilidades principales. Tienen títulos de CS, trabajan en empresas tecnológicas, etc.

Sebastian Thrun, uno de los fundadores y probablemente el más conocido de ellos, es un ex vicepresidente de Google y profesor de CS en Stanford. Udacity evolucionó en torno a la tecnología, la programación y la informática y, para ser sincero, se destacan.

Si observa la competencia de Udacity, verá que los más fuertes tienen antecedentes en investigación y estadísticas, a saber, la Especialización DS de Coursera y el StatLearning de Stanford. Ambos grandes MOOCs que usan R.

Udacity se está centrando en lo que mejor saben: conocimiento basado en CS. Su Curso de Introducción al Aprendizaje Automático (¡con Thrun!) Establece desde el principio que Python es un lenguaje multipropósito que tiene excelentes bibliotecas de aprendizaje automático y eso es cierto. Sin embargo, Udacity no está en contra de R, por lo que sé, R se usa en algunos de sus nanogrados. Personalmente, creo que esta es una buena manera de acercarse al mundo de los datos, ya que los profesionales de los datos rara vez tienen el lujo de usar un solo lenguaje de programación.

¡Espero que esto ayude y espero no estar completamente equivocado! 🙂

Hola, soy el director del plan de estudios para el programa Nanodegree del analista de datos de Udacity. Las otras respuestas aquí lo cubren bastante bien. R es excelente para modelos estadísticos, mientras que Python es un lenguaje de programación que tiene excelentes bibliotecas de ciencia de datos. Realmente termina siendo una preferencia personal. A algunas personas les gusta R, a algunas personas les gusta Python.

Para mí, sin embargo, es que Python es un lenguaje de programación más general. Con Python puede crear sitios web (Reddit), servicios en la nube (Dropbox), juegos de computadora (Eve Online) y mucho más. También verá nuevas herramientas de análisis como TensorFlow y Spark que vienen con enlaces de Python y Python es a menudo el pegamento para los sistemas ETL. Realmente es solo la amplitud de las cosas que puedes hacer con Python lo que lo convierte en una mejor opción (en mi opinión).

Entonces, aunque soy un gran admirador de Python, soy un gran defensor de cualquiera que quiera aprender R. Espero que podamos proporcionar más contenido de R en el futuro cercano.

La razón es que el fundador y la mayoría de los maestros de Udacity están trabajando o han trabajado para empresas que usan Python para análisis de datos y operaciones de aprendizaje automático, como Google, Dropbox, Twitter, la escuela Stanford, SpaceX, etc. enseñe a los estudiantes partes de sus trabajos, todo hecho usando Python en lugar de R.

Al comenzar estas preguntas, pregunté: ¿debería aprender R, Python o ambos? todos los expertos decían que dominar uno es mejor, todos tenían mentalidad de Python y esto me motivó a aprenderlo, por lo que para mí el uso de Udacity Python fue excelente 🙂

Oye

More Interesting

Cómo mejorar sus habilidades de análisis de datos a diario

¿Cuál es la diferencia entre un trabajo de ciencia de datos que requiere el uso de software SAS y uno basado en un lenguaje científico (Python, R, Matlab, etc.)?

Recuperación de información: ¿Cuáles son algunas de las API más importantes que todo científico de datos debe conocer?

¿Qué tipo de cosas debería aprender a ser un analista de datos más reciente?

¿Cuál es el mejor instituto de formación Hadoop de big data en Noida?

¿Qué tan importante es la prueba A / B para un científico de datos que trabaja en una empresa de tecnología?

¿Qué tecnología tiene un futuro más brillante, el desarrollo de software full stack o el desarrollo de big data de Hadoop?

¿Cuáles son las herramientas más útiles para aprender sobre análisis de datos e informes?

¿Qué significa "casi todas las herramientas de software estadístico disponibles para los científicos alientan el modelado paramétrico y, por lo tanto, el diseño de experimentos basados ​​en suposiciones sobre la distribución de datos que están equivocados"?

¿Cuál es el papel de un científico de datos en Quora?

¿Cuáles son las desventajas comunes de tener un conjunto de datos dispersos al crear un modelo ML?

¿Cuáles son los preparativos iniciales para unirse a un programa de ciencia de datos para una nueva?

¿Cómo manejan los científicos de datos las tareas de aprendizaje automático con características correlacionadas?

¿Cuáles son las herramientas y tecnologías recomendadas más recientes para el análisis y visualización en tiempo real utilizando los datos de Twitter?

¿Cómo se puede usar Big Data contra nosotros?