En mi opinión, hay dos opciones obvias cuando se trata de aprendizaje automático: R o Python. Si habla de bootcamp, es probable que no escriba modelos desde cero, sino que aprenda un flujo de trabajo que lo guiará a través de los problemas aplicados.
¿Qué criterio considerarías “mejor” al considerar un idioma? Si fuera pragmático, las razones más prácticas para elegir un idioma serían (en este orden):
- Solicitud
- Comunidad
- Utilidad
Solicitud
- ¿Cómo se aplica la inteligencia artificial a los problemas ambientales?
- Inferencia bayesiana: si tuviera que trazar un millar de correos electrónicos basados en "spaminess" utilizando un algoritmo simple de Naive Bayes para establecer la probabilidad de "spaminess" para el eje x, ¿cuál debería ser mi eje y?
- ¿El aprendizaje automático está reemplazando la teoría de control tradicional?
- ¿Cuáles son los ejemplos de redes neuronales profundas extremas (más de 150 capas)?
- ¿Cuáles son algunos ejemplos de inferencia?
Python tiene la aplicación más amplia de bibliotecas de aprendizaje automático disponible con scikit-learn y otros autores de código abierto, sin embargo, R también tiene una red muy amplia de bibliotecas. Python es de propósito general, tiene muchas aplicaciones útiles más allá del aprendizaje automático. R tiene sus raíces en el análisis estadístico, y favoreció más en la academia. En cuanto al rendimiento, el modelado en desarrollo es comparable entre los dos. Python sobresale en esta categoría debido al potencial de integración del sistema de producción. Encontrará más implementaciones a gran escala que jugarán mejor con Python. Estamos hablando de bootcamps, ¿verdad? Para integraciones más serias fuera de aprender a modelar y predecir datos, Python es el ganador.
Comunidad
En The RedMonk Programming Language Rankings: enero de 2015, Python ocupa el puesto n. ° 4 (+1 del año pasado), R ocupa el puesto n. ° 15 (+2 del año pasado). Encontrarás más respuestas a problemas comunes en foros populares como Stackexchange, y más código para jugar más allá del aprendizaje automático en Github. Python tiene una comunidad más grande.
Utilidad
Esto puede parecer redundante para el primer criterio, pero considere el hecho de que Python, con el tamaño de su comunidad, está construyendo más que solo herramientas y bibliotecas para una categoría de problemas. Python es utilizado por desarrolladores web, ingenieros de datos, administradores de sistemas, monos UI, piratas informáticos, la lista es interminable. Puede programar cualquier cosa, desde IU multiplataforma, servicios web, servidores multiproceso, gestores de colas de mensajes, desarrollo de juegos y, en general, todo lo demás e implementado en sistemas de grado de producción con mayor frecuencia.
Conclusión
La razón por la cual la mayoría de las personas parecen ir a los campamentos de arranque es para aumentar su valor en un corto período de tiempo. A menos que su bootcamp tenga un requisito muy básico de que tenga que aprender R, sería más práctico aprender Python primero, luego aprender R cuando encuentre una aplicación útil para él. Las principales herramientas y flujos de trabajo que aprenderá en Python para el aprendizaje automático tienen equivalentes comparables en R. Mastering Python abre un mundo de posibilidades más amplio con aplicación, comunidad, utilidad y valor profesional dado el tiempo que invierte. En mi opinión 😉