¿Cuál es el mejor lenguaje de programación para un bootcamp de aprendizaje automático?

En mi opinión, hay dos opciones obvias cuando se trata de aprendizaje automático: R o Python. Si habla de bootcamp, es probable que no escriba modelos desde cero, sino que aprenda un flujo de trabajo que lo guiará a través de los problemas aplicados.

¿Qué criterio considerarías “mejor” al considerar un idioma? Si fuera pragmático, las razones más prácticas para elegir un idioma serían (en este orden):

  1. Solicitud
  2. Comunidad
  3. Utilidad

Solicitud

Python tiene la aplicación más amplia de bibliotecas de aprendizaje automático disponible con scikit-learn y otros autores de código abierto, sin embargo, R también tiene una red muy amplia de bibliotecas. Python es de propósito general, tiene muchas aplicaciones útiles más allá del aprendizaje automático. R tiene sus raíces en el análisis estadístico, y favoreció más en la academia. En cuanto al rendimiento, el modelado en desarrollo es comparable entre los dos. Python sobresale en esta categoría debido al potencial de integración del sistema de producción. Encontrará más implementaciones a gran escala que jugarán mejor con Python. Estamos hablando de bootcamps, ¿verdad? Para integraciones más serias fuera de aprender a modelar y predecir datos, Python es el ganador.

Comunidad

En The RedMonk Programming Language Rankings: enero de 2015, Python ocupa el puesto n. ° 4 (+1 del año pasado), R ocupa el puesto n. ° 15 (+2 del año pasado). Encontrarás más respuestas a problemas comunes en foros populares como Stackexchange, y más código para jugar más allá del aprendizaje automático en Github. Python tiene una comunidad más grande.

Utilidad

Esto puede parecer redundante para el primer criterio, pero considere el hecho de que Python, con el tamaño de su comunidad, está construyendo más que solo herramientas y bibliotecas para una categoría de problemas. Python es utilizado por desarrolladores web, ingenieros de datos, administradores de sistemas, monos UI, piratas informáticos, la lista es interminable. Puede programar cualquier cosa, desde IU multiplataforma, servicios web, servidores multiproceso, gestores de colas de mensajes, desarrollo de juegos y, en general, todo lo demás e implementado en sistemas de grado de producción con mayor frecuencia.

Conclusión

La razón por la cual la mayoría de las personas parecen ir a los campamentos de arranque es para aumentar su valor en un corto período de tiempo. A menos que su bootcamp tenga un requisito muy básico de que tenga que aprender R, sería más práctico aprender Python primero, luego aprender R cuando encuentre una aplicación útil para él. Las principales herramientas y flujos de trabajo que aprenderá en Python para el aprendizaje automático tienen equivalentes comparables en R. Mastering Python abre un mundo de posibilidades más amplio con aplicación, comunidad, utilidad y valor profesional dado el tiempo que invierte. En mi opinión 😉

Es python con las bibliotecas numpy y scikit-learn. Python es fácil de aprender y muchos investigadores en ML lo están usando. Es muy común ver a los equipos ganadores en Kaggle usando Python en su solución. Matlab también es fácil de usar, pero debes comprar una licencia.

More Interesting

¿Cómo es el nano grado de aprendizaje automático de Udacity en comparación con la especialización de aprendizaje automático de Coursera, cuál es mejor?

¿Por qué la mayoría de las declaraciones de investigación de aprendizaje automático suenan a mierda?

¿Qué técnicas de aprendizaje automático debo usar para estratificar y spofing?

¿Cuáles son los conjuntos de datos canónicos de aprendizaje automático utilizados como punto de referencia para demostrar un nuevo método?

¿Qué alternativas a las redes convolucionales para las tareas de aprendizaje automático de imágenes se están investigando ahora?

Cómo explicar el desempeño de un modelo predictivo a la gerencia que no conoce el aprendizaje automático

¿Cuáles son los libros de texto clásicos y de lectura obligatoria en las estadísticas?

¿Cuándo debe usarse el bosque aleatorio sobre la regresión logística para la clasificación y viceversa?

¿Auto-sklearn es realmente mejor que un clasificador único optimizado por hiperparámetro? ¿Tienes experiencia con esto?

Si su red neuronal no está aprendiendo (o no está aprendiendo mucho), ¿qué pasos toma para descubrir por qué?

¿Cuáles son algunas áreas de investigación en la intersección del aprendizaje automático y las criptomonedas?

Estoy interesado en el aprendizaje automático y la inteligencia artificial y recién comencé a aprender Python. ¿Qué otras habilidades debo tener en mi haber para tener éxito en este campo?

¿Cómo se compara Python con R para el análisis de datos y el aprendizaje automático?

¿Cuáles son algunas habilidades matemáticas altamente relevantes que se requieren si quiero comenzar a investigar en algoritmos de Machine Learning?

Cómo aprovechar al máximo el libro 'Programación de la inteligencia colectiva'