¿Cuál es el mejor lenguaje de programación para implementar algoritmos de aprendizaje automático?

Python es ahora mi primera opción para comenzar con un problema de aprendizaje automático, numpy, pandas y scikit-learn lo convirtieron en un excelente entorno que puede usarse en conjuntos de datos de tamaño mediano, llamados en un servidor, etc.

R es más mi herramienta de análisis de datos, la uso para analizar los efectos de las variables en profundidad, hacer pruebas estadísticas, etc. Además, sigo encontrando que ggplot2 de R es mucho más cómodo para trabajar que todos los equivalentes de Python (hasta ahora he usado matplotlib, ggplot, seaborn).

Julia es la herramienta que he descargado, probado, pero todavía no soy competente. Se dice que es eficiente y tiene buenas abstracciones (además puede ser paralelo, lo que será vital en los próximos años). Sin embargo, si está trabajando como yo en una empresa tradicional en la que cambiar una pieza de una pila tecnológica requiere tiempo y esfuerzo, no lo recomendaría todavía (al menos para grandes proyectos en la fase de implementación).

Scala / Spark tiene excelentes capacidades de aprendizaje automático y es una excelente herramienta para escalar la computación hasta miles de nodos. Tiene la gran ventaja de un REPL y Jupyter Notebook para pruebas y creación de prototipos, y puede compilarse para producción.

AlgoritmosAprendiendo a programarAprendizajeAprendizaje automáticoBest of XDiseño de algoritmos deInteligencia ArtificialLenguajes de programaciónMinería de datosprogramación de computadoras

¿Por qué no es una buena idea tener el mismo tren y equipo de prueba?

¿Cómo comenzó Perl como el idioma dominante en bioinformática?

¿Cuáles son algunos proyectos geniales de aprendizaje automático que ha creado?

¿Es más fácil conseguir un trabajo de aprendizaje automático con maestros de una buena universidad que si solo eres autodidacta?

¿Cómo podemos usar el aprendizaje automático para piratear o mejorar la seguridad?

¿Cuántas clases diferentes podemos tener prácticamente dentro de un conjunto de entrenamiento, mientras usamos el algoritmo KNN?

No lo sé.

La eficiencia es sin duda una preocupación principal para muchas implementaciones, lo que implica que un lenguaje de nivel inferior es bastante importante. En todo caso, esto ha estado cambiando aún más recientemente con la programación de Cuda en GPU. Al mismo tiempo, las mejoras algorítmicas continúan dominando la implementación en términos de su valor (computacional). En general, es una decisión difícil, con muchos de los mejores sistemas implementados en C ++ pero vinculantes en lenguajes más avanzados para admitir interfaces más fáciles.

Marko Poutiainen

Si está escribiendo algoritmos personalizados, Julia llega al punto óptimo de productividad y rendimiento. Aquí hay diapositivas de una charla llamada “Implementación de algoritmos de aprendizaje automático en Julia”:

http://jamesporter.me/static/mis …

Marko Poutiainen

Use python u octave para crear prototipos rápidamente de sus ideas. Una vez que tenga algo que funcione y necesite optimizar la velocidad, probablemente quiera implementarlo en C / C ++. Si realizó un prototipo en Python, es posible que desee utilizar Cython para la implementación de C: http://docs.cython.org/src/quick …

Marko Poutiainen

Python obviamente.
Con la ayuda de scikit learn, ml.py es bastante fácil concentrarse en el algoritmo.
También hay otras bibliotecas específicas.
Pero Scikit-learn cubre la mayoría de los algoritmos.

Marko Poutiainen

“Lo mejor” tiende a ser subjetivo, pero Python es muy popular hoy en día, especialmente en combinación con scikit-learn.

Marko Poutiainen

Python sería una buena opción para comenzar con la creación rápida de prototipos. Hay muchos paquetes disponibles en Python como scikit-learn, PyML.

Marko Poutiainen

More Interesting

¿Las GPU seguirán dominando la inteligencia artificial y el aprendizaje automático, aumentando el valor de compañías como Nvidia y AMD, o los chips especializados como los de Graphcore se harán cargo?

¿Cómo soluciona un máximo A posterior el problema de sobreajuste en una estimación de máxima verosimilitud?

¿Cuál es la diferencia entre una curva ROC y una curva de recuperación de precisión? ¿Cuándo debo usar cada uno?

¿Cuál es la diferencia entre CNN y RNN?

¿Para qué sirve el aprendizaje automático o la inteligencia artificial?

¿Cuál es la pérdida latente en autoencoders variacionales?