Vemos Python o R como herramientas clave para la mayoría de las metodologías ganadoras de la competencia, mientras que casi nunca vemos soluciones ganadoras basadas en MATLAB. Estoy copiando una publicación en el foro (¿Qué herramientas usan generalmente las personas para resolver problemas?).
Pitón
- Pila de computación científica muy fragmentada pero integral
- Pandas, scikit.learn, numpy, scipy, ipython y matplotlib son mis bibliotecas de informática científica más utilizadas
- El cuaderno de IPython es una buena herramienta interactiva de análisis de datos
- Todos los beneficios de un lenguaje de programación de propósito general.
- Desafortunadamente lento si no caes en C
- Parte de la pila de computación científica todavía está atascada en Python 2.7
- Muy bueno para problemas que no vienen como una matriz de características simple, entre herramientas como pandas y nltk
- Increíble ecosistema de código abierto
R
- ¿Qué está impulsando la prisa de la industria financiera para adoptar Big Data?
- ¿Qué habilidades de análisis de datos requieren las grandes consultoras?
- Si tuviera que configurar un programa de aprendizaje de ciencias de datos de 3 meses para principiantes, ¿cuál sería el mejor programa y la línea de tiempo?
- ¿Cuál es la mejor especialización de Coursera ML / Big Data?
- ¿Cuál sería un buen problema de recomendación de Kaggle para elegir como un proyecto corto?
- Como regla general, si se considera interesante para los estadísticos, se ha implementado en R
- Bibliotecas de alta calidad con un buen enfoque en pruebas unitarias.
- Buena herramienta interactiva de análisis de datos a través de cosas como RStudio
- El lenguaje en su conjunto es lento y requiere mucha memoria
- El lenguaje en sí mismo me da ganas de sacarme los ojos
- El proceso para contribuir con las bibliotecas es innecesariamente manual y generalmente es un fastidio
Julia
- Este es uno de mis nuevos idiomas favoritos.
- Como nuevo lenguaje, no tiene mucho que ofrecer en cuanto a bibliotecas extensas
- Intenta combinar la flexibilidad y la concisión de los lenguajes dinámicos de alto nivel como MATLAB y Python con la velocidad de los lenguajes de tipo estático de bajo nivel como C
- La sintaxis es muy familiar para los usuarios de MATLAB
- A diferencia de MATLAB, los bucles son eficientes, por lo que las operaciones no necesitan ser vectorizadas donde no deberían estar
- El sistema de tipos es muy útil.
MATLAB / Octave
- Inestimable para el procesamiento de señales
- Lenguaje más simple y conciso para todo lo relacionado con operaciones matriciales.
- Funciona muy bien para cualquier cosa que simplemente se representa como una matriz de características numéricas
- Gran dolor para usar para cualquier cosa que no se represente simplemente como una matriz de características numéricas
- Falta de un buen ecosistema de código abierto
- Muy poca integración con los sistemas de producción.
- Se recomienda encarecidamente contra MATLAB debido a su naturaleza cerrada, la falta de un buen ecosistema de código abierto y la escasa integración con la mayoría de los escenarios de implementación del mundo real