¿Cuáles son las restricciones de R en el aprendizaje de máquina práctico / industrial?

  1. El ajuste de rendimiento en R tiene los mismos problemas que cualquier otro lenguaje que esté a varias capas de abstracción de la máquina: es difícil correlacionar los contadores de rendimiento de hardware con lo que sucede con el script. R le permite llamar al código C, pero en ese momento podría ser mejor escribir el código C directamente.
  2. El paralelismo en R está atornillado y la comunidad aún no ha convergido en una sola práctica recomendada. Acabo de pasar por mi primera experiencia con Rmpi ​​y, aunque estoy impresionado de que lo hayan hecho funcionar, solo se implementa una fracción de la API y la documentación deja mucho que desear. Tengo entendido que Rmpi ​​es la solución de memoria distribuida más utilizada. No está bien.

R tiene todas las ventajas de ser una base de código madura con un profundo grupo de desarrolladores expertos. Para las estadísticas, es el mejor en su clase, y para la visualización de datos ciertamente está en el top 3 para las cargas de trabajo en serie. Me sentiría perfectamente cómodo usándolo en sistemas de producción, siempre y cuando el rendimiento no fuera muy importante (y rara vez lo es). E incluso donde dominaba el rendimiento, todavía lo usaría como un lenguaje de creación de prototipos y validaría el código C / C ++ contra él.

Secundo la respuesta de Barrys.

R tiene algunos problemas de rendimiento como él dijo. Realmente no asusta muy bien, lo que significa que funciona de maravilla con conjuntos de datos más pequeños, pero si intenta trabajar con una tabla de datos de 10 GB, se volverá lento.