¿Cuál sería la mejor combinación para transformar un back-end de Ruby on Rails con características de científicos de datos?

Ruby on Rails no tiene valor para el aprendizaje automático o big data.

Te sugiero que construyas tus algoritmos de aprendizaje automático en python y ejecutes los algos de entrenamiento en lotes, y luego implementes el algoritmo de predicción directamente en redis usando lua

entonces puedes llamar ‘predecir’ desde ruby ​​como una función lua
este es el enfoque que he tomado con mi rastreador de nube

mientras uso mucho rubí como sinatra, un DSL rubí y chef para devops, la tienda nosql es redis y los algos centrales de alto rendimiento están en lua

Charles Martin

rastreador de nubes

Un patrón de diseño DSL de Ruby para computación distribuida

por ejemplo, la cola Ruby Resque ha sido reemplazada por una implementación lua de alto rendimiento llamada Qless

Del mismo modo, el núcleo de aprendizaje automático y los algos de ciencia de datos se pueden desacoplar de la infraestructura de ruby

el rastreador de la nube también podría usarse para otras cosas, como conectarse a una tienda de hadoop y extraer datos de hadoop en redis para mostrarlos desde ruby.

si necesita más detalles, comuníquese; Me encantaría venir como consultor y ayudar a organizar todo esto

No soy un experto en big data (de todos modos, no me gusta esta expresión) pero supongo que en algún momento Postgres no será adecuado para grandes cálculos. Entonces, la base de datos podría ser horneada por algo como Elasticache o incluso cosas de hadoopy (es decir, cuando tienes muchos, y quiero decir muchos, de datos).
(Pero Postgres es muy poderoso, antes de cambiar las herramientas tendrías que aprender a mejorar cómo lo usas).

Además, las herramientas de visualización son importantes. No tengo ningún nombre para dar, pero tal vez eso pueda ser el comienzo de una discusión.

More Interesting

¿Cómo describiría la diferencia entre la gestión de información / datos y el análisis de datos?

¿Qué paquete estadístico debo usar para el análisis de datos, R o SciPy?

¿Cuál es su consejo para un par de desarrolladores que van a comenzar una pequeña empresa de análisis de datos?

¿Cuáles son las nuevas tecnologías de big data?

En términos simples, ¿qué son exactamente Apache y Hadoop, y qué importancia tienen para los grandes datos y la ciencia de datos?

Tengo una experiencia laboral de más de dos años en desarrollo, dispositivos móviles y web. Quiero hacer MS en DS. ¿Mi experiencia ayudaría en el proceso de selección?

¿Cuáles son los mejores 3 institutos de capacitación en el aula para un curso de ciencia de datos con certificación en Hyderabad?

¿Quién puede aprender big data?

¿Cuáles son los diferentes caminos para convertirse en un científico de datos en grandes empresas como Google o Facebook, si acabo de comenzar a trabajar como científico de datos en una startup de análisis de datos en India después de mi graduación en el campo de la electrónica?

¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?

¿Cómo comenzaría la optimización de negocios utilizando análisis de datos y aprendizaje automático?

¿En qué áreas del aprendizaje automático es crucial la cuantificación de la incertidumbre?

¿Cuál es el mejor curso para big data en Dehradun?

¿Qué es lo primero que haces al mirar un nuevo conjunto de datos?

¿Cuáles son los temas candentes y / o importantes en la gestión de datos en la nube y en la investigación de la computación en la nube? Recientemente comencé mis estudios de doctorado y actualmente estoy buscando un problema en la computación en la nube.