Cómo gestionar y desarrollar un producto de big data

Puede planear usar Hadoop con herramientas poderosas adicionales como Mahout que le brindan una forma directa de construir un motor de recomendaciones.

Amazon S3 sería una buena opción. Sin embargo, para sus necesidades iniciales, un buen sistema regular sería suficiente.

PHP? Diablos no. Desea que el trabajo termine antes de que el mundo termine. Puede usar Java con Hadoop Stack, Python con Hadoop o Python con Numpy / Scipy / Crab.

No necesita NoSQL ya que procesará los archivos de datos directamente.

¿Qué técnicas de aprendizaje automático? Si esta pregunta estuviera en la parte superior, ni siquiera habría comenzado a escribir esta respuesta. Sea paciente, tome un curso rápido en línea para repasar los conceptos básicos de ML. Ni siquiera puedes comenzar a trabajar sin tener una idea básica sobre la teoría.

Solr? ¿Por qué? Primero pon algo básico.

Enlaces: –
Aprendizaje automático escalable y minería de datos
scikit-learn: aprendizaje automático en Python
El proyecto Apache Cassandra
Curso de aprendizaje automático sobre aprendizaje supervisado
Coursera – Machine Learning por Andrew Ng
Aprendizaje automático en Redditt.

Es mejor si le preguntas esto a un chico de CS …… .. Te sugeriré que le preguntes a Yash Bajaj.

More Interesting

¿Cuántos desarrolladores necesitamos si queremos hacer uso de la API Watson de IBM?

¿Cuál es la diferencia entre aprendizaje gradual y aprendizaje de refuerzo?

¿Qué valor cree que tiene la selección de funciones en el aprendizaje automático? ¿Cuál crees que mejora más la precisión, la selección de características o la ingeniería de características?

Cómo detectar logotipos si están distorsionados

¿Qué debo hacer para construir una carrera en Machine Learning? ¿Por dónde empiezo y cuáles son mis opciones?

¿Hay alguna manera de usar Machine Learning para predecir el resultado de un lanzamiento de moneda?

Teoría de la información: ¿por qué hay una mayor probabilidad asociada con menor información?

¿Existe un modelo más efectivo que Word2vec desde 2013?

¿Debo usar un cursor o usar el paquete R directamente?

¿Cuáles son las mejores mejores bibliotecas para la clasificación? ¿Cómo se comparan entre sí?

¿Por qué querríamos intentar aprender una base demasiado completa en codificación dispersa?

¿Cuál es la diferencia entre una red neuronal y una red de codificador automático?

¿Cómo puedo usar una red neuronal de convolución (para reconocimiento facial) después del entrenamiento? Quiero darle una cara como entrada y ver la salida predicha.

¿Cuál es el mejor enfoque para medir la "calidad de las características" en una red neuronal?

¿Por qué hay tantos enfoques generativos en la clasificación de escenas, mientras que el enfoque discriminatorio es el principal en el reconocimiento / detección de objetos?