Puede planear usar Hadoop con herramientas poderosas adicionales como Mahout que le brindan una forma directa de construir un motor de recomendaciones.
Amazon S3 sería una buena opción. Sin embargo, para sus necesidades iniciales, un buen sistema regular sería suficiente.
PHP? Diablos no. Desea que el trabajo termine antes de que el mundo termine. Puede usar Java con Hadoop Stack, Python con Hadoop o Python con Numpy / Scipy / Crab.
- ¿Me pueden ayudar a encontrar e identificar mi idea de doctorado? (¿Aprendizaje profundo y análisis de Big Data Twitter Sentiment?)
- ¿Cómo se usa LSTM para la clasificación?
- ¿Qué áreas debo conocer bien para ser un buen ingeniero de visión por computadora?
- ¿Cómo tratan SVM y ANN los valores atípicos?
- El entrenamiento de redes neuronales profundas utilizando la propagación inversa tiene el problema de un gradiente de error que desaparece y que establece un límite sobre cuántas capas se pueden entrenar efectivamente, entonces, ¿por qué no usar un algoritmo genético para entrenar redes profundas, eliminando la propagación de errores?
No necesita NoSQL ya que procesará los archivos de datos directamente.
¿Qué técnicas de aprendizaje automático? Si esta pregunta estuviera en la parte superior, ni siquiera habría comenzado a escribir esta respuesta. Sea paciente, tome un curso rápido en línea para repasar los conceptos básicos de ML. Ni siquiera puedes comenzar a trabajar sin tener una idea básica sobre la teoría.
Solr? ¿Por qué? Primero pon algo básico.
Enlaces: –
Aprendizaje automático escalable y minería de datos
scikit-learn: aprendizaje automático en Python
El proyecto Apache Cassandra
Curso de aprendizaje automático sobre aprendizaje supervisado
Coursera – Machine Learning por Andrew Ng
Aprendizaje automático en Redditt.