Creo que deberías usar Prediction io. Es un servidor de aprendizaje automático muy bueno y también utiliza hadoop internamente e implementa todas las cosas y encontrará todos los algoritmos y todas las guías básicas.
O bien, si conoce muy bien el aprendizaje automático, cree su propio servidor con Scikit y Pandas y Pylearn2. Puede seguir algunos tutoriales de Scikit y pandas para procesar grandes datos, análisis y clasificación, algoritmos de agrupamiento.
No sugeriré productos pagados como Google Prediction API, Azure ML y apache track como Spark, MapReduce, Mahout stack.
- ¿Cómo configuro "hMailServer" en un VPS con "Windows Web Server 2008 R2" para mi propio dominio (mydomain.com) en Namecheap (+ DNS DNS)?
- ¿Cuánto cuesta Tableau Server?
- ¿Cuáles son los pros y los contras de usar Munin?
- ¿Cuál es la mejor manera de monitorear las búsquedas generales de disco por segundo en un servidor Linux?
- Cómo construir un servidor Tor
A veces depende también del lenguaje de programación que esté utilizando. Si está utilizando Java, entonces Weka, Apache Mahout, Mallet son las mejores herramientas y puede encontrar tutoriales en
Blog sobre aprendizaje automático, estadísticas y desarrollo de software
y si estás usando python, entonces Scikit, Pandas, Pylearn2 son los mejores.
La predicción IO es la mejor para el tipo que conoce poco algoritmo de aprendizaje automático y no quiere escribir el código. Pero Scikit es el mejor para toda la predicción.
Las mejores charlas de aprendizaje automático:
Las 100 charlas de aprendizaje automático más populares en VideoLectures.Net