¿Dónde comienzo a diseñar un servidor de aprendizaje automático?

Creo que deberías usar Prediction io. Es un servidor de aprendizaje automático muy bueno y también utiliza hadoop internamente e implementa todas las cosas y encontrará todos los algoritmos y todas las guías básicas.

O bien, si conoce muy bien el aprendizaje automático, cree su propio servidor con Scikit y Pandas y Pylearn2. Puede seguir algunos tutoriales de Scikit y pandas para procesar grandes datos, análisis y clasificación, algoritmos de agrupamiento.

No sugeriré productos pagados como Google Prediction API, Azure ML y apache track como Spark, MapReduce, Mahout stack.

A veces depende también del lenguaje de programación que esté utilizando. Si está utilizando Java, entonces Weka, Apache Mahout, Mallet son las mejores herramientas y puede encontrar tutoriales en

Blog sobre aprendizaje automático, estadísticas y desarrollo de software

y si estás usando python, entonces Scikit, Pandas, Pylearn2 son los mejores.

La predicción IO es la mejor para el tipo que conoce poco algoritmo de aprendizaje automático y no quiere escribir el código. Pero Scikit es el mejor para toda la predicción.

Las mejores charlas de aprendizaje automático:

Las 100 charlas de aprendizaje automático más populares en VideoLectures.Net