Si su pregunta puede reformularse “¿cuáles son ejemplos de implementaciones distribuidas de aprendizaje automático?” entonces debería echar un vistazo a Apache Mahout que presenta una implementación muy escalable de SVD (además de un clúster hadoop que usa el paradigma MapReduce). Esto normalmente se puede usar para reducir la dimensionalidad antes de los algoritmos de clasificación, para el análisis semántico latente (piense en la “indexación” semántica de documentos de texto) o para construir un sistema de recomendación para el filtrado colaborativo (piense en las recomendaciones de productos de Amazon, por ejemplo).
También John Langford de Yahoo! La investigación tiene una implementación de un clasificador lineal regularizado de múltiples núcleos y nodos escalable llamado votepal wabbit que da buenos resultados en el problema de clasificación de correo electrónico no deseado / no deseado. Su enfoque es la fragmentación de características, ver, por ejemplo, http://www.stanford.edu/group/mm…
Otro uso de la computación distribuida para el aprendizaje automático es ejecutar múltiples versiones del mismo problema con varios valores de hiperparamaters usando validación cruzada (esto a menudo se llama búsqueda de cuadrícula): la implementación distribuida es trivial ya que este es un problema típico vergonzosamente paralelo [1] .
- ¿Es el modelo de análisis factorial una versión multivariada del modelo de mezcla gaussiana?
- ¿Qué intentos hay para crear redes neuronales más similares al cerebro biológico?
- ¿Deberíamos comenzar con Tensorflow, Keras o Sonnet para desarrollar un sistema de predicción de datos de series temporales? ¿Debemos usar solo lenguajes basados en Python?
- MLconf 2015 Seattle: ¿Cuándo uso la normalización de varianza media / unidad cero frente a la normalización de unidad L1 / L2?
- ¿Cuáles son las ventajas y desventajas de utilizar PMML como formato de intercambio para modelos de análisis predictivo?
Finalmente, el cómputo evolutivo también es apto para implementaciones distribuidas escalables usando el modelo de isla, por ejemplo [2]. Esto es especialmente útil para la optimización multimodal multiobjetivo donde desea encontrar el frente óptimo de Pareto de una familia de funciones altamente no lineales. Esto ocurre típicamente en problemas de ingeniería mecánica (por ejemplo, costo versus robustez versus desempeño) o problemas de ingeniería financiera (riesgo versus rendimiento versus impacto en el mercado de estrategias de negociación parametrizadas).
[1] http://en.wikipedia.org/wiki/Emb…
[2] http://scholar.google.com/schola…