¿Cómo se compara el paquete de aprendizaje profundo Mozi con Caffe o Torch7?

No he probado Mozi (todavía). De la documentación en Github, parece que está en una etapa temprana.

Pero caffe está orientado principalmente a redes convolucionales y tareas de reconocimiento de imágenes. No contiene capas recurrentes como LSTM y GRU.

Antorcha es un marco para Lua, la mayoría de los investigadores que hacen aprendizaje profundo (especialmente en Facebook y Deep Mind) lo usan.

Si está buscando un paquete de aprendizaje profundo que use python, le recomendaría que consulte Keras:
http://keras.io

Desde su página de inicio:
“Use Keras si necesita una biblioteca de aprendizaje profundo que:

-Permite crear prototipos de manera fácil y rápida (a través de modularidad total, minimalismo y extensibilidad).
-Soporta redes convolucionales y redes recurrentes, así como combinaciones de las dos.
-Soporta esquemas de conectividad arbitrarios (incluyendo entrenamiento de múltiples entradas y múltiples salidas).
-se ejecuta sin problemas en CPU y GPU “.