Felicitaciones por hacer una pregunta que involucra la comparación de bibliotecas de aprendizaje profundo que no solo se reduce al gusto personal o detalles incidentales. Tensorflow es la biblioteca que usaría para probar nuevos diseños, y hay algunas buenas razones para esto.
Casi nada en la biblioteca (que es bastante completo) interfiere con la retropropagación automática de gradientes dada su definición de avance, incluidas las operaciones en las que una persona que no sabe razonablemente puede esperar que tenga que saltar a través de aros al hacer algo como recortar o enmascarar dinámicamente o compartir variables en varias partes del gráfico o usar variables dispersas. Esta experiencia de que “la capacidad de entrenar mi modelo está cerrada en las operaciones de flujo de tensor” fomenta los cambios de una manera diferente a la de caffe, donde hacer algo inusual significa tener que definir una nueva “capa” con su propio paso hacia atrás (que generalmente es más difícil de pensar sobre e introduce nuevas fuentes de errores). Esta conveniencia es de vital importancia porque la mayoría de las nuevas ideas son malas, por lo que es importante fracasar rápidamente. La antorcha está a medio camino en este eje; el paquete autograd proporciona una sensación de flujo de tensor siempre que esté utilizando funciones del paquete “nn”, pero el ecosistema de la antorcha está más extendido en varios paquetes. Y si bien las bibliotecas de nivel superior comparten este buen aspecto del flujo de tensor, ese nivel de abstracción hace que el intercambio de piezas sea más difícil y lo compromete a tomar más decisiones de ingeniería de otras personas.
Aquí hay una analogía a medio camino decente para un niño actual o anterior; tensorflow es como construir con legos, theano es como construir con megabloks (lo siento para todos los megabloks y theano kids), la antorcha es como jugar con bloques de madera, lo cual es divertido, pero si quieres que se junte como legos debes comprar pies adicionales para los bloques que no caben en todos los bloques, caffe es como construir con plastilina y alguien antes de que ya hayas hecho algunos buenos moldes, y {keras, lasage, sonnet} son como Star Wars lego (fabricado finalmente por lego y con suerte lo que quieres hacer es ese ala X).
- ¿Cuáles son las desventajas de usar la red neuronal residual?
- Cómo generar oraciones a partir de una imagen
- Cómo comenzar a hacer una aplicación que diga lo hermosa que eres, usando el aprendizaje automático
- ¿Puede una aplicación reemplazar a mi contador?
- ¿Qué piensa la mayoría de las personas sobre el aprendizaje automático?