Además de TensorFlow, ¿qué otras bibliotecas de reconocimiento de imágenes son fáciles de usar y mejores?

Tensorflow (TF) es un marco de aprendizaje profundo / máquina, no una “biblioteca de reconocimiento de imágenes”. Significa que puede entrenar diferentes modelos para una amplia gama de aplicaciones, desde el reconocimiento de imágenes hasta la eliminación de ruido de señales.

Ahora necesita ser más específico sobre lo que quiere decir con “mejor”, ¿mejor en qué?

En términos de simplicidad, creo que Keras es el contenedor más simple en Tensorflow / Theano / CNTK. Por envoltorio me refiero a una biblioteca escrita encima de otra biblioteca. Sin embargo, Keras no es tan flexible y usa TF de una manera muy ineficiente, lo que resulta en cálculos más lentos de lo necesario.

Torch y pyTorch podrían ser marcos “mejores” que TF, en términos de flexibilidad y facilidad de uso.

Neon es el más rápido que existe. Al menos en términos de tiempo de ejecución de CNN. No estoy seguro de cuán intensivas son las implementaciones de memoria. Además, el enfoque de alimentación de datos es muy eficiente.

Theano es muy conocido / respetado, pero recientemente se cerró.

Caffe y Caffe2 son ampliamente utilizados en la academia, pero es promedio en todos los aspectos.

Mi opinión es que: aunque TF puede ser doloroso de aprender (realmente fue para mí), creo que la flexibilidad lo vale. Sin embargo, si lo odias absolutamente, debes ir con pytorch ya que está despegando. ¡Un factor importante en la elección del marco es el tamaño de la comunidad! Cuanto más grande sea el tamaño de la comunidad, más posibilidades tienes de obtener ayuda cuando te quedas atascado. Creo que TF, caffe y torch / pytorch tienen las comunidades más grandes.

Aprendizaje automáticoArtificialReconocimiento de imágenesReconocimiento de patronesTensorFlowVisión

Related Content

¿Los departamentos de policía en los EE. UU. Usan el aprendizaje automático para encontrar patrones en los datos delictivos?

¿Cómo construye Apple su red neuronal para el nuevo iPhone X Face ID? Los usuarios solo registran sus caras una vez cuando configuran el teléfono inicialmente, entonces, ¿cómo podría esa foto de los usuarios ser un conjunto de entrenamiento lo suficientemente grande como para entrenar la red neuronal?

¿Cómo puedo hacer que mi computadora esté disponible para Google, Quora, Facebook, para poder contribuir a sus tareas de aprendizaje automático durante el tiempo de inactividad?

¿Qué son las características y clases en ingeniería de características?

¿Cuáles son las mejores conferencias sobre aprendizaje automático para el procesamiento de imágenes médicas en 2016?

Cómo obtener una inteligencia artificial para ejecutar mi startup

¿Cómo podemos usar la red neuronal para la clasificación de texto?

La última versión de OpenCV tiene una API de aprendizaje automático y aprendizaje automático y, junto con los algoritmos de visión por computadora existentes, esta sería una excelente opción para la implementación directa de algoritmos conocidos.

Ver descripción general del aprendizaje automático

Hossein

Theano
Microsoft CNTK
Amazon MxNet
Máscara profunda de Facebook

Estos son algunos de los marcos que puede usar para entrenar / deducir el reconocimiento de imágenes.

Nota:

Los marcos mencionados anteriormente son marcos de aprendizaje profundo de propósito general.
Keras API proporciona una abstracción fácil de usar más adelante sobre el flujo de tensor y theano.
Amazon + Microsoft anunció gluon, que es similar a los resúmenes de keras CNTK y MxNet.
También puede usar la API de Clarifai, donde puede usar sus modelos o entrenar sus imágenes.

Hossein

More Interesting

Como principiante, ¿dónde y cómo aprendo a implementar algoritmos difíciles de aprendizaje profundo y otras técnicas similares en los lenguajes OOP?

¿Cuál es el beneficio de usar métodos de detección de comunidad gráfica sobre los enfoques de agrupación de datos y aprendizaje automático?

¿Qué conjunto de datos público está disponible para hacer reconocimiento facial?

¿Puede cualquier máquina interpretar y actuar sobre las respuestas que da Watson en lenguaje humano?

¿Qué es exactamente la monitorización neuronal remota?

¿Cómo funciona el aprendizaje automático en el comercio algorítmico (finanzas)?

¿Cuáles son las implicaciones de privacidad del reconocimiento facial DeepFace de Facebook?

¿Cuáles son los pros y los contras de estos tres modelos de secuencia: modelo MaxEnt Markov, campos aleatorios condicionales y redes neuronales recurrentes?

¿Qué valor cree que tiene la selección de funciones en el aprendizaje automático? ¿Cuál crees que mejora más la precisión, la selección de características o la ingeniería de características?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Cómo se glorifican los métodos del kernel en la coincidencia de plantillas?

¿Por qué hay una compensación entre exploración y explotación en el aprendizaje por refuerzo?

¿Por qué querríamos intentar aprender una base demasiado completa en codificación dispersa?

¿Cuál es la relación entre el aprendizaje automático y la minería de datos?

¿Se mejorará la mayor ganancia en el reconocimiento de objetos en los algoritmos de representación y aprendizaje, en lugar de modelos simples y datos más grandes?

Web Analytics