¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

Depende. Por ejemplo, en PixLab, donde trabajo actualmente, utilizamos modelos de aprendizaje profundo y algoritmos estándar (no de aprendizaje profundo) para nuestro servicio de análisis de medios (imagen, video, texto). Aquí hay una descripción general de la tecnología que utilizamos:

  • Los modelos de redes neuronales profundas generados básicamente con Caffe se utilizan para el punto final de la API de detección de contenido NSFW.
  • Red de confrontación generativa (GAN) utilizada para los puntos finales de API de generación de Captcha de cara, paisaje.
  • Los árboles de decisión, CNN, LSTM se utilizan para los puntos finales API de detección de rostros (detección de rostros), reconocimiento óptico de caracteres (ocr) y etiquetado de imágenes (tagimg).
  • Se utilizan muchos algoritmos no profundos en diversas etapas, como los extractores de funciones SIFT & SURF , LBP , BRISK , FREAK , ORB , pirámide de imágenes , etc. Eche un vistazo a esta publicación de blog para obtener una descripción técnica general de cómo se utilizan todos estos algoritmos juntos.

Espero que esto ayude,

More Interesting

¿Por qué la distribución previa no tiene mucho impacto en la distribución posterior cuando tenemos muchos datos?

¿Tiene sentido emplear Bayes ingenuos multinomiales con n-gramos? Pregunto porque supone que cada posición está ocupada por un término, por lo que los n-gramos no parecen encajar naturalmente en el modelo.

¿Cuáles son las tendencias e investigaciones actuales relacionadas con la red neuronal profunda en los sistemas inteligentes de transporte?

¿Cuáles son algunos talleres sobre aprendizaje a gran escala?

Cómo identificar la ubicación de cualquier mensaje de texto usando ML o NLP

¿Existe una lista de conferencias de minería de datos / aprendizaje automático organizadas en los Estados Unidos?

¿Cuáles son los algoritmos / documentos de última generación sobre clasificación y recuperación de imágenes?

¿Vale la pena adquirir un conocimiento profundo tanto del aprendizaje automático como de la biología? ¿Debo concentrarme?

¿Cuál es el mejor paquete R para predecir la causalidad entre dos flujos de datos de series temporales?

¿Qué significa el aprendizaje de características en Machine Learning?

¿Qué hace la diferencia entre un algoritmo normal y un algoritmo de aprendizaje automático?

¿Puede el aprendizaje automático ayudarnos a comprender el cerebro humano?

¿Cómo se compara el paquete de aprendizaje profundo Mozi con Caffe o Torch7?

Cómo construir la matriz del núcleo para un polinomio de grado finito

¿Qué es un perceptrón?