¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

Depende. Por ejemplo, en PixLab, donde trabajo actualmente, utilizamos modelos de aprendizaje profundo y algoritmos estándar (no de aprendizaje profundo) para nuestro servicio de análisis de medios (imagen, video, texto). Aquí hay una descripción general de la tecnología que utilizamos:

Los modelos de redes neuronales profundas generados básicamente con Caffe se utilizan para el punto final de la API de detección de contenido NSFW.
Red de confrontación generativa (GAN) utilizada para los puntos finales de API de generación de Captcha de cara, paisaje.
Los árboles de decisión, CNN, LSTM se utilizan para los puntos finales API de detección de rostros (detección de rostros), reconocimiento óptico de caracteres (ocr) y etiquetado de imágenes (tagimg).
Se utilizan muchos algoritmos no profundos en diversas etapas, como los extractores de funciones SIFT & SURF , LBP , BRISK , FREAK , ORB , pirámide de imágenes , etc. Eche un vistazo a esta publicación de blog para obtener una descripción técnica general de cómo se utilizan todos estos algoritmos juntos.

Espero que esto ayude,

Aprendizaje automáticoAprendizaje profundoReconocimiento de imágenesRedes neuronales artificiales

Related Content

¿Es posible crear un 'ser' inteligente (AI) no una 'máquina'?

¿Qué significa decir: "En la geometría de la información, el paso E y el paso M se interpretan como proyecciones bajo dos conexiones afines"?

¿Qué es exactamente el sobreajuste y por qué preferimos modelos que no están sobreajustados incluso cuando los resultados son mejores?

¿Es posible generar datos de expresión genética artificial? Las imágenes a veces se pueden perturbar para aumentar el tamaño de las muestras con fines de aprendizaje automático.

¿Cuáles podrían ser las características posibles para detectar fraude en transacciones en cajeros automáticos?

¿Cómo afectarán los avances en inteligencia artificial a la industria de los videojuegos?

La tecnología cambia constantemente y la necesidad de empleos. Un sitio dice que la base de datos tiene una perspectiva del 30%, otro dice un 8%. ¿Cómo se asegura alguien de terminar la escuela para obtener el título adecuado? ¿Los grados no están cambiando en las escuelas para los trabajos futuros?

More Interesting

¿Por qué la distribución previa no tiene mucho impacto en la distribución posterior cuando tenemos muchos datos?

¿Tiene sentido emplear Bayes ingenuos multinomiales con n-gramos? Pregunto porque supone que cada posición está ocupada por un término, por lo que los n-gramos no parecen encajar naturalmente en el modelo.

¿Cuáles son las tendencias e investigaciones actuales relacionadas con la red neuronal profunda en los sistemas inteligentes de transporte?

¿Cuáles son algunos talleres sobre aprendizaje a gran escala?

Cómo identificar la ubicación de cualquier mensaje de texto usando ML o NLP

¿Existe una lista de conferencias de minería de datos / aprendizaje automático organizadas en los Estados Unidos?

¿Cuáles son los algoritmos / documentos de última generación sobre clasificación y recuperación de imágenes?

¿Vale la pena adquirir un conocimiento profundo tanto del aprendizaje automático como de la biología? ¿Debo concentrarme?

¿Cuál es el mejor paquete R para predecir la causalidad entre dos flujos de datos de series temporales?

¿Qué significa el aprendizaje de características en Machine Learning?

¿Qué hace la diferencia entre un algoritmo normal y un algoritmo de aprendizaje automático?

¿Puede el aprendizaje automático ayudarnos a comprender el cerebro humano?

¿Cómo se compara el paquete de aprendizaje profundo Mozi con Caffe o Torch7?

Cómo construir la matriz del núcleo para un polinomio de grado finito

¿Qué es un perceptrón?

Web Analytics