Depende. Por ejemplo, en PixLab, donde trabajo actualmente, utilizamos modelos de aprendizaje profundo y algoritmos estándar (no de aprendizaje profundo) para nuestro servicio de análisis de medios (imagen, video, texto). Aquí hay una descripción general de la tecnología que utilizamos:
- Los modelos de redes neuronales profundas generados básicamente con Caffe se utilizan para el punto final de la API de detección de contenido NSFW.
- Red de confrontación generativa (GAN) utilizada para los puntos finales de API de generación de Captcha de cara, paisaje.
- Los árboles de decisión, CNN, LSTM se utilizan para los puntos finales API de detección de rostros (detección de rostros), reconocimiento óptico de caracteres (ocr) y etiquetado de imágenes (tagimg).
- Se utilizan muchos algoritmos no profundos en diversas etapas, como los extractores de funciones SIFT & SURF , LBP , BRISK , FREAK , ORB , pirámide de imágenes , etc. Eche un vistazo a esta publicación de blog para obtener una descripción técnica general de cómo se utilizan todos estos algoritmos juntos.
Espero que esto ayude,
- ¿Podría el aprendizaje automático erradicar el cáncer?
- ¿Por qué Apple no equipa sus máquinas con mejores opciones de tarjeta de video?
- ¿Qué podríamos hacer con Asimo si la computadora dentro estuviera con el poder de la caja de aprendizaje profundo Nvidia DGX-1?
- ¿Es un árbol de decisión solo un nombre elegante para una secuencia de declaraciones if-else-if-else -if-else?
- ¿Cuál es una buena forma de buscar artículos en visión artificial y aprendizaje automático?