Hay muchos algoritmos de reconocimiento de imágenes por ahí. Algunos son propietarios, algunos son de código abierto. Pero generalmente difieren en la forma en que se calculan las características.
Existen métodos basados en características que detectan características como esquinas y blobs. Los vectores descriptivos se extraen alrededor del vecindario de esos puntos. Estos vectores se denominan descriptores y generalmente se indexan en una estructura de árbol para una coincidencia aproximada rápida.
Luego están los enfoques de aprendizaje automático mediante los cuales las características se aprenden de los datos de entrenamiento. Las imágenes RGB sin procesar se envían al sistema y depende de los algoritmos de aprendizaje aprender características relevantes. Un buen ejemplo de dicho sistema es una red neuronal convolucional en el aprendizaje profundo.
- El algoritmo de primer ajuste sin clasificar por problema de embalaje de la papelera se considera no solución. ¿Cuándo es útil este algoritmo?
- Necesito saber cómo describir el cálculo del PageRank de punto fijo. ¿Alguien sabe algo al respecto?
- Cómo resolver el problema de invertir la cadena dada si el tamaño de la cadena es mayor que el tamaño de mi RAM
- ¿Cuál es el algoritmo para realizar la inserción en un árbol B?
- ¿Diferencia entre algoritmo de relleno de inundación y relleno de límite en gráficos de computadora?
Hay una ventaja en los enfoques de aprendizaje automático sobre las características artesanales. Es más rápido tener un sistema de reconocimiento en funcionamiento dentro de semanas o meses cuando se utiliza el aprendizaje automático, a diferencia de la artesanía, que llevaría años.
Para la detección de rostros, el método eficiente actual todavía se basa en las características del cabello, pero no es el más preciso. Otros se basan en la detección de puntos de referencia faciales, como la nariz, los ojos y la boca. La cara se detecta positivamente si los puntos de referencia son geométricamente consistentes con una cara humana.
No estoy actualizado con la detección automática de contenido obsceno en videos. Apuesto a que el aprendizaje profundo puede funcionar lo suficientemente bien aquí. Se trata de implementar un sistema y observar cómo funciona y mejorarlo.
Espero que esto ayude.