Hola vikas ranga
El primer paso del proceso, para ambas tareas, sería detectar rostros y placas en sus imágenes.
Tanto la detección de rostros como el OCR se pueden lograr con la API de Google Vision (todavía en vista previa limitada). Aquí demostré cómo podría usarse y en qué escenarios: API de Google Vision: Análisis de imagen como servicio.
- ¿Por qué es importante la eliminación de variables en los modelos gráficos probabilísticos?
- ¿Qué es mejor para la dirección de investigación de visión por computadora, redes neuronales o modelos gráficos probabilísticos?
- Cómo comenzar a aprender ciencia de datos y convertirse en un maestro en ello
- ¿Fallarán todos los modelos de aprendizaje automático en este conjunto de datos?
- ¿Hay orden entre las características de las incrustaciones de palabras?
Por supuesto, no todos los textos extraídos de la imagen serán una placa de matrícula, por lo que deberá buscar patrones en el texto extraído. Una técnica alternativa sería la detección de objetos reales, que es más eficiente y precisa, pero también más compleja.
El segundo paso sería desenfocar un área determinada de la imagen, una vez que haya identificado dónde se encuentran las caras o las licencias. Puede implementar esto mediante simples bibliotecas de procesamiento de imágenes, como OpenCV (OpenCV | OpenCV). Si está familiarizado con Python, aquí hay un tutorial útil sobre el suavizado de imágenes (por ejemplo, el desenfoque) con Python y OpenCV: suavizado de imágenes.
Es posible que desee implementar este proceso en un entorno de nube que le brinde algunas funcionalidades de canalización, como AWS Lambda. Puede definir una función Lambda para cada paso (detección de rostros, detección de licencia y desenfoque) y organizarlos en pasos secuenciales (es decir, puede haber ambos rostros y placas en la misma imagen), eventualmente accediendo a cada función de Lambda a través de Amazon API Gateway.
Tenga en cuenta que cada función Lambda tiene un tiempo de ejecución máximo, por lo que deberá optimizar las llamadas y el procesamiento de la API. Además, necesitaría generar un entorno Lambda adecuado para usar OpenCV, aquí hay una buena lectura: https://markn.ca/2015/10/python-…