¿Cuáles son algunos casos de uso interesantes de la API Cloud Vision de Google?

Google Cloud Vision API ofrece un análisis de contenido de imagen muy potente.

Y, hay características que favorecen su facilidad de uso:

  1. Detección de etiquetas: para conocer una categoría amplia de cualquier imagen.
  2. Detección de rostros: detecte rostros junto con atributos faciales: emociones
  3. Reconocimiento de texto: potente función de reconocimiento óptico de caracteres
  4. API REST integrada: las imágenes se pueden cargar en solicitudes

Esta API se puede utilizar para automatizar muchas operaciones de back-office que implican tratar con imágenes.

En Drivezy (anteriormente JustRide), hemos utilizado la API de Cloud Vision para simplificar el trabajo de validación de la licencia de conducir que anteriormente se hacía manualmente.

Antes de usar esta API, se dedicaron exactamente 10 horas hombre en el trabajo. Después de la implementación de la API de Cloud Vision, el tiempo se redujo a 2 horas.

Curiosamente, recibíamos muchas imágenes inapropiadas de usuarios que no eran licencias de conducir reales.

Después de la integración, la API de Cloud Vision rechazaría automáticamente tales imágenes sin ninguna intervención manual.

Así es como se ve un correo electrónico de rechazo automático típico:

La API no solo detecta imágenes inapropiadas, sino que también detecta el número de licencia, la fecha de vencimiento y la fecha de nacimiento del conductor. Estos se introducen automáticamente en nuestra base de datos y, por lo tanto, la mayor parte del trabajo administrativo se vuelve muy simple.

Si está interesado en aprender más, puede leer aquí – Cloud Vision API – ¿Cómo nos volvimos 80% más eficientes?

Cloud vision API es una herramienta eficaz de análisis de imágenes desarrollada para cambiar la forma en que las aplicaciones perciben y entienden las imágenes. Esto funciona en la misma lógica de búsqueda de imágenes en Google Photos que puede identificar imágenes de alimentos, lugares, flores, etc. Según Google, se ha actualizado para discernir muchos objetos dependiendo de su color, tamaño y otros parámetros.

Ahora los desarrolladores están equipados con la provisión para comprender el contenido de la imagen mediante modelos de aprendizaje automático efectivos en una API REST fácil de usar. Puede categorizar la imagen separándola como Perro, London Bridge, Michael Jordan y también puede leer el texto de la imagen para determinar su sentimiento. Esto, en un futuro próximo, ofrecerá alcance a muchos dominios de negocios como Moda, Bienes Raíces y Alimentos que dependen de la comunicación visual.

Este enlace también podría ayudar. Ofrece una visión completa de cómo va a funcionar Cloud Vision API Cloud Vision API: ¿cómo va a transformar el reconocimiento visual?

La API de Google Cloud Vision tiene la siguiente funcionalidad:

  • Análisis de sentimiento de imagen (detectar emoción humana): puede haber una aplicación de fotografía móvil, por ejemplo, que después de hacer una foto grupal la eliminará automáticamente si las personas no están sonriendo.
  • Reconocimiento de texto (extracción): hace una foto con su teléfono móvil de algún producto alimenticio en la tienda, extrae texto y detecta, por ejemplo, si hay algún ingrediente al que es alérgico según las palabras clave
  • Reconozca el contenido de la imagen: tiene un sitio web donde el usuario puede cargar imágenes y no quiere asegurarse de que solo se puede cargar cierto tipo de imagen (tiene un sitio web sobre flores y desea permitir que los usuarios carguen imágenes de sus flores) y nada más … API analizará el contenido de la imagen y mostrará la imagen en el sitio web o la eliminará)
  • Detección de contenido inapropiado: similar al punto anterior, automáticamente no permite a los usuarios cargar imágenes con contenido inapropiado.

Muchos sitios de redes sociales como Facebook y Google+ tienen una colección de imágenes muy saludable, que puede cubrir casi imágenes de probablemente todas las personas en la faz de la Tierra. Las imágenes en estas redes sociales pueden ayudar a localizar a muchos niños perdidos que pueden haber sido capturados accidentalmente en la cámara de otra persona.

Sé que esto puede parecer una idea descabellada, pero podría ayudar a muchos niños y a sus padres.

Hay muchos sitios que proporcionan una base de datos de niños perdidos o ranaway como: –

Centro Nacional para Niños Desaparecidos India

Centro Nacional para Niños Desaparecidos y Explotados


Hashtag sus imágenes para Facebook e Instagram . Mejores Hashtags, más me gusta. Más alcance de tus fotos a tu audiencia.

Muestra

Aquí está la demostración de mi implementación.

Hola, la característica más interesante que encuentro en la API es su capacidad para identificar emociones en una imagen (también compartiendo un breve video clip de 10 minutos que lo demuestra), muy similar a la API Cloud Video Intelligence de Google.

More Interesting

¿Cuál es su opinión sobre Enterprise Computing on Cloud, minimizando los datos y las aplicaciones locales?

¿Qué es Cloud y Windows Azure? ¿Es seguro ejecutar aplicaciones en la nube?

¿Por qué debería uno elegir Hosted Elasticsearch cuando en su lugar pueden alojar fácilmente el suyo en AWS?

Dada la tendencia en informática en los últimos 20 años, ¿cuáles son las predicciones para el futuro de la informática?

¿Hay características o funciones que todas las capas de orquestación en la nube simplemente no tienen, pero sería genial tener?

¿La computación en la nube y la virtualización son difíciles o fáciles?

¿Cuál es la mejor y más simple forma de configurar una copia de seguridad en la nube de una oficina pequeña?

¿Cuáles son las ventajas / desventajas de la computación paralela en la nube, la red y el clúster?

¿Dónde están las mejores clases de computación en la nube en Mumbai?

¿Qué tan grande es el equipo que desarrolló y ahora mantiene Microsoft Azure y qué tan difícil es el día a día?

¿Cómo reemplazan los proveedores de servicios en la nube el disco duro?

¿Es necesario tener mi propio centro de datos para un proveedor de servicios gestionados en la nube? ¿Cuál es el proveedor de servicios más reconocido, si lo hay?

¿Qué campo / tecnología es bueno para mí, el desarrollo web, la nube de AWS o DevOps?

¿Qué tecnología específica de pila y proveedor de nube usarías para un inicio web típico y por qué?

¿Cuáles son los casos prácticos de aplicación / uso de map reduce / hadoop en la nube o en un entorno distribuido?