Contestaré tu pregunta, pero primero necesito contarte acerca de cómo Google construye un cerebro humano artificial que busca gatos.
La búsqueda de imágenes es un sistema muy complicado y, dado el secreto de Google, es imposible saber realmente qué están haciendo detrás de escena. Sin embargo, la búsqueda de imágenes utiliza algunas técnicas realmente avanzadas, la más interesante parece haber comenzado con los gatos.
El sistema, conocido como visión por computadora, fue adquirido por Google junto con su empresa matriz DNNresearch, una nueva empresa del profesor Geoffrey Hinton y dos estudiantes de posgrado en la Universidad de Toronto.
- ¿Está sesgado el algoritmo de aleatorización del Reproductor de Windows Media?
- ¿Cuál es el algoritmo para la eliminación en un árbol B +?
- ¿Cuál es el mejor título de proyecto para la estructura de datos del sujeto y el algoritmo?
- Cómo crear un algoritmo con una hoja de cálculo
- ¿El problema de las reinas N tiene al menos una solución por cada N> 3?
¿Mencioné que usaron una red de computadoras gigante que está estructurada como un cerebro humano? Compuesto por unos 16,000 procesadores también. Luego entrenaron esta computadora para reconocer a los gatos y la soltaron en YouTube para aprender por sí mismos. Es tarea? Escanee 10 millones de imágenes para identificar si tenía gatos o no.
Después de esto, parece que se utilizó el mismo principio a una escala mucho mayor. Google se dispuso a aplicar esto a Google Drive y Google + Photos, donde ahora podría buscar una imagen por su contenido, incluso cuando no estaba etiquetada.
Sacamos investigación de vanguardia directamente de un laboratorio de investigación académica y la lanzamos, en poco más de seis meses.
– Chuck Rosenberg, equipo de búsqueda de imágenes de Google
El principio detrás de esta búsqueda era el mismo, identificar componentes dentro de la imagen y luego buscar por ella. Puede leer acerca de los detalles técnicos en la clasificación de ImageNet en papel con redes neuronales convolucionales profundas. Utiliza aprendizaje supervisado, 7 capas de peso ocultas y extractores de funciones aprendidos de los datos.
Nuestra red neuronal tiene 60 millones de parámetros de valor real y 650,000 neuronas. Se adapta demasiado. Por lo tanto, entrenamos en 224 × 224 parches extraídos aleatoriamente de imágenes de 256 × 256, y también sus reflejos horizontales.
Según Google, la función de búsqueda de fotos puede reconocer 1100 etiquetas.
Se nos ocurrió un conjunto de aproximadamente 2000 clases visuales basadas en las etiquetas más populares en Fotos de Google+ y que también parecía tener un componente visual, que un humano podía reconocer visualmente. En contraste, la competencia ImageNet tiene 1000 clases. Al igual que en ImageNet, las clases no eran cadenas de texto, sino entidades, en nuestro caso utilizamos entidades de Freebase que forman la base del Gráfico de conocimiento utilizado en la búsqueda de Google. Una entidad es una forma de identificar de manera única algo de una manera independiente del idioma. (…) Como queríamos proporcionar solo etiquetas de alta precisión, también refinamos las clases desde nuestro conjunto inicial de 2000 hasta las 1100 clases más precisas para nuestro lanzamiento.
Esto fue hace un tiempo, desde entonces, la visión por computadora ha recorrido un largo camino.
Ahora en cuanto a la cuestión de cómo funciona la búsqueda de imágenes. Bueno, parece haber principalmente dos formas.
Google busca imágenes que se parecen a la imagen de destino (es decir, que son similares pero pueden tener un tono ligeramente diferente, un poco borroso o recortado, etc.). La respuesta de Max Xu MengXiang a los Algoritmos: ¿Cuál es el algoritmo utilizado por Google Search by Image? explica cómo se puede lograr esto.
Sin embargo, la segunda parte del sistema funciona con visión artificial. Básicamente, Google busca los componentes de la imagen y descubre qué tipo de cosas contiene. Luego lo compara con otras imágenes que contienen los mismos componentes, calculando la probabilidad de obtener una coincidencia. Junto con algoritmos similares, Google finalmente puede darle el resultado.
¡Tenga la seguridad de que la visión por computadora aún no está allí!