¿Por qué Google no introduce la búsqueda de audio?

Ya lo hizo, en un prototipo hace unos años:

Google persigue a Shazam con el nuevo Google Now ‘¿qué es esta canción?’ característica para Android

Editar: El comentarista preguntó “¿por qué no es popular”?

Porque con cada paso en el proceso del usuario de “hacer una búsqueda”, probablemente pierdas el 95% de la población:

Si, como Shazam, tiene que estar (1) en el lugar correcto, (2) en el momento correcto, para (3) capturar / cargar el audio como una solicitud, ya ha reducido el mercado objetivo a (100 % – 95%) ^ 3 == 1 en 10,000 personas. Entonces, incluso si todo el planeta Tierra lo usara, y hubiera 10B personas en la Tierra, sería un millón de personas (10B / 10K) activamente usándolo.

Un millón de personas no le interesa a una gran empresa. La única forma de obtener esos números es eliminar uno o algunos de los pasos del embudo de conversión. Por ejemplo, “Google Now” y “Siri” eliminan el paso (1), teniendo que estar en el lugar correcto, porque siempre tienes tu voz contigo.

Con los futuros dispositivos iOS y Android, probablemente habrá chips de sensores integrados (Apple ya ha seguido este camino con el chip M7 del iPhone 6) que “detectará” audio en segundo plano sin que tenga que hacer nada activamente. Esto es equivalente a eliminar el paso (2), tener que iniciar la solicitud en el momento adecuado, porque el dispositivo está escuchando todo el tiempo.

Y aunque hoy Google Now y Siri pueden estar cargando audio para analizarlo en el lado del servidor, los dispositivos futuros serán lo suficientemente potentes como para analizar el audio y “hash” en el lado del cliente; esencialmente solo enviarán una firma del audio al servidor como una solicitud, lo que hará que el paso de “carga” (3) sea tan ligero como la búsqueda de palabras clave de hoy.

Entonces, la respuesta a “por qué no es popular” es la misma respuesta a por qué transportar su computadora de escritorio no era popular en los años 90: hoy es demasiado trabajo; pero la Ley de Moore superará esas dificultades, probablemente antes de 2020.

El problema que tendremos entonces es cómo evitar que Internet escuche. Literalmente.

Ya tiene esa opción.

Puedes buscar cualquier canción en la red usando Shazam. Simplemente arrastre y suelte el archivo o puede grabarlo usando esa aplicación y le ayudará a encontrar la canción usando las letras en Internet.

Además, si está utilizando Android, entonces tiene una función llamada Google talk. Es lo mismo que el motor de búsqueda y aquí, en lugar de escribir, dice lo que desea buscar y listo.

Gracias por el A2A. No tengo suficiente experiencia para responder esto, pero supongo que es más complicado. Si piensa en términos de búsqueda de música, es decir, carga un audio y obtiene el nombre de la canción, ya tiene shazam. Google Play Music puede identificar canciones y, si está disponible en Google Play Store, le dará un enlace para comprar esa canción. Para audios que no sean álbumes de música, como el discurso de personas famosas, sería difícil buscar con una parte de un clip de audio y encontrarlo original. El ruido jugaría un papel importante. Además, encontrar una imagen similar es más simple que encontrar audios similares. Espero que esto ayude.

En realidad, ya tienen esta función en la aplicación ‘Google Now’. Puede escuchar música e identificar la canción como Shazam. Amin Ariana ya ha mencionado esto en su respuesta.

Pero introducir la búsqueda de audio es la idea tonta y peligrosa. Google tendrá que almacenar todos los archivos de audio en la web en sus servidores para que coincidan con el audio que estamos dando.