Ya lo hizo, en un prototipo hace unos años:
Google persigue a Shazam con el nuevo Google Now ‘¿qué es esta canción?’ característica para Android
Editar: El comentarista preguntó “¿por qué no es popular”?
- ¿Por qué son tan comunes los despidos masivos en empresas tecnológicas?
- ¿Qué hace que la computadora funcione?
- ¿Cómo encuentro una pasantía en una empresa tecnológica francesa?
- ¿Qué (bloques de hardware) hace que las GPU sean buenas para el aprendizaje profundo (qué tipo de cálculo)?
- ¿Cuál es el hecho detrás del aprendizaje automático?
Porque con cada paso en el proceso del usuario de “hacer una búsqueda”, probablemente pierdas el 95% de la población:
Si, como Shazam, tiene que estar (1) en el lugar correcto, (2) en el momento correcto, para (3) capturar / cargar el audio como una solicitud, ya ha reducido el mercado objetivo a (100 % – 95%) ^ 3 == 1 en 10,000 personas. Entonces, incluso si todo el planeta Tierra lo usara, y hubiera 10B personas en la Tierra, sería un millón de personas (10B / 10K) activamente usándolo.
Un millón de personas no le interesa a una gran empresa. La única forma de obtener esos números es eliminar uno o algunos de los pasos del embudo de conversión. Por ejemplo, “Google Now” y “Siri” eliminan el paso (1), teniendo que estar en el lugar correcto, porque siempre tienes tu voz contigo.
Con los futuros dispositivos iOS y Android, probablemente habrá chips de sensores integrados (Apple ya ha seguido este camino con el chip M7 del iPhone 6) que “detectará” audio en segundo plano sin que tenga que hacer nada activamente. Esto es equivalente a eliminar el paso (2), tener que iniciar la solicitud en el momento adecuado, porque el dispositivo está escuchando todo el tiempo.
Y aunque hoy Google Now y Siri pueden estar cargando audio para analizarlo en el lado del servidor, los dispositivos futuros serán lo suficientemente potentes como para analizar el audio y “hash” en el lado del cliente; esencialmente solo enviarán una firma del audio al servidor como una solicitud, lo que hará que el paso de “carga” (3) sea tan ligero como la búsqueda de palabras clave de hoy.
Entonces, la respuesta a “por qué no es popular” es la misma respuesta a por qué transportar su computadora de escritorio no era popular en los años 90: hoy es demasiado trabajo; pero la Ley de Moore superará esas dificultades, probablemente antes de 2020.
El problema que tendremos entonces es cómo evitar que Internet escuche. Literalmente.