¿Con cuántas personas puede hablar Siri simultáneamente, y cómo maneja esto técnicamente?

En este momento, aplicaciones como Siri (o Alexa, Xbox, etc.) solo pueden identificar y procesar un comando a la vez. La tecnología funciona en el procesamiento del lenguaje natural (PNL) después de convertir el discurso en texto. En este momento, la tecnología busca identificar la voz principal que emite el comando y aplicar NLP en eso. Las otras voces y el sonido de fondo deben cortarse como ruido. Esto es esencial para aumentar la precisión de la comprensión del lenguaje natural (NLU) del comando.

En el futuro, se prevé que la tecnología identifique múltiples voces basadas en acento, tono, tono, etc. Y tenga la capacidad de desambiguar y comprender estos múltiples comandos. Es importante comprender que estas áreas se están investigando, desarrollando y comercializando constantemente. El reconocimiento simultáneo de comandos es una característica para un algoritmo NLP y NLU maduro.